博客
关于我
CVPR2023 Highlight | Side Adapter Network – 极致轻薄却性能强劲的开放词汇语义分割器...
阅读量:800 次
发布时间:2023-04-05

本文共 881 字,大约阅读时间需要 2 分钟。

识别并分割出任意类别的视觉元素是计算机视觉领域最具挑战性的问题之一。近期,来自华中科技大学和微软亚洲研究院的研究人员在CVPR2023 Highlight中提出了一个全新的开放语义词汇语义分割架构—Side Adapter Network(SAN)。该架构能够赋予现有的VL预训练模型(如CLIP)进行开放词汇语义分割的能力,仅需8M额外的训练参数即可在多种数据集上大幅提升性能,同时实现15帧每秒的处理速度,比SimSeg快19倍,比MaskCLIP快3倍。

SAN的核心思想是在一个冻结的CLIP模型旁引入一个新的Side Adapter Network,用于预测掩码候选(Mask Proposals)。通过引入特定的[SLS] token,SAN能够在推理阶段引导CLIP模型仅关注Mask Proposals相关的区域,从而实现对掩码候选的高效识别。这种设计不仅避免了传统方法中对VL预训练模型的微调问题,还显著提升了模型的推理速度。

SAN的主要优势体现在以下几个方面:

  • 端到端训练:SAN采用端到端训练方式,使得生成的Mask Proposals能够更好地适配CLIP模型。相较于传统的两阶段训练方式,SAN的端到端训练带来了+4.5mIoU的性能提升。

  • 无需微调CLIP模型:SAN的设计避免了对CLIP模型的微调,从而最大程度地保留了其开放词汇识别能力。实验结果表明,CLIP模型的参数微调会显著降低其开放词汇识别能力。

  • 高效推理:SAN通过引入[SLS] token实现了对所有Mask Proposals的高效识别,只需推理一次完整的CLIP模型即可完成任务,推理速度比传统方法快19倍。

  • 解耦预测:SAN将掩码预测与类别预测解耦,进一步提升了模型的分类精度。这种双头设计充分利用了CLIP模型的上下文信息,显著提高了预测性能。

  • 充分复用CLIP特征:SAN充分复用CLIP模型的特征,大幅度降低了所需的额外参数量,同时仍能获得最佳性能。

  • SAN的代码已开源,供研究人员和开发者参考。未来,SAN的研究和应用将为计算机视觉领域带来更多创新。

    转载地址:http://fxrfk.baihongyu.com/

    你可能感兴趣的文章
    Mysql中varchar类型数字排序不对踩坑记录
    查看>>
    MySQL中一条SQL语句到底是如何执行的呢?
    查看>>
    MySQL中你必须知道的10件事,1.5万字!
    查看>>
    MySQL中使用IN()查询到底走不走索引?
    查看>>
    Mysql中使用存储过程插入decimal和时间数据递增的模拟数据
    查看>>
    MySql中关于geometry类型的数据_空的时候如何插入处理_需用null_空字符串插入会报错_Cannot get geometry object from dat---MySql工作笔记003
    查看>>
    mysql中出现Incorrect DECIMAL value: '0' for column '' at row -1错误解决方案
    查看>>
    mysql中出现Unit mysql.service could not be found 的解决方法
    查看>>
    mysql中出现update-alternatives: 错误: 候选项路径 /etc/mysql/mysql.cnf 不存在 dpkg: 处理软件包 mysql-server-8.0的解决方法(全)
    查看>>
    Mysql中各类锁的机制图文详细解析(全)
    查看>>
    MySQL中地理位置数据扩展geometry的使用心得
    查看>>
    Mysql中存储引擎简介、修改、查询、选择
    查看>>
    Mysql中存储过程、存储函数、自定义函数、变量、流程控制语句、光标/游标、定义条件和处理程序的使用示例
    查看>>
    mysql中实现rownum,对结果进行排序
    查看>>
    mysql中对于数据库的基本操作
    查看>>
    Mysql中常用函数的使用示例
    查看>>
    MySql中怎样使用case-when实现判断查询结果返回
    查看>>
    Mysql中怎样使用update更新某列的数据减去指定值
    查看>>
    Mysql中怎样设置指定ip远程访问连接
    查看>>
    mysql中数据表的基本操作很难嘛,由这个实验来带你从头走一遍
    查看>>