博客
关于我
CVPR2023 Highlight | Side Adapter Network – 极致轻薄却性能强劲的开放词汇语义分割器...
阅读量:800 次
发布时间:2023-04-05

本文共 881 字,大约阅读时间需要 2 分钟。

识别并分割出任意类别的视觉元素是计算机视觉领域最具挑战性的问题之一。近期,来自华中科技大学和微软亚洲研究院的研究人员在CVPR2023 Highlight中提出了一个全新的开放语义词汇语义分割架构—Side Adapter Network(SAN)。该架构能够赋予现有的VL预训练模型(如CLIP)进行开放词汇语义分割的能力,仅需8M额外的训练参数即可在多种数据集上大幅提升性能,同时实现15帧每秒的处理速度,比SimSeg快19倍,比MaskCLIP快3倍。

SAN的核心思想是在一个冻结的CLIP模型旁引入一个新的Side Adapter Network,用于预测掩码候选(Mask Proposals)。通过引入特定的[SLS] token,SAN能够在推理阶段引导CLIP模型仅关注Mask Proposals相关的区域,从而实现对掩码候选的高效识别。这种设计不仅避免了传统方法中对VL预训练模型的微调问题,还显著提升了模型的推理速度。

SAN的主要优势体现在以下几个方面:

  • 端到端训练:SAN采用端到端训练方式,使得生成的Mask Proposals能够更好地适配CLIP模型。相较于传统的两阶段训练方式,SAN的端到端训练带来了+4.5mIoU的性能提升。

  • 无需微调CLIP模型:SAN的设计避免了对CLIP模型的微调,从而最大程度地保留了其开放词汇识别能力。实验结果表明,CLIP模型的参数微调会显著降低其开放词汇识别能力。

  • 高效推理:SAN通过引入[SLS] token实现了对所有Mask Proposals的高效识别,只需推理一次完整的CLIP模型即可完成任务,推理速度比传统方法快19倍。

  • 解耦预测:SAN将掩码预测与类别预测解耦,进一步提升了模型的分类精度。这种双头设计充分利用了CLIP模型的上下文信息,显著提高了预测性能。

  • 充分复用CLIP特征:SAN充分复用CLIP模型的特征,大幅度降低了所需的额外参数量,同时仍能获得最佳性能。

  • SAN的代码已开源,供研究人员和开发者参考。未来,SAN的研究和应用将为计算机视觉领域带来更多创新。

    转载地址:http://fxrfk.baihongyu.com/

    你可能感兴趣的文章
    Mysql5.7深入学习 1.MySQL 5.7 中的新增功能
    查看>>
    Webpack 之 basic chunk graph
    查看>>
    Mysql5.7版本单机版my.cnf配置文件
    查看>>
    mysql5.7的安装和Navicat的安装
    查看>>
    mysql5.7示例数据库_Linux MySQL5.7多实例数据库配置
    查看>>
    Mysql8 数据库安装及主从配置 | Spring Cloud 2
    查看>>
    mysql8 配置文件配置group 问题 sql语句group不能使用报错解决 mysql8.X版本的my.cnf配置文件 my.cnf文件 能够使用的my.cnf配置文件
    查看>>
    MySQL8.0.29启动报错Different lower_case_table_names settings for server (‘0‘) and data dictionary (‘1‘)
    查看>>
    MYSQL8.0以上忘记root密码
    查看>>
    Mysql8.0以上重置初始密码的方法
    查看>>
    mysql8.0新特性-自增变量的持久化
    查看>>
    Mysql8.0注意url变更写法
    查看>>
    Mysql8.0的特性
    查看>>
    MySQL8修改密码报错ERROR 1819 (HY000): Your password does not satisfy the current policy requirements
    查看>>
    MySQL8修改密码的方法
    查看>>
    Mysql8在Centos上安装后忘记root密码如何重新设置
    查看>>
    Mysql8在Windows上离线安装时忘记root密码
    查看>>
    MySQL8找不到my.ini配置文件以及报sql_mode=only_full_group_by解决方案
    查看>>
    mysql8的安装与卸载
    查看>>
    MySQL8,体验不一样的安装方式!
    查看>>