cvpr2021目标检测论文

计算机视觉研究所专栏

作者：Edison_G

在CVPR21的文章中，我们也共享了很多最佳框架。在现实场景下，目标检测仍然是最基础、最热门的研究课题，特别是目前对于小目标检测，有更多的研究者和企业参与到研究中来。今天，我们“计算机视觉研究院”向大家介绍小目标检测精度大幅提高的新框架。

公众号ID|ComputerVisionGzq

学习小组|扫码在主页上获取加入方式

论文：

3359 arxiv.org/pdf/1912.06319.pdf

很简单

在各种环境下应用目标检测算法有很多局限性。特别是检测小目标仍然具有挑战性分辨率低，信息有限。

有研究人员提出了一种利用上下文的目标检测方法，提高了检测小目标的精度。该方法通过连接多尺度特征，使用来自不同层的附加特征作为上下文。研究人员还提出了关注图像中的目标，具有可以包含来自目标层的上下文信息的注意机制的目标检测。实验结果表明，该方法在检测小目标方面的精度高于传统的SSD框架。

背景

下图显示了SSD框架无法检测到小目标时的情况。小目标的检测还有很大的改进空间。

由于低分辨率，像素有限，小目标难以检测。例如，通过只看下图的目标，人类甚至很难识别这些物体。但是，通过考虑天空中的背景，该物体可以被识别为鸟类。因此，我们认为解决这个问题的关键在于如何将上下文作为附加信息来帮助检测小目标。

新的框架分析

新的框架从基线SSD开始讨论，是研究者提出的提高小目标检测精度的组件。首先，SSD与特征融合，获取上下文信息。名字叫F-SSD；第二，带有预约模块SSD使得网络能够关注重要的部件，A-SSD；第三，研究者将特征融合与注意力模块相结合，称为FA-SSD。

F-SSD: SSD with context by feature fusion

为了使给定的特征图(目标特征图)为想要检测目标的位置提供上下文，研究人员将特征图与目标特征层的较高级特征图(上下文特征)合并。例如，在SSD中，给定来自我们的conv4_3的目标特性，我们的上下文特性来自conv7和conv8_2两层。

虽然新格局特征的融合可以推广到任何目标特征和任何更高的特征。但由于这些特征图具有不同的空间大小，研究人员提出了如上图的融合方法。在连接要素融合之前，对顶部和底部要素执行反卷积，使其具有与目标要素相同的空间大小。由于将上下文特征通道设置为目标特征的一半，因此上下文信息的数量不会超过目标特征本身。仅在F-SSD中，研究人员在不改变空间大小和信道数卷积层的情况下，在目标特征中增加了额外的卷积层。

此外，标准化步骤非常重要，因为在连接特征之前，每个层都有不同的比例。因此，在每层之后进行批处理规范化和ReLU。最后，通过重叠特征来连接目标特征和上下文特征。

A-SSD: SSD with attention module

如上图所示，由trunk分支和mask分支构成。 trunk分支有两个残差块，每个残差块都有三个卷积层，如上图d所示。 mask分支通过使用残差合并执行下采样和上采样输出注意图，完成sigmoid的激活。残差耦合维持下采样阶段的特征。然后，将来自mask分支的注意图与trunk分支的输出相乘，产生参与的特征。最后，在参与特征之后还有另一个残差块，L2标准化，ReLU。

FA-SSD: Combining feature fusion and atten- tion in SSD

/strong>

研究者提出了以上的两个特征的方法，它可以考虑来自目标层和不同层的上下文信息。与F-SSD相比，研究者没有在目标特征上执行一个卷积层，而是放置了one stage的注意模块，如下图所示。

实验

ResNet SSD with feature fusion + attention module (FA- SSD)

红色框是GT，绿色框是预测的

注意力模块的可视化。有些通道关注目标，有些通道关注上下文。conv4_3上的注意模块具有更高的分辨率，因此与conv7上的注意相比，可以关注更小的细节。

© THE END

转载请联系本公众号获得授权

计算机视觉研究院学习群等你加入！

计算机视觉研究院主要涉及深度学习领域，主要致力于人脸检测、人脸识别，多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架，我们这次改革不同点就是，我们要着重”研究“。之后我们会针对相应领域分享实践过程，让大家真正体会摆脱理论的真实场景，培养爱动手编程爱动脑思考的习惯！

扫码关注

计算机视觉研究院

公众号ID｜ComputerVisionGzq

学习群｜扫码在主页获取加入方式

往期推荐

????

CVPR21最佳检测：不再是方方正正的目标检测输出（附源码）

Sparse R-CNN：稀疏框架，端到端的目标检测（附源码）

利用TRansformer进行端到端的目标检测及跟踪（附源代码）

细粒度特征提取和定位用于目标检测（附论文下载）

特别小的目标检测识别（附论文下载）

目标检测 | 基于统计自适应线性回归的目标尺寸预测

目标检测干货 | 多级特征重复使用大幅度提升检测精度（文末附论文下载）

SSD7-FFAM | 对嵌入式友好的目标检测网络，为幼儿园儿童的安全保驾护航

目标检测新方式 | class-agnostic检测器用于目标检测（附论文下载链接）

干货 | 利用手持摄像机图像通过卷积神经网络实时进行水稻检测（致敬大气的乐曲）

CVPR 2021 | 不需要标注了？看自监督学习框架如何助力目标检测