深度学习知识及资源分享,学习交流,共同进步~
AI研习图书馆,发现不一样的世界
Deformable Convolutional——可变形卷积在深度学习的计算机视觉任务中,如果使用可变形卷积,则可以显著提升Faster R-CNN和R-FCN等算法在物体检测和分割上的性能。只需要增加很少的计算量,就可以得到性能的提升,Deformable Convolutional,非常好的文章,值得一看~
5. 消融研究和实验结果 5.1 使用可变形卷积在不同数量的最后几层上 3和6个可变形卷积也很好。最后,作者选择3,因为可以很好地权衡用于不同的任务。我们还可以看到DCN改进了DeepLab,class-aware RPN(或认为是简化的SSD),fast - R-CNN和R-FCN 5.2. 可变形卷积偏移距离分析
上述分析亦说明了DCN的有效性。首先,根据ground truth bound
box标注和滤波器中心的位置,将可变形卷积滤波器分为四类:small、medium、large和background。
然后测量膨胀值(偏移距离)的均值和标准差。 发现可变形滤波器的感受野大小与目标大小相关,说明可以有效地从图像内容中学习变形。
背景区域的滤波器大小介于中、大物体之间,说明识别背景区域需要较大的感受野。
与可变形RoI pooling类似,现在部分被偏移以覆盖非刚性物体。 5.3 在PASCAL VOC上和Atrous卷积对比只使用可变形卷积:DeepLab,class-aware RPN, R-FCN使用可变形卷积都得到了改进,已经优于使用atrous
convolution实现的DeepLab,RPN和R-FCN。与atrous convolution相比,Faster
R-CNN使用可变形卷积更具有竞争优势。
只使用Deformable RoI Pooling:在Faster R-CNN和R-FCN中只使用Deformable RoI
Pooling。对于Faster-RCNN,两者差不多,对于R-FCN,Deformable RoI Pooling更好。
使用可变形卷积和Deformable RoI Pooling:对于Faster
R-CNN和R-FCN,使用可变卷积核可变ROI池化效果是最好的。
可变形卷积只在模型参数和计算上增加很小的开销
除了增加模型参数之外,显著的性能改进来自于模型几何变换的能力。
英文原文:英文文献
卷积神经网络基础知识系列笔记不断更新中,学习笔记,在此记录~
推荐阅读文章
[1] AI入门-人工智能的前世今生
[2] AI入门-深度学习综述
[3] AI入门-计算机视觉学习指南[附资源]
[4] 深度学习框架总结—国际篇
[5] 深度学习-CNN结构设计技巧
[6] 资源分享-深度学习及数据分析等资源合集
[7] 今日分享—统计学习方法
[8] 算法总结—人脸检测算法
[9] 目标检测算法-YOLOv4
[10] 项目总结—人脸检测
[11] 项目实战-人脸口罩检测
[12] 深度学习基础-二十种损失函数
[13] 深度学习-目标检测的十九个研究方向
[14] 项目实战-车辆检测案例实现
[15] Python学习-实战小案例
[16] 数据结构与算法-Python语言案例实现
…
AI研习图书馆
转载是一种动力 分享是一种美德
关注AI研习图书馆,发现不一样的精彩世界