首页 > 编程知识 正文

论文笔记,看论文做笔记

时间:2023-05-05 14:17:18 阅读:48864 作者:2840

全称: holistically-nestededgedetection

亮点1,基于整个图像的训练和预测

2、多尺度和多层次特征学习

3、通过FCN和VGG改善

4、用多个side output输出不同scale的边缘,然后用一个训练的权重融合函数得到最终的边缘输出。 可以进行求解边缘和物体边界的ambiguity

检测效果

算法作者提出的holistically-nested方法主要通过几种不同多尺度深度学习下的结构进行比较说明。 多尺度包括基于更内部网络的多尺度和基于外部网络的多尺度。 前者学习神经网络中不同层通过下采样获得的不同尺度特征,并结合形成多尺度,后者根据输入图像尺度处理时的多尺度获得不同的尺度信息。 作者将具体的多尺度深度学习分为4类,如下图所示。

(a )Multi-streamlearning图像,在图中平行的网络下,输入同时输入,通过不同道路的网络,然后连接到一个global out layer输出。

(b )Skip-layer networklearning图像,该方法主要连接单个初始网络流得到特征图,并将图合并输出。

在此,a、b都使用1个输出的loss函数进行单一的回归预测,但边缘检测通过多个回归预测结合的边缘图可能更有效。

(c )Single model on multiple inputs多尺度输入图像、单个网络和图像resize方法。

(d )Training independent networks通过多个独立的网络分别对不同深度和输出loss进行多尺度预测,该方法训练样本量大。

) e )Holistically-nested networks),本文提出的算法结构由) d )演化而来,是一种相似且相互独立的多网络多尺度预测系统,但结合多尺度输出

网络体系结构

作者分别在conv1_2、conv2_2、conv3_3、conv4_3、conv5_3后面引出侧输出,然后访问sigmoid_cross_entropy_loss

在预测阶段,最终水平的输出结果可以直接作为最终结果。 也可以得到所有层的输出结果,求平均作为最终结果。 这样做的优点是进一步提高精度,缺点是增加额外的操作,增加时间。

具体更改:

基于VGG网络,

1 )将side output layer连接到每个stage的最后卷积层,即conv1_2、conv2_2、conv3_3、conv4_3和conv5_3。 这些卷积层的卷积核尺寸

2 )移除了VGG的最后一个stage,也就是最后一个池化和后面的所有全连接层。

绘制图,理解将VGG16转换为以下图像:

去除不需要的部分,得到如上图所示的网络结构。 由于具有池化层作用,因此从第二个组开始,每个组的输入image方面值将是上一组输入image方面值的一半。

HED网络是多尺度多融合(multi-scaleandmulti-levelfeaturelearning )的网络结构。 所谓多尺度,如上图所示,是取出VGG16的各组最后的卷积层(绿色部分)的输出。 每个组获得的image的纵横比因此,现在需要再次计算使用“传输转换/解卷积”(deconv )为每个组获得的image 效果相当于将第2-5组中的image纵横比分别扩大2~16倍,这在每个比例) VGG16的每个组中是一个比例

参考: https://blog.csdn.net/sinat _ 26917383/article/details/73087831

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。