论文笔记,看论文做笔记

全称： holistically-nestededgedetection

亮点1，基于整个图像的训练和预测

2、多尺度和多层次特征学习

3、通过FCN和VGG改善

4、用多个side output输出不同scale的边缘，然后用一个训练的权重融合函数得到最终的边缘输出。可以进行求解边缘和物体边界的ambiguity

检测效果

算法作者提出的holistically-nested方法主要通过几种不同多尺度深度学习下的结构进行比较说明。多尺度包括基于更内部网络的多尺度和基于外部网络的多尺度。前者学习神经网络中不同层通过下采样获得的不同尺度特征，并结合形成多尺度，后者根据输入图像尺度处理时的多尺度获得不同的尺度信息。作者将具体的多尺度深度学习分为4类，如下图所示。

(a )Multi-streamlearning图像，在图中平行的网络下，输入同时输入，通过不同道路的网络，然后连接到一个global out layer输出。

(b )Skip-layer networklearning图像，该方法主要连接单个初始网络流得到特征图，并将图合并输出。

在此，a、b都使用1个输出的loss函数进行单一的回归预测，但边缘检测通过多个回归预测结合的边缘图可能更有效。

(c )Single model on multiple inputs多尺度输入图像、单个网络和图像resize方法。

(d )Training independent networks通过多个独立的网络分别对不同深度和输出loss进行多尺度预测，该方法训练样本量大。

) e )Holistically-nested networks)，本文提出的算法结构由) d )演化而来，是一种相似且相互独立的多网络多尺度预测系统，但结合多尺度输出

网络体系结构

作者分别在conv1_2、conv2_2、conv3_3、conv4_3、conv5_3后面引出侧输出，然后访问sigmoid_cross_entropy_loss

在预测阶段，最终水平的输出结果可以直接作为最终结果。也可以得到所有层的输出结果，求平均作为最终结果。这样做的优点是进一步提高精度，缺点是增加额外的操作，增加时间。

具体更改：

基于VGG网络，

1 )将side output layer连接到每个stage的最后卷积层，即conv1_2、conv2_2、conv3_3、conv4_3和conv5_3。这些卷积层的卷积核尺寸

2 )移除了VGG的最后一个stage，也就是最后一个池化和后面的所有全连接层。

绘制图，理解将VGG16转换为以下图像：

去除不需要的部分，得到如上图所示的网络结构。由于具有池化层作用，因此从第二个组开始，每个组的输入image方面值将是上一组输入image方面值的一半。

HED网络是多尺度多融合(multi-scaleandmulti-levelfeaturelearning )的网络结构。所谓多尺度，如上图所示，是取出VGG16的各组最后的卷积层(绿色部分)的输出。每个组获得的image的纵横比因此，现在需要再次计算使用“传输转换/解卷积”(deconv )为每个组获得的image 效果相当于将第2-5组中的image纵横比分别扩大2~16倍，这在每个比例) VGG16的每个组中是一个比例

参考： https://blog.csdn.net/sinat _ 26917383/article/details/73087831