首页 > 编程知识 正文

卷积神经网络实现,深度卷积神经网络算法

时间:2023-05-03 09:56:09 阅读:13518 作者:4594

文章目录1 .概述核心思想2. FCN网络2.1网络结构2.2上采样Upsampling2.3跳结构3 FCN训练4 .其他4.1 FCN和CNN4.2 FCN的不足4.3答疑【参考】

1 .概述

完整卷网络(Fully Convolutional Networks ), FCN )是Jonathan Long等人2015年在fullyconvolutionalnetworksforsemanticsegmentation中提出的用于图像语义分割的框架,FCN是将以往的CNN后面的所有连接层进行卷积而成的层另外,为了解决卷积和池化导致的图像尺寸的缩小,使用上采样方式复原图像尺寸。

核心思想是不包括全连接层的全卷积网络,能够满足任意大小输入的卷积层增大图像大小,输出精细结果; 结合不同深度层结果的跳跃级结构,确保鲁棒性和准确性。

2. FCN网络2.1网络结构FCN网络结构主要分为两部分:全卷积部分和反卷积部分。 其中全卷积部分是几个经典CNN网络,如VGG、ResNet等,用于提取特征;反卷积部分通过上采样得到原尺寸的语义分割图像。 FCN的3358www.Sina.com/可以是任意尺寸的彩色图像,输入与输入尺寸相同,通道数为n (目标类别数)1(背景)。 FCN网络结构如下。

2.2上采样Upsampling卷积过程中的卷积操作和池操作需要对得到的特征图进行上采样操作,以减小特征图的大小,获得原始图像大小的精确像素预测。 可以通过双线性插值进行上采样,双线性插值很容易通过固定卷积内核的反卷积实现。 倒置卷积是反卷积)。 在论文中,作者不是固定卷积核,而是使卷积核成为可学习的参数。 卷积操作的步骤如下。

2.3跳跃级结构只对最后一层特征图进行上采样得到原图大小的分割,最终分割效果不太好。 因为最后一层的特征图太小,这意味着细节丢失太多了。 因此,将最下层的预测(富含全局信息)和更浅层的预测(富含局部信息)以跳跃等级结构进行组合,在遵守全局预测的同时进行局部预测。

基底层(stride 32 )预测)输出)上采样一倍获得原尺寸图像,与来自pool4层(stride 16 )的预测融合(加法)。 把这部分网络称为http://www.Sina.coom,然后把这部分的预测再进行两倍上采样,与从pool3层得到的预测融合。 这部分网络被称为FCN-32s。 图标如下所示。

3 FCN培训FCN-16s:以经典分类网络为初始化,最后两个阶段为全连接(红色),参数不舍弃使用。

3358 www.Sina.com/: http://www.Sina.com /网络—根据特征小图预测分割小图,然后直接上采样到大图。

3358 www.Sina.com/: http://www.Sina.com /网络—上采样分两次完成。 在第二次上采样之前,融合第四个轮询层的预测结果,使用跳跃级结构提高精度。

3358 www.Sina.com/: http://www.Sina.com /网络—上采样分三次完成。 进而融合了第三个轮询层的预测结果。

4 .其他4.1 FCN和CNN FCN-8s的强大之处在于多层结构可以自动学习特征并学习多层特征。

阶段1的卷积层感知域小,学习了一些局部区域特征;阶段2的卷积层感知域大,学习了更抽象的特征; 抽象的特征有助于分类,可以很好地判断一个图像中含有什么种类的物体。 但是,抽象特征对物体的大小、位置和方向等敏感性低,物体细节丢失,不能很好地显示物体的具体轮廓,也不能指出各像素具体属于哪个物体,因此难以进行准确的分割。 另一方面,3358www.Sina.com/是从抽象特征复原了各像素所属的类别,从FCN-32s的分类进一步扩展到阶段3的分类。

4.2缺乏fcn得到的结果尚不充分,对细节不敏感; 没有考虑像素和像素的关系,缺乏空间上的一致性等。 4.3答疑为什么一个神经网络中只有卷积层,输入的图像大小可以说是任意的? 但是,如果神经网络不仅有卷积层,而且有全连接层,那么输入的图像大小必须是恒定的吗?FCN-16s的参数与输入大小无关,只是卷积内核在图像上滑动,而与输入图像的大小无关。 在卷积图像的情况下,权重对于每个卷积核是共享的,因此无论输入图像的大小如何,都能够按步骤滑动

卷积,不同之处在于经过卷积运算,不同大小的输入图片所提取出的卷积特征的大小是不同的。全连接层的参数与输入图像大小有关,因为它要把输入图像的所有像素点连接起来。在含有全连接层的神经网络中,假设输入的图像大小一样,那经过卷积得到特征的尺寸也都是相同的。如输入特征尺寸为 a × b a×b a×b,之后连接一个 1 × c 1×c 1×c 的全连接层,那么卷积层的输出与全连接层间的权值矩阵大小为 ( a × b ) × c (a×b)×c (a×b)×c。但如果输入与原图像大小不同,得到新的卷积输出为 a ′ × b ′ a'×b' a′×b′。与之对应,卷积层的输出与全连接层间的权值矩阵大小应为 ( a ′ × b ′ ) × c (a'×b')×c (a′×b′)×c。很明显,权值矩阵大小发生了变化,故而也就无法使用和训练了。 【参考】 图像分割:全卷积神经网络(FCN)详解;语义分割–全卷积网络FCN详解;FCN理解:为什么FCN可以使输入的图像大小可以是任意的;

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。