首页 > 编程知识 正文

卷积神经网络全连接层的作用,全连接层的作用是特殊的分类器吗

时间:2023-05-06 09:18:36 阅读:228189 作者:132

全连接层(fully connected layers,FC) 在整个卷积神经网络中起到“分类器”的作用。如果说卷积层、池化层和激活函数层等操作是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。在实际使用中,全连接层可由卷积操作实现:对前层是全连接的全连接层可以转化为卷积核为1x1的卷积;而前层是卷积层的全连接层可以转化为卷积核为hxw的全局卷积,h和w分别为前层卷积结果的高和宽。目前由于全连接层参数冗余(仅全连接层参数就可占整个网络参数80%左右),近期一些性能优异的网络模型如ResNet和GoogLeNet等均用全局平均池化(global average pooling,GAP)取代FC来融合学到的深度特征,最后仍用softmax等损失函数作为网络目标函数来指导学习过程。需要指出的是,用GAP替代FC的网络通常有较好的预测性能。( 思想就是:用 feature map 直接表示属于某个类的 confidence map,比如有10个类,就在最后输出10个 feature map,每个feature map中的值加起来求平均值,然后把得到的这些平均值直接作为属于某个类别的 confidence value,再输入softmax中分类, 更重要的是实验效果并不比用 FC 差。)对 1 * 1 卷积可以减少参数进行举例 :
eg:方便直观理解。如果input feature map是7*7*512,output feature map是1*1*4096,如果使用全连接,那么需要的权值参数数目(忽略偏置参数,下同)为7*7*512*4096,如果使用7*7卷积核,需要的权值参数数目为7*7*512*4096,如果使用1*1卷积核,且权值共享,需要的权值参数数目为1*1*512*4096,但得到的output feature map为7*7*4096,需要再做一个global average pooling才能变为1*1*4096,此时确实可以减少权植参数数目。 卷积神经网络 1*1 卷积核

卷积神经网络中卷积核的作用是提取图像更高维的特征,一个卷积核代表一种特征提取方式,对应产生一个特征图,卷积核的尺寸对应感受野的大小。

经典的卷积示意图如下:


5*5的图像使用3*3的卷积核进行卷积,结果产生3*3(5-3+1)的特征图像。


卷积核的大小一般是(2n+1)(2n+1)的奇数乘奇数大小(n>=1),最常用的有3*3,5*5,7*7的。之所有使用奇数奇数而不是偶数*偶数大小的,主要原因有两点:
1.  一般情况下,使用n*n大小的卷积核对大小为N*N的图像卷积,结果图像尺寸缩小为(N-n+1),这种卷积操作的都是图像上真实的像素,不需要对图像进行扩充,也叫有效补白(Valid Padding)

另一种补白方式是相同补白(Same Padding),在卷积核对图像执行相同补白(Same Padding)卷积时,要求卷积后图像大小跟原图像大小保持一致,这就需要提前给原图像做Padding(补白)操作,即给图像增加额外的空白,增大图像尺寸使得卷积后大小为原图像大小,Padding操作示意图如下:


 
在相同补白(Same Padding)模式下,需要补充的像素大小是N-(N-n+1)= n-1个,这里的n表示的是卷积核大小,如果n为奇数,则n-1为偶数,补得这n-1个像素可以在图像两侧对称分布,如果使用偶数的卷积核,n-1为奇数,无法在图像两侧对称分布
 

2. 奇数卷积核有中心点,可以方便的确定位置,而偶数的卷积核不存在绝对的中心点。


 

1*1 卷积核

 

在残差网络的Bootleneck残差模块和GoogleNet的Inception模块里出现了1*1的卷积核:




 

与(2n+1)*(2n+1)的卷积核提取图像特征顺便降低图像尺寸不同,1*1的卷积核的作用是提升或者降低特征(个数)的维度,而不改变图像的宽高。这里的维度是指图像的通道数(厚度,如RGB图像的通道数是3, 10个单通道的特征图一起组成通道数是10)。


例如经过某次卷积后,得到W*H*10的特征图,这里通道数是10,如果需要降维成W*H*6,即把10个特征图减少到6个。这就需要使用6组,每组10个的1*1的卷积核来实现。10个1*1的卷积核和上一层W*H*10的特征图卷积,得到一个W*H*1的特征图,使用6组这样的1*1卷积核,就可以得到W*H*6维度的特征图,实现了特征图的压缩,而不改变图像的宽高。这里一共有6*10=60个可训练参数。

同理,使用1*1卷积核也可以实现特征图升维。


从图像处理的角度看1*1的卷积操作,可以把它理解成是把N个图像按N个不同的系数融合的操作,需要多少个特征图就融合多少次。


1 * 1 卷积核转载自https://blog.csdn.net/dcrmg/article/details/79222164

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。