1.LeNet网络模型结构
本文以LeNet网络为例,介绍如何卷积层和池化层的输出特性图的大小。
LeNet放入输入层就有8层。 分别为输入层INPUT、C1卷积层、S2池化层(或称为下采样)、C3卷积层、S4池化层(或称为下采样)、C5卷积层、F6全部
LeNet每一层都输入图像大小、卷积内核大小、步长和通道数以及输出图像大小,如图所示。
2.特征图大小的计算
卷积层和池化层采用不同的公式。
a .卷积层
a .池化层
说明: OutSize为输出图像大小,InputSize为输入图像大小,KernelSize为卷积内核大小,Stride为步长,Padding为卷积填充方式。 根据这两个公式,可以计算出上表。 读者请计算一下。 的说明显示,LeNet上的填充方式为valid,即不填充,填充为0。
3.补充知识
a .神经元的基本结构
偏置项x0 :解决线性不可分问题,使模型可以逼近任意非线性函数。
激活函数主要起到这个作用。 这样,模型可以接近任何非线性函数。 偏置项目这个功能很弱。
b.padding的三种填充方式
在“same”模式下,输入和输出比例仅在步骤为1时相同
c .卷积操作
d .池化操作
池化操作的方式也有各种各样,这里以MaxPool (最大池化)和AvgPool (平均池化)为例。
构建卷积神经网络时,卷积层后,池化往往会降低卷积层输出的特征维数,有效减少网络参数,同时可以防止过拟合现象
参考:
1 .本文建议详细介绍LeNet模型的结构。 LeNet模型解读
2 .经典网络结构(LeNet、AlexNet、VGG、谷歌net )解析
3 .卷积神经网络-LenNet (代码实现pytorch ) )。