公式定义中定义了几个参数
输入图像尺寸WW
卷积核尺寸FF
步长s
padding像素数p
计算公式如下
n=(wf2p )/S 1
输出图像尺寸为NN
以resnet50为例,输入为[1、3、224、224 ],其中1为batchsize,3为信道数,224为height和width。
第一层卷积后,其大小为[ 1,64,112,112 ]
in_channels=3//输入通道out_channels=64 //输出通道nn.conv2d(in_channels,out_channels,kernel_size=7
1解释为batchsize,不变。
对于通道数,将生成与设置的输出通道数相同数量的卷积内核来卷积图像。 这意味着卷积内核的数量等于输出配置文件中的通道数量。
最终的输出大小为[ 1,64,112,112 ]
(W F 2P )相当于计算除了初始卷积之外的剩馀卷积可用的大小
(wf2p )/S是对于s大小的每个步骤,能够以之前得到的大小向后移动几次,即能够进行几次卷积
因为不包含第一次卷积,所以加上1
即n=(wf2p )/S 1
输出大小=(图像宽度或高度-卷积核心大小padding大小) /步骤1
对于宽度和高度不同的图像,可以分别用上述公式计算,得到最终的输出尺寸。
卷积动态图解参考:
3359 cs 231 n.github.io/assets/conv-demo/index.html