首页 > 编程知识 正文

如何理解卷积(卷积特性)

时间:2023-05-04 21:28:48 阅读:87251 作者:1141

卷积神经网络是一种特殊的神经网络结构,是自动驾驶车、人脸识别系统等计算机视觉应用的基础,其中基本的矩阵乘法将被卷积运算所取代。 专门处理具有网状拓扑的数据。 例如,可以将时间序列数据和图像数据视为二维像素网格。

历史

卷积神经网络是福岛第一核电站于1980年引入的,当时叫做Neocognitron。 灵感来源于Hubel和Weisel提出的神经系统分层模型。 但是,由于其复杂的无监督学习算法,即无监督学习,该模型不受欢迎。 1989年,Yann LeCun利用反向传播和Neocognitron的概念,提出了一种叫做LeNet的架构,由美国和欧洲手写使用的邮政编码进行识别。 邮政服务。 Yann LeCun进一步研究了这个项目,最终在1998年LeNet-5——发表了第一个纳入了今天CNN中使用的基本概念的现代卷积神经网络。 他还推出了MNIST手写数字数据集。 这可能是机器学习中最有名的基准数据集。 20世纪90年代,计算机视觉领域转移了其焦点,许多研究者停止了对CNN架构的研究。 神经网络的研究经历了一个寒冷的冬天,到2012年,多伦多大学的研究人员小组在著名的ImageNet挑战赛中进入基于CNN的模式“秀丽的海豚Net”,最终以16.4%的错误率赢得了比赛。 此后,卷积神经网络不断发展,基于CNN的架构不断获得ImageNet,2015年,基于卷积神经网络的架构ResNet的误差率超过了人类水平的5.1%,误差率超过了人类水平。

卷积的误称

CNN中广泛使用的卷积运算是不恰当的语言。 严格地说,使用的操作不是卷积而是相关的。 两个操作员都有一点不同。 为了理解不同之处,分别进行说明。

互相关

相关性是指在图像上移动滤镜蒙版(通常称为内核),计算各个位置的积和的过程。 相关性是滤波器位移的函数。 也就是说,相关的第一个值对应于滤波器的零位移,第二个值对应于一个位移。

公式:

图3表示使用f滤波器和图像I的1维相互相关运算的数学式。 因为f有奇数的元素很有用,所以可以假设f沿着它的中心移动。 f有2N 1的元素,这些索引从-N到n,f(0)表示中心元素。

同样,可以将这个概念扩展到下图所示的2d情况。 基本思想是一样的,除了图像和滤镜,现在是2D。 我们可以假设我们的滤波器有奇数个元素,所以它用一个(2N 1) x ) 2N 1)矩阵表示。

二维相关运算非常简单。 我们只是取给定大小的滤波器,然后把它放在和滤波器一样大小的图像的局部区域。 继续此操作,在整个图像中移动相同的滤镜。 这也有助于我们实现两个非常受欢迎的属性:

平移不变性:我们的视觉系统必须感知、响应或检测同一物体,无论它出现在图像的任何地方。 局部性:我们的视觉系统集中在局部区域,与图像的其他部分发生了什么无关。 在互相关函数中,如果应用于离散的单位脉冲(1为一个,其他为0的二维矩阵),则可以得到滤波器的副本,但具有旋转了180度的特性。

n">

卷积:

卷积运算与互相关运算非常相似,但有细微的区别。在卷积运算中,首先将核翻转180度,然后应用于图像。卷积的基本性质是将一个核与一个离散的单位脉冲进行卷积,在脉冲的位置上得到一个核的拷贝。

我们在互相关部分看到,一个互相关操作产生一个脉冲的拷贝,但是旋转了180度。因此,如果我们预先旋转滤波器并执行相同的乘积滑动和运算,我们应该能够得到期望的结果。

数学公式:利用核函数F对图像I进行的卷积运算由一维的公式给出。卷积就像相关一样,只是我们在互相关之前先把滤波器翻转一下

在二维卷积的情况下,我们水平和垂直翻转滤波器。这可以写成:

卷积运算同样遵循平移不变性和局部性的性质。

注意:尽管这两个操作稍有不同,但是所使用的核是否对称并不重要。

结论:

在这篇文章中,我们简要讨论了卷积神经网络的历史和一些特性。我们讨论了卷积这个错误的说法,即在各种文本中经常提到的卷积运算其实是互相关运算。这种差别很细微,但却很有用,每个进入、练习或经验丰富的计算机视觉领域的人都应该知道。

引用

Deep Learning book by Ian Goodfellow and Yoshua Bengio and Aaron Courville.Digital Image Processing by 痴情的小蝴蝶 C. Gonzalez.Dive into Deep Learning by Aston Zhang, 活泼的冬天 C. Lipton, Mu Li and 秀丽的小海豚 J. Smola.Correlation and Convolution by David Jacobs.Figure 9 taken from https://towardsdatascience.com/applied-deep-learning-part-4-convolutional-neural-networks-584bc134c1e2.https://spatial-lang.org/convThe meme is taken from 7. https://www.mihaileric.com/posts/convolutional-neural-networks/.

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。