最大二均值池化,卷积池化过程是什么

在深度学习中会遇到很多功能层，这些层起着什么作用？我们该怎么理解？我认为本文能生动易懂地解答这个问题

通常，卷积神经网络除了输入和输出层外，还有四个基本神经元层，在三层神经网络中将该基底层称为隐层

卷积层(Convolution )

激活层(Activation ) )

池化层(轮询)

完全连接层(全连接) ) ) ) ) ) )。

卷积层

在第一卷积层中，成千上万的神经元用作第一组过滤器，并且通过搜索图像的各个部分和像素来找到图案。随着越来越多的图像被处理，各神经元对特定的特征进行学习过滤，准确性得到了提高。

例如，如果图像是苹果，则一个过滤器可能会专注于找到颜色“红色”，另一个过滤器可能会找到圆边缘，而另一个过滤器可能会识别出细茎。如果你打扫了混乱的地下室，准备在车库大卖，你就能理解把一切都按主题分类是什么意思了。卷积层通过将图像分解为不同的特征来进行。

特别强大的是，神经网络出名的绝招与Deep Blue中使用的早期AI方法不同，这些滤波器不是人工设计的。他们只是通过看数据来学习和自我改善。

卷积层创建不同的细分图像版本，每个图像版本专用于不同的过滤特性——，以指示神经元在何处看到红色、茎、曲线和各种其他元素的实例(但都是部分的)。然而，由于卷积层在识别特征方面相对自由，所以还需要另一眼睛来防止在网络上传输图像信息时丢失有价值的部分。

神经网络的优点之一是可以非线性学习。如果不用数学术语解释，就意味着你可以在不太明显的图像中找到特征——树上的苹果，阳光下的，阴影下的，厨房柜台上的餐具。这都得益于激活层，有价值的东西——的清晰、难以发现的属性多少有些突出。

想象一下，在我们的车库大甩卖中，你从所有种类的东西中挑选了几件珍贵的宝物。书，是大学时代的经典t恤。很糟糕，我们可能还不想扔掉它们。我们把这些“可能性”剩下的放在各自的类别之上，为重新考虑做准备。

池化层

整个图像中的这个“卷积”生成了大量的信息，这很快就有可能成为计算噩梦。进入池化层后，可以将其缩小为更通用、更可消化的形状。虽然有许多解决此问题的方法，但最受欢迎的是“最大池”(Max Pooling )，可将每个特征图编辑为自己的读者文摘版。因此，只有红色、茎或曲线最好的样本是特征。

在车库春季打扫的例子中，著名的日本清洁工玛丽亚孔多的原则让我们不得不从每一个类别的山里小最爱中选择“唤起欢乐”的东西，然后卖掉和处置其他东西。所以至今仍按物品类型分类，但只包括实际想保留的物品。其他都卖了。

在这个点，神经网络的设计者可以继续折叠、激活、池化以及过滤图像以获得更高水平的信息。识别照片中的苹果时，图像会一次又一次地过滤，初始层只显示几乎无法识别边缘的部分，例如红色部分和茎的前端，之后的更多过滤层显示整个苹果。无论如何，当开始获取结果时，完全连接层将起作用。

完全连接层

现在是得出结果的时候了。在完全连接层，每个缩减或“池化”特征图“完全连接”到表示神经网络正在学习和感知的输出节点(神经元)。如果网络的任务是学习如何发现猫、狗、豚鼠和老鼠，那么有四个输出节点。在我们描述的神经网络中，只有两个输出节点。一个用于“苹果”，另一个用于“橘子”。

如果通过网络发送的图像是苹果，而网络已经接受了一些训练，并且越来越好的预测，那么好的特征块很可能是包括苹果特征在内的高质量例证。这是最终输出节点完成使命的地方，反之亦然。

“苹果”和“橘子”节点的工作(他们在工作中学到的东西)，基本上是对包含各自结果的特征图进行“投票”。因此，“苹果”节点认为，一个图中包含的“苹果”的特征越多，对该特征图的投票就越多。这两个节点都必须对每个特性图进行投票，无论其包含什么。因此，在这种情况下，“橘子”节点实际上不包含“橘子”特征，因此不会对任何特征图投很多票。最后，票数最多的节点(在本例中为“苹果”节点)实际上可能并不那么简单，但可以将其视为互联网的“答案”。

因为同一网络在寻找两个不同的东西，——苹果和橘子——网络的最终输出用百分比表示。在这种情况下，假设在训练期间互联网性能下降，这里的预测可能是“苹果”75%，“橘子”25%。或者如果是训练初期，可能更不正确。那可能是20%的“苹果”和80%的“橘子”。这个不好。

如果一开始不成功，就再试一次，再试一次……

所以，在早期阶段，神经网络可能会以百分比的形式给出很多错误的答案。 20%的“苹果”和80%的“橘子”，预测显然是错误的，但这是使用标记的训练数据进行监视学习，所以网络可以通过被称为“反向传播”的过程进行系统调整。

为了避免数学术语，反向传播会将反馈发送到更高的节点，并告诉您答案有多不同。然后，层将反馈发送到上层，发送到上层直到返回到卷积层，并进行如下调整

帮助每个神经元在随后的图像在网络中传递时更好地识别数据。

这个过程一直反复进行，直到神经网络以更准确的方式识别图像中的苹果和橘子，最终以100％的正确率预测结果——尽管许多工程师认为85％是可以接受的。这时，神经网络已经准备好了，可以开始真正识别图片中的苹果了。

【转载文章】
原文链接：https://blog.csdn.net/weixin_41066584/article/details/90581842