像识别技术神经网络,视频像识别技术

电子科技大学格拉斯哥学院通信二班鲍佳慧 2017200602004

一. 背景介绍

在大一下学期我参加了格拉斯哥学院所开展的一系列新生研讨课活动，其中曾兵院长介绍了有关图像处理，三维电视和“可视”大数据，让我对我们日常的图像和视频有了全新的认识并激发了我对视频图像处理的兴趣。

二. 应用于图像视频处理的图像识别

发展
图像处理的发展依赖于计算机的应用和发展，它是计算机应用领域中非常活跃的一部分。图像处理系统分为通用图像处理系统和专用图像处理系统两大类。图像识别，是指利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。

应用
图像视频处理在各个领域应用都十分广泛。
航天航空方面：主要运用在太空成像、飞机遥感和卫星遥感技术中。这些图像无论是在成像、存储、传输过程中，还是在判读分析中，都必须采用图像处理方法。
军事公安方面：主要用于公安业务图片的判读分析，指纹识别，人脸鉴别，不完整图片的复原，以及交通监控、事故分析等。目前己投入运行的高速公路不停车自动收费系统中的车辆和车牌的自动识别都是图像处理技术成功应用的例子。

现状（社会问题）
图像识别一直是现今热门话题，对于人来说，识别物体并不困难。对于计算机，却比较艰巨。因为我们不需要学习就可以判断物体种类，而计算机需要不断学习，不停地识别才能判断出它是什么。例如现在大众十分关心的无人驾驶汽车的问题。当涉及无人驾驶汽车的导航系统，计算机将如何将道路上的行人与各种其他车辆区分开来或过滤，这对计算机的图像识别能力提出了更高的挑战。

虽然现在的图像识别较为普及，例如电子科大的图书馆也已经应用了人脸识别系统，但识别仍不是非常精准，也出现了不少机器无法识别或者识别到其他人脸的情况。如若用此精确度的计算机应用在判案辨别上，可能会出现判案不准的情况，伤及无辜，让罪犯逃之夭夭。同时在观看视频录像时，尤其是光线较暗肉眼难以分辨五官等形象特征时，图像识别就显得格外重要。就是因为如今图像识别在我们的日常生活中起着不可替代的作用，我们在提高图像识别的精确度的同时，也要避免操作的复杂程度。
解决这个问题的一个方法是利用神经网络。
三.神经网络与图像识别
1.卷积神经网络的定义
卷积神经网络（Convolutional Neural Networks, CNN）是一类包含卷积或相关计算且具有深度结构的前馈神经网络（Feedforward Neural Networks），是深度学习（deep learning）的代表算法之一。CNN 由不同的卷积层和池化层组成。它广泛应用于计算机视觉。例如图像识别（image classification），物体识别（object recognition），行为认知（action recognition），姿态估计（pose estimation）以及神经风格转换（neural style transfer）。
2.卷积神经网络的工作过程

卷积神经网络将进行多次采样，多次记录物体的多种特征。除了这些连接层，还有池化和卷积层。CNN使图像识别中保留了重要特征信息的同时也减少了输入的大小。卷积层的输入和输出都是多重矩阵。卷积层包含多个卷积核，每个卷积核都是一个矩阵，每一个卷积核相当于是一个滤波器，它可以输出一张特定的特征图，每张特征图也就是卷积层的一个输出单元。

举个例子。计算机要进行图像处理。首先要读取图片。计算机并不能像人一样几秒内捕捉完物体的所有特征特点，它需要理解。为了方便理解，它会将每个图像转化为一系列特定排序的图点（像素）。如果你改变像素的顺序或颜色，图像也随之改变。计算机会试图通过使用图像的空间的安排从图像中提取特征。为了理解图像，理解像素如何安排对于一个网络极其重要。这就是卷积网络所要做的。
3.使用卷积网络的好处
（1）我们可以采用输入图像，定义权重矩阵，并且输入被卷积以从图像中提取特殊特征而无需损失其有关空间安排的信息。
（2）减少图像的参数数量。CNN把含义相似的特征合并成相同特征，以及把位置上相邻的特征合并到更接近的位置。由于形成特定主题的每个特征的相对位置可能发生微小变化，因此可以通过采样的方法输入特征图中强度最大的位置，减小了中间表示的维度（即特征图的尺寸），从而，即使局部特征发生了一定程度的位移或者扭曲，模型仍然可以检测到这个特征。