基于深度的人脸识别,motionface可以人脸识别吗

以前知道DeepID和FaceNet的网络结构，但一些博客表示，由于DeepFace是深度学习在人脸识别领域的基础，所以我们也看到了DeepFace的理论，现在主要是整理自己的理解，造成理解上的错误

首先给出报道的地址，想阅读报道的人请点击链接下载报道的地址。本文介绍了整个方法的流程和实验结果。 DeepFace在进行人脸识别的过程中采用了检测3354定位3354并提取3354分类的过程。

一.人面俱到

关于配准，DeepFace模型采用三维配准方式，通过对传统的LBP直方图(首先设定阈值，以某个像素点为中心与附近的像素点比较阈值，当大于阈值时，小于1则为0，直方图对提取出的特征量进行SVR处理，提取面部和对应的6个基本点。根据6个基本点进行仿射变化，根据3D模型得到对应的67个人脸关键点，再根据这些点进行三角剖分，最终得到对应的3D人脸。具体的对齐流程如下。

a:检测与面部对应的6个基本点

b:二维排列后的脸

99:使用狄洛尼三角分割，在2dhlT的脸上分割67个关键点，通过在边缘增加三角形来避免不连续

将:转换为2D平面并与原始2D图像进行比较时所需的标准3D脸部模型(由标准3D脸部库USF产生的相应的平均脸部模型) )。

~~ :3的2D转换(将标准3d脸转换为2D，用作原始2D和残差)所需的变化表示黑色部分不可见的三角形。对应看不见的三角形的处理被对称地解决。

:执行对3D模型中生成的67个参考点进行分段映射以弯曲面部和对齐面部的处理。

g:处理所生成的2D面部

由:处理生成的3D脸部

其中，与相比，经过了标准的3D人脸转换为2D人脸时的残差处理，此时主要是为了保证转换过程中特征的保持。 ~~的作用是为了显示处理中3 d99 Come Come Everybody 2d变换为什么会通过三角形的仿射变化进行，从~~可以看出处理后的脸是一个个三角形的块。

二.面部显示

该模型采用CNN结构，对有序人脸进行处理(首次将卷积网络应用于人脸识别模型，识别精度大于人眼精度)。具体的网络结构如下。

从网络结构中可以看出，使用的是的共享卷积层、w3的非共享卷积层、两个全连接层。该模型参数约为1.2亿，其中95%来自非共享的卷积层和全连通层。采用非共享卷积核的原因主要是由于排序人脸图像中不同区域存在不同的特征，不存在人脸局部稳定性假设，导致采用同一卷积核会丢失信息。另外，由于采用了不共享的卷积核，所以即使在同一图像的每个区域中存在不同的卷积核，训练时的参数量也会增加，但不影响特征提取时的计算速度(变化所需的卷积核确定后，与变化相关的原始图像不影响模型的使用。由于我们采用的数据量很大，在不影响模型精度的情况下，也可以保证很好地进行不共享的卷积计算。

除了不共享的卷积外，该模型还采用了dropout方法，避免了模型的过拟合。这个方法只在F7的时候使用。第一个卷积层后面还使用了对应的max池化层。池化可以使模型具有一些不变性，但提高模型的鲁棒性。但是游泳池化有时也会导致特征的缺失。因此，该模型仅在第1层卷积层后使用了池化层。

除上述特点外，该网络与一般卷积网络相同，训练时采用交叉熵函数，采用SGD和反向传播的方法对模型进行训练，训练过程采用整流线型激活函数。另外，主图像的输入尺寸可以根据具体的输入而变化。

具体的卷积计算过程如下

C1:11x11的卷积核32个

m2:3x w3的池化层，stride=2

992336016个9X9的卷积核

16个4:9x 9卷积核，不共享参数

16个5:的7X7卷积核，不共享参数

16个6:的5X5卷积核，不共享参数

7:全连接层4096维(提取的面部特征) )。

F8: softmax分类层。 4030是因为在培训中采用的LFW数据中包含4030个people。

三.脸部归一化：

的归一化主要是在所有(0，1 )之间改变人脸特征值，避免光等其他因素的影响。其正规化是通过首先将各维正规化，将各维除以该维的最大值，然后将向量整体正规化来进行的。具体情况如下。

四.鉴定度量：

鉴定尺度是将归一化后的结果用于认证，也可以用于其他分类时的尺度，主要有助于相似度的计算。您可以处理图像来代替最后一个图层中的softmax图层，也可以使用度量来计算结果的相似度。其分类的测定方式主要有三种。 1 (内积，)体贴的长椅，w3 )天真的笔网络

1 .不介绍内积的直接计算：

.体贴的长椅方式如下。

在此，表示标准化的特征，是通过SVM学习的参数。

w3 .天真可爱的笔网：

通过使用配对图像进行训练，可以使用特征之间的绝对差异，而不是简单的逻辑差异。一样的

时由于两张图片虽然采用了相同的参数，但是由于要运算两次，所以其对应的网络计算量并无差异（原始处理两张图片相比）。该距离可以用来比较两张图片是不是一个人。其距离的具体计算方式为：

其中alpha是训练得到的。

五、实验：

通过实验可以发现通过3D对齐之后的识别在LFW数据集上可以达到97.35%，不做对齐的话只有87.9%。说明对齐的重要性，同时如果对齐后的数据直接采用SVM或者LBP传统方法只有91.4%也证明了深度学习的卷积网络在处理人脸识别问题的优势。

对于计算复杂度，该网络没有GPU加速的情况下提取的时间为0.18。