图像形状特征提取,图像特征识别算法

单击上面的3358www.Sina.com/，然后选择敏感的火学视觉或3358www.Sina.com/

重磅干货，第一时间送到正文后|新机愿景

研究图像特征检测已经有一段时间了，由于图像特征检测的方法很多，而且还有各种算法的变形，很难在短时间内全面了解，只是学习研究了主流特征检测算法的原理。一般而言，图像的特征包括颜色特征、纹理特征、形状特征、局部特征点等。其中局部特征具有良好的稳定性，不易受到外界环境的干扰，本文也总结了这方面的知识。

1

星标

图像特征提取是图像分析和图像识别的前提，是高维图像数据简化表示的最有效方式，从一张图像的MN3数据矩阵中看不到任何信息，因此必须从这些数据中提取图像中的重要信息、一些基本要素及其关系

局部特征点是图像特征的局部表现，总之图像只有局部特殊性，只适合图像匹配、检索等应用。不太适合理解图像。后者关心全球特征，如颜色分布、纹理特征和主要物体的形状。全球特征易受环境干扰、光照、旋转、噪声等不利因素影响。相比之下，局部特征点往往对应于图像中的几条线的交叉，在明暗变化的结构中，受到的噪声也较少。

斑点和角是两种局部特征点。斑点是指草原的树和房子等与周围有颜色和灰度差异的区域。这是一个区域，因此比拐角处的噪音更强，稳定性更好。转角点是图像中一个物体的转角或线条之间的交叉点。

2

置顶

2.1

LoG和DoH

斑点检测的方法主要有利用gddqz合适的大船算子进行检测的方法[log]，以及利用像素点Hessian矩阵[二阶微分]及其行列式值的方法[DOH]。

LoG的方法已经在斑点检查这篇入编的文章中详细叙述了。二维gddqz函数合适的大船核与斑点相似，可以利用卷积求出图像中斑点状的结构。

DoH法是指利用图像点的二阶微分Hessian矩阵：

Hessian矩阵的行列式的值也同样反映了图像局部的结构信息。与LoG相比，DoH对图像中细长结构斑点有较好的抑制作用。

无论是LoG还是DoH，检测图像中的斑点都分为以下两个步骤。

1 )使用不同制作模板，卷积运算图像；

2 )在图像的位置空间和尺度空间中寻找LoG和DoH的响应峰值。

2.2

SIFT

2004年，Lowe提高了高效的尺度不变特征变换算法(SIFT )，利用原始图像和gddqz核卷积构建尺度空间，在gddqz差分空间金字塔上提取了尺度不变性的特征点。该算法具有一定的仿射不变性、视角不变性、旋转不变性和光照不变性，因此在提高图像特征方面应用最为广泛。

该算法大致可以归纳为三个步骤。 1 )构建gddqz差分金字塔； 2 )特征点检索3 )特征说明。

第一步，使用组和层结构构建具有线性关系的金字塔结构，以便可以在连续的gddqz核心尺度上找到特征点。优于LoG的是，用一阶gddqz差分逼近gddqz合适的大船核，大大减少了运算量。

在步骤2的特征点搜索中，主要的步骤是极值点的插值。因为在离散空间中，局部极值点可能不是真正意义上的极值点，而真正的极植点可能落入离散点的间隙。因此，插补这些间隙的位置，求出极值点的坐标位置。

第二步的另一个重点是删除具有边缘效应的点。仅忽略DoG响应不足的点是不够的，因此DoG的值会受到边的影响。边缘上的点不是斑点，但DoG响应也很强。所以我们要删除这一部分。我们利用跨边缘的地方，在边缘方向和垂直边缘方向上表现出极大和极小的主曲率这一特性。因此，通过计算特征点处的主曲率之比，可以区分是否在边缘上。这在理解的基础上请参考Harris转折点的求解方法。

最后一步是特征点的特征描述。关于特征点的方向的求出方法，需要对特征点附近的点的梯度方向进行直方图统计，可以选择直方图中比重最大的方向作为特征点的主方向，或者选择辅助方向。计算特征向量时，必须沿主方向旋转局部图像，然后进入邻域内的梯度直方图统计(4x4x8)。

2.3

超人力霸王

2006年，Bay和Ess等人基于SIFT算法的构想，提出了加速鲁棒特征(SURF )。该算法主要针对SIFT算法速度过慢、计算量大的缺点，采用近似Harr小波方法提取特征点。该方法是一种基于Hessian行列式(DoH )的斑点特征检测方法。通过利用不同尺度积分图像，可以有效地计算近似Harr小波值
，简化了二阶微分模板的构建，搞高了尺度空间的特征检测的效率。

SURF算法在积分图像上使用了盒子滤波器对二阶微分模板进行了简化，从而构建了Hessian矩阵元素值，进而缩短了特征提取的时间，提高了效率。其中SURF算法在每个尺度上对每个像素点进行检测，其近似构建的Hessian矩阵及其行列式的值分另为：

其中Dxx,Dxy和Dyy为利用盒子滤波器获得的近似卷积值。如果c(x,y,σ)大于设置的门限值，则判定该像素点为关键字。然后与SIFT算法近似，在以关键点为中心的3×3×3像素邻域内进行非极大值抑制，最后通过对斑点特征进行插值运算，完成了SURF特征点的精确定位。

而SURF特征点的描述，则也是充分利用了积分图，用两个方向上的Harr小波模板来计算梯度，然后用一个扇形对邻域内点的梯度方向进行统计，求得特征点的主方向。

3

角点检测的原理与举例

角点检测的方法也是极多的，其中具有代表性的算法是Harris算法与FAST算法。

这两个算法我都有专门写过博文来描述其算法原理。Harris角点和FAST特征点检测。

3.1  Harris角点特征提取

Harris角点检测是一种基于图像灰度的一阶导数矩阵检测方法。检测器的主要思想是局部自相似性/自相关性，即在某个局部窗口内图像块与在各个方向微小移动后的窗口内图像块的相似性。

在像素点的邻域内，导数矩阵描述了数据信号的变化情况。假设在像素点邻域内任意方向上移动块区域，若强度发生了剧烈变化，则变化处的像素点为角点。定义2×2的Harris矩阵为：

其中，Cx和Cy分别为点x=(x,y)在xx和y方向上的强度信息的一阶导数，ω(x,y)为对应位置的权重。通过计算Harris矩阵的角点响应值D来判断是否为角点。其计算公式为：

其中，det和trace为行列式和迹的操作符，m是取值为0.04~0.06的常数。当角点响应值大于设置的门限，且为该点邻域内的局部最大值时，则把该点当作角点。

3.2  FAST角点特征提取

基于加速分割测试的FAST算法可以快速地提取出角点特征。该算法判断一个候选点p是否为角点，依据的是在一个像素点p为圆心，半径为3个像素的离散化Bresenllam圆周上，在给定阈值t的条件下，如果在圆周上有n个连续的像素灰度值大于I(p)+t或小于I(p)−t。

针对于上面的定义，我们可以用快速的方法来完成检测，而不用把圆周上的所有点都比较一遍。首先比较上下左右四个点的像素值关系，至少要有3个点的像素灰度值大于I(p)+t或小于I(p)−t，则p为候选点，然后再进一步进行完整的判断。

为了加快算法的检测速度，可以使用机器学习ID3贪心算法来构建决策树。这里需要说明的是，在2010年Elmar和Gregory等人提出了自适应通用加速分割检测（AGAST）算法，通过把FAST算法中ID3决策树改造为二叉树，并能够根据当前处理的图像信息动态且高效地分配决策树，提高了算法的运算速度。

4

  二进制字符串特征描述子

可以注意到在两种角点检测算法里，我们并没有像SIFT或SURF那样提到特征点的描述问题。事实上，特征点一旦检测出来，无论是斑点还是角点描述方法都是一样的，可以选用你认为最有效的特征描述子。

特征描述是实现图像匹配与图像搜索必不可少的步骤。到目前为止，人们研究了各种各样的特征描述子，比较有代表性的就是浮点型特征描述子和二进帽字符串特征描述子。

像SIFT与SURF算法里的，用梯度统计直方图来描述的描述子都属于浮点型特征描述子。但它们计算起来，算法复杂，效率较低，所以后来就出现了许多新型的特征描述算法，如BRIEF。后来很多二进制串描述子ORB，BRISK，FREAK等都是在它上面的基础上的改进。

4.1 BRIEF算法

BRJEF算法的主要思想是：在特征点周围邻域内选取若干个像素点对，通过对这些点对的灰度值比较，将比较的结果组合成一个二进制串字符串用来描述特征点。最后，使用汉明距离来计算在特征描述子是否匹配。

4.2 BRISK算法

BRISK算法在特征点检测部分没有选用FAST特征点检测，而是选用了稳定性更强的AGAST算法。在特征描述子的构建中，BRISK算法通过利用简单的像素灰度值比较，进而得到一个级联的二进制比特串来描述每个特征点，这一点上原理与BRIEF是一致的。BRISK算法里采用了邻域采样模式，即以特征点为圆心，构建多个不同半径的离散化Bresenham同心圆，然后再每一个同心圆上获得具有相同间距的N个采样点。

由于这种邻域采样模式在采样时会产生图像灰度混叠的影响，所以BRISK算法首先对图像进行了gddqz平滑图像。并且使用的gddqz函数标准差σi与各自同心圆上点间距成正比。

假设在(N2)个采样点中任意选取一对采样点(pi,pj)，其平滑后的灰度值分别为I(pi,σi)和I(pj,σj)，则两点间的局部梯度为：

假设把所有采样点对构成的集合记为A，则

那么短距离采样点对构成的集合S以及长距离采样点构成的集合L分别为：

其中，通常设置距离阈值为

δmax=9.75δ,δmin=13.67δ，其中δ为特征点的尺度。

由于长距离采样点对含有更多的特征点角度信息，且局部梯度相互抵消，所以可以在集合L中计算出特征点的特征模式方向为：

然后将采样模式围绕特征点旋转角度α=arctan2(gy,gx)，进而特征描述子具有了旋转不变性。

最后，在旋转后的短距离采样点集合S内，对所有的特征点对(Piα,pjα)行像素灰度值比较，最终形成512比特的二进制字符串描述子。

4.3 ORB算法

ORB算法使用FAST进行特征点检测，然后用BREIF进行特征点的特征描述，但是我们知道BRIEF并没有特征点方向的概念，所以ORB在BRIEF基础上引入了方向的计算方法，并在点对的挑选上使用贪婪搜索算法，挑出了一些区分性强的点对用来描述二进制串。ORB算法的详细描述可以参考：ORB特征点检测。
4.4 FREAK算法
Fast Retina KeyPoint，即快速视网膜关键点。

根据视网膜原理进行点对采样，中间密集一些，离中心越远越稀疏。并且由粗到精构建描述子，穷举贪婪搜索找相关性小的。42个感受野，一千对点的组合，找前512个即可。这512个分成4组，前128对相关性更小，可以代表粗的信息，后面越来越精。匹配的时候可以先看前16bytes，即代表精信息的部分，如果距离小于某个阈值，再继续，否则就不用往下看了。

5

应用之图像匹配

图像匹配的研究目标是精确判断两幅图像之间的相似性。图像之间的相似性的定义又随着不同的应用需求而改变。例如，在物体检索系统中（找出含有亚伯拉罕·林肯的脸的图像），我们认为同一物体的不同图像是相近的。而在物体类别检索系统中（找出含有人脸的图像），我们则认为相同类的物体之间是相近的。

这里局部特征点的应用主要表现在第一种相似性上，也就是说我们需要设计某种图像匹配算法来判断两幅图像是否是对同一物体或场景所成的图像。理想的图像匹配算法应该认为两幅同一物体的图像之间相似度很高，而两幅不同物体的图像之间相似度很低，如下图所示。

由于成像时光照，环境，角度的不一致，我们获取的同一物体的图像是存在差异的，如同上图中的两辆小车的图像一样，角度不同，成像就不同。我们直接利用图像进行比较是无法进行判断小车是否为同一类的。必须进行特征点的提取，再对特征点进行匹配。

图像会存在哪些变换呢？一般来说包括了光照变化与几何变化，光照变化表现是图像上是全局或局部颜色的变化，而几何变化种类就比较多了，可以是平移、旋转、尺度、仿射、投影变换等等。所以我们在研究局部特征点时才要求特征点对这些变化具有稳定性，同时要有很强的独特性，可以让图像与其他类的图像区分性强，即类内距离小而类间距离大。

End

下载1：OpenCV-Contrib扩展模块中文版教程

在「敏感的火学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「敏感的火学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「敏感的火学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”pldzxc + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~