显著性检验分析,显著性检验结果分析

转载请附链接，注明出处。

显著性对象检测综述

参考： http://mmcheng.net/zh/paper reading /

一、无心的黑猫等人的论文：Salient Object Detection: A Surve（简单归纳了文章中的我认为比较重要的部分）

本文的目的是全面回顾目标检测的最新进展，并将其与其他密切相关的领域联系起来，如通用场景分割、目标推荐生成和固定预测显著性。主要内容涉及)根源、关键概念和任务；)核心技术和主要建模趋势；)显著物体检测中的数据集和评估指标。提出了未来研究的逆向性等开放性问题。

1.介绍

11 什么是显著性物体

一般认为，良好的显著性检验模型至少应符合以下三个标准。 1 )良好检查)实际显著性区域丢失的可能性和背景被错误标记为显著性区域的可能性应该很低。 2 )高分辨率)显著的图像，需要具有高分辨率或全分辨率，以准确定位突出的物体，保持原始的图像信息；3 )计算效率)作为其他复杂过程的前端，这些模型应该快速检测显著区域。

1.3显著物体检测历史

(1) Itti等人提出的最早、经典的显著模型。如[24]一文掀起了横跨认知心理学、神经科学、计算机视觉等多个学科的第一波热潮。

)第二波热潮由wzdyl的[25]、[55]和Achanta等人的[56]掀起，他们将显著性检验定义为二元分割问题，从此出现了许多显著性检验模型。

)3)最近引入了第三波热潮，卷积神经网络(CNN )，特别是完全卷积神经网络(70 )。与许多基于比较线索的经典方法不同[1]，基于CNN的方法由于消除了对手工特征的需求，减轻了对核心偏见知识的依赖，被许多科研人员采用。基于CNN的模型通常包含数十万可变参数和可变感觉区大小的神经元。神经元具有广阔的接受范围提供全局信息，有助于更好地识别图像中最显著的区域。 CNN实现了前所未有的性能，逐渐成为显著的物体检测主流方向。

2. 现状调查

本节主要回顾三个部分。 1 )显著物体检测模型； 2 )应用3 )数据集。

2.1 经典模型（非常详细）

2.1.1 具有内在线索的基于块的模型

有两个缺点。 1 )高对比度边缘通常使物体突出而不是突出； 2 )强调物体边界不能很好地保存。为了克服这些问题，一些方法提出基于区域计算显著性。两个主要优点：1)区域的数量远远小于块的数量，这意味着开发高效快速算法的可能性2 )可以从区域中提取更多的信息功能，进行引导以更好地表达。

2.1.2 具有内在线索的基于区域的模型（图4）

基于区域的显著性模型的主要优点：1)采用补前，提高整体性能是其主要优点2 )区域提供了比像素和颜色块更复杂的线索(如颜色直方图)，可以更好地呈现场景的显著对象在生成全分辨率显著性图的情况下，可以通过区域级计算的显著性显著降低计算成本。

2.1.3 具有外部线索的模型（图5）

2.1.4 其他经典模型（图6）

局部化模型、分割模型、监督模式和无监督模式、聚合和优化模型

2.2 基于深度学习的模型

2.2.1基于CNN（经典卷积网络）的模型

由于CNN大幅降低了计算成本，并且具有多阶段特征，因此即使存在阴影或反射，CNN也可以更适当地定位检测到的明显区域的边界。但是，由于使用了MLP (多层感知器)，因此不能保持CNN的特征空间信息。

2.2.2 基于FCN（完全卷积网络）的模型

该模型具有存储空间信息的能力，实现了点对点学习和端到端训练策略，与CNN相比大大降低了时间成本。但是，在有透明物体的场景、前景和背景之间的相同对比度、复杂背景等情况下，无法检测到显著的物体。

元素：PI=像素、PA=贴片、PE=区域、前缀m和h分别表示多尺度和层次版本。

假设：CP=中心预，G=全局对比度，L=局部对比度，ED=边缘密度，B=背景预，F=预聚焦，O=预物体，CV=预凸度，CS=中心周围科

聚合/优化: LN=线性，NL=非线性，AD=自适应，RI=分层，BA=贝叶斯，GMRF=高斯MRF，EM=能量最小化，LS=最亮歌曲乘解

线索 :GT=地面真实值注释

，SI=相似图像，TC=时间线索，SCO=显著性实现，DP=深度，LF=光场。

对于显著性假设 ： P=通用属性，PRA=预注意线索，HD=高维特征空间中的判别性，SS=显著性相似性，CMP=显著性提示的互补，SP=采样概率，MCO=运动相干性，RP=重复性，RS=区域相似度，C=相应，DK=领域知识。

其他： CRF=条件随机场，SVM=支持向量机，BDT=提升决策树，RF=随机森林

4 数据集和评估措施

4.1 显著对象检测数据集

早期的带有包围框的突出物体图像：MSRA-A和MSRA-B

使用像素方式的二进制掩码来注释显著对象：ASD和DUT-OMRON

具有复杂和杂乱背景中的多个对象的数据集:[22]、[23]、[26]

4.2 评估措施（5个）

用S表示归一化为[0,255]的预测显著图，G是显著对象的地面正式二进制掩模

（1） 精确召回（PR）。首先将显著图S转化为二进制掩码M，然后通过将M与地面真值G进行比较来计算Precission和Recall：

（2） F值：通常Precission和Recall都不能完全评估显著图的质量，为此提出F值作为Precission和Recall的非负权重的集权跳河平均：

（3） ROC（Receiver Operating Characteristic）曲线：是以假正率（FP_rate）和假负率（TP_rate）为轴的曲线

（4）ROC曲线下面积(AUC)：AUC越大性能越好

（5） 平均绝对误差（MAE）：进行更全面的比较。

图12，比较流行的显著性对象检测数据集：

二、传统显著性检测内容补充（论文中的分类和自己平时习惯不一致，所以重新收集资料整理了一下）

常用显著性检测方法：

1. 认知模型

几乎所有模型都直接或间接地受认知模型启发而来，其一大特点是与心理学和神经学相结合。Itti模型（使用三个特征通道：颜色、属性、方向）是这一类模型的代表，也是后来很多衍生模型的基础

2. 信息论模型

本质是最大化来自所处视觉环境的信息，其中最有影响力的模型是AIM模型。

3. 图论模型

基于图轮的显著性模型把眼动数据看成时间序列，使用了隐马尔科夫模型、动态贝叶斯网和条件随机场等方法。图模型可以对复杂的注意机制建模，因此能取得较好的预测能力，缺点在于模型的高复杂度，尤其涉及训练和可读性时。典型模型有：GBVS等

4. 频域模型

基于频谱分析的显著性模型，形式简洁，易于解释和实现，并且在注意焦点预测和显著区域检测方面取得了很大的成功，但其生物合理性不是非常清楚。经典模型有：频谱残差的显著性检测模型（纯数学计算方法）。

参考资料链接：

http://www.docin.com/p-915060851.html

http://www.doc88.com/p-4993561181219.html

http://blog.csdn.net/u012507022/article/details/52863461

三、基于深度学习的显著性检测内容补充（论文是2014年所写，关于深度学习部分不够完善，因此在此又补充了一下）

基于深度学习的显著性目标检测研究发展初期从物体检测神经网络到OverFeat，一直难以取得理想的效果。2014年R-CNN的诞生成为第一个真正可以工业级应用的方案，其在VOC2007测试集的mAP提升至66%。但R-CNN框架仍然存在很多问题：

1) 训练分为多个阶段，步骤较为繁琐：微调网络+训练SVM+训练边框回归器

2) 训练耗时，占用磁盘空间大：5000张图片产生几百G的特征文件

3) 速度慢：使用GPU，VGG-16模型处理一张图像需要47s

截止目前，基于深度学习的显著性目标检测研究可以分为基于区域建议的深度学习目标检测和基于回归的深度学习目标检测两个类别。

基于区域建议的深度学习目标检测方法有：R-CNN、SPP-net、FastR-CNN、Faster R-CNN、R-FCN等。

1) R-CNN(Regions with CNN features)重复计算，时间、空间代价较高；

2) SPP-net(Spatial Pyramid Pooling)强化了CNN的使用，允许输入大小不一致的图片，进一步强调了CNN特征计算前移、区域处理后移的思想，极大节省计算量，但不是端到端的模型且CNN特征提取没有联动调参数；

3) FastR-CNN的出现解决了前两者重复计算的问题，实现了区域建议到目标检测一端的卷积共享，首次提出的RoI Pooling技术极大地发挥区域后移的优势，加快了训练速度，采用VGG-16作为CNN网络模型，联动调用参数提升了实验效果，但是依然没有实现端到端的模型，对SS区域建议依赖严重；

4) Faster R-CNN弃用选择性搜索，提出了RPN网络来计算候选框，使用端到端的网络进行目标检测，无论在速度上还是在精度上，都得到了极大的提高，但在速度上并不能满足实时的需求，对每个建议分类计算量仍较大，功能上没有进入实例分割阶段。

基于回归的深度学习目标检测方法有：YOLO、SSD、G-CNN、NMS等。

1) YOLO(You Only Look Once)将目标检测任务转换成回归问题，大大简化了检测的过程、加快了检测的速度，但预测目标窗口时使用的是全局信息，冗余度高，且没有区域建议机制后检测精度不高；

2) SSD（Single ShotMultibox Detector）预测某个位置时使用的是该位置周围的特征，结合YOLO的回归思想以及FasterR-CNN中的候选区域机制，既保持了YOLO速度快的特性，也保证了精确定位；

3) G-CNN着力于减少初始化建议数量，使数以万计的建议变成极少的初始格网，提升了检测速度；

4) NMS(Non Maximum Suppression)则通过迭代的形式去除重复候选框，取置信率最大的框。

当前实际应用中，基于区域建议的深度学习目标检测使用更为广泛。

当前基于深度学习的显著性检测研究方法：

R-CNN系列显著性目标检测框架和YOLO显著性目标检测框架给了我们进行基于深度学习的目标检测两个基本框架。目前研究人员基于这些框架从其他方面入手提出一系列提高目标检测性能的方法。如：难样本挖掘、多层特征融合、使用上下文信息、更深网络学习的特征等。