fasterrcnn详解,maskrcnn改进

RCNN是一部详细阐明RCNN即region proposals (候选区域) CNN，将CNN导入目标检测区域的开山之作(2014年)，目标检测效果大幅提高，之后变化更好的Fast RCNN、fare

以下，按照RCNN作业顺序依次介绍

1 .生成候选区域获取候选区域的最直接方法是滑窗法，而滑动窗口法则是以一定大小遍历http://www.Sina.com/http://www.Sina.com /

因此，一般使用3358www.Sina.com/。候选区域算法可以通过使用图像分割算法识别潜在物体，并将颜色和纹理可能相似的小区域合并，得到很多候选区域。这些候选区域与实际物体的匹配度可能不是很高，但3358www.Sina.com/只要满足要求即可

目前有许多成熟的生成候选区域的算法，小窗口是其中一种高效算法。

选择搜索伪代码如下整张图片

输入(图像image输出)物体的可能位置集合L-----使用图像分割算法获取初始候选区域R=(R1，r2，RN的rj(inr:计算相似度s(ri，rj ) s=s(ri， rj ) endforwhiles:(**图2** )那样取得s中的最大类似度，s_max(ri，rj )=max(S s(rj，r* )计算与所有rt相邻的区域的类似度，集合s s=ss(rt，r* )将新生成的区域rt添加到候选区域r中。 r=来自R=R rtend while候选区域r的所有可能的边界框集合lreturnl------------当然

2 .特征提取通过上述候选区域生成算法得到2000个左右的候选框，试图通过CNN获取其中的特征，但很多CNN网络对输入图像的尺寸有一定的要求，因为所获取的图像尺寸不一定，所以对图像http://www

2.1定标处理定标处理有以下方法。

候选区域（Region Proposal）算法直接按所需尺寸勉强缩放即可

只要有一个候选区域图像失真可能影响CNN的训练精度，这种情况下也可以考虑各同性缩放，其中又可分为两类：

a .先扩展后裁剪：在原图中将bounding box扩展到所需大小，输入CNN

b .先裁剪再扩展：裁剪边界框图像，然后用边界框的平均颜色填充

2.2 CNN特征提取假设采用结构相对简单的AlexNet，但考虑到训练数据较少，从一开始就训练随机初始化参数，由于数据不够，最终检测效果较差。因此，使用已经训练好的AlexNet进行召回率（也叫查准率），进行Selective Search（选择性搜索），只需替换最后一层即可，位于（伪代码可以联系上图更容易理解）

[导出外链图像失败。源站可能有防盗链机制。建议保存图像并直接上传。 (img-651ZqmvH-1594719524982 ) ) 3359 S1.ax1x.com/2020/07/14/uu c9m v.png )

训练中需要一些正样本和负样本，人工标记的数据中标记了正确的边界框。我们之前使用selective search算法选择了2000个左右的候选框架。然后，将候选框中与人工标记的矩形框重叠的区域缩放处理大于0.5的标记为正样本。否则，标记，然后用这些样本训练CNN网络就可以了。

3 .分类判定上述CNN训练结束后，可以对矩形框中的物体进行各项异性缩放。这里需要使用各项同性缩放进行类别判定吗？这不是多余的吗？原因是CNN需要大量的训练数据，训练数据过少容易出现迁移学习的现象，而传统的SVM更适合fine-tuning训练，这里的类别判断使用SVM。

我们之前训练的AlexNet的最后一层在这里也不需要使用。仅使用上一层输出的4096维特征向量作为输入。实际上，以前训练的神经网络用作特征提取器，不直接用于分类。针对每个物体类训练svm分类器，将上述特征输入svm即可。

4 .位置微调最后使用线性回归器对候选框进行微调，IoU大于0.6的为正样本，否则为负样本。