首页 > 编程知识 正文

fasterrcnn详解,maskrcnn改进

时间:2023-05-05 02:26:26 阅读:51255 作者:4864

RCNN是一部详细阐明RCNN即region proposals (候选区域) CNN,将CNN导入目标检测区域的开山之作(2014年),目标检测效果大幅提高,之后变化更好的Fast RCNN、fare

以下,按照RCNN作业顺序依次介绍

1 .生成候选区域获取候选区域的最直接方法是滑窗法,而滑动窗口法则是以一定大小遍历http://www.Sina.com/http://www.Sina.com /

因此,一般使用3358www.Sina.com/。 候选区域算法可以通过使用图像分割算法识别潜在物体,并将颜色和纹理可能相似的小区域合并,得到很多候选区域。 这些候选区域与实际物体的匹配度可能不是很高,但3358www.Sina.com/只要满足要求即可

目前有许多成熟的生成候选区域的算法,小窗口是其中一种高效算法。

选择搜索伪代码如下整张图片

输入(图像image输出)物体的可能位置集合L-----使用图像分割算法获取初始候选区域R=(R1,r2,RN的rj(inr:计算相似度s(ri,rj ) s=s(ri, rj ) endforwhiles:(**图2** )那样取得s中的最大类似度,s_max(ri,rj )=max(S s(rj,r* )计算与所有rt相邻的区域的类似度,集合s s=ss(rt,r* )将新生成的区域rt添加到候选区域r中。 r=来自R=R rtend while候选区域r的所有可能的边界框集合lreturnl------------当然

2 .特征提取通过上述候选区域生成算法得到2000个左右的候选框,试图通过CNN获取其中的特征,但很多CNN网络对输入图像的尺寸有一定的要求,因为所获取的图像尺寸不一定,所以对图像http://www

2.1定标处理定标处理有以下方法。

候选区域(Region Proposal)算法直接按所需尺寸勉强缩放即可

只要有一个候选区域图像失真可能影响CNN的训练精度,这种情况下也可以考虑各同性缩放,其中又可分为两类:

a .先扩展后裁剪:在原图中将bounding box扩展到所需大小,输入CNN

b .先裁剪再扩展:裁剪边界框图像,然后用边界框的平均颜色填充

2.2 CNN特征提取假设采用结构相对简单的AlexNet,但考虑到训练数据较少,从一开始就训练随机初始化参数,由于数据不够,最终检测效果较差。 因此,使用已经训练好的AlexNet进行召回率(也叫查准率),进行Selective Search(选择性搜索),只需替换最后一层即可,位于(伪代码可以联系上图更容易理解)

[导出外链图像失败。 源站可能有防盗链机制。 建议保存图像并直接上传。 (img-651ZqmvH-1594719524982 ) ) 3359 S1.ax1x.com/2020/07/14/uu c9m v.png )

训练中需要一些正样本和负样本,人工标记的数据中标记了正确的边界框。 我们之前使用selective search算法选择了2000个左右的候选框架。 然后,将候选框中与人工标记的矩形框重叠的区域缩放处理大于0.5的标记为正样本。 否则,标记,然后用这些样本训练CNN网络就可以了。

3 .分类判定上述CNN训练结束后,可以对矩形框中的物体进行各项异性缩放。 这里需要使用各项同性缩放进行类别判定吗? 这不是多余的吗? 原因是CNN需要大量的训练数据,训练数据过少容易出现迁移学习的现象,而传统的SVM更适合fine-tuning训练,这里的类别判断使用SVM。

我们之前训练的AlexNet的最后一层在这里也不需要使用。 仅使用上一层输出的4096维特征向量作为输入。 实际上,以前训练的神经网络用作特征提取器,不直接用于分类。 针对每个物体类训练svm分类器,将上述特征输入svm即可。

4 .位置微调最后使用线性回归器对候选框进行微调,IoU大于0.6的为正样本,否则为负样本。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。