首页 > 编程知识 正文

yolov3代码详解,yolov4的缺点

时间:2023-05-04 08:11:36 阅读:11605 作者:384

一、YOLOV3比之前的版本有什么改进措施?

a ) 1、通过加入FPN结构2并使用残差结构,能够构建更深的网络结构,从darknet19变为darknet53。

二、如何理解anchor boxes的作用?

(1、anchor box最先出现在faster-rcnn上,但最初的目标检测是以金字塔多尺度遍历滑动窗口的方式,对每个尺度判断“此尺度的此位置是否有识别的目标”非常沉重

fast-rcnn倡导的RPN是conv1x1,其中一个conv3x3并排放置,在预测anchor中是否包含目标的同时,预测目标边框距离固定anchor有多远。

因此,anchors的作用一方面代替了耗时的显式密集滑动窗方法,另一方面公式代替了显式SSP,解决了多尺度问题,每个特征图上的点对应于几个anchors,这些anhors

在yolo模型中,anchors的作用也很相似。

当然,anchors的优缺点如下。

1 .好处:

(1)使用anchor机制生成密集的anchor box,使网络能够直接在此基础上进行目标分类和边界框坐标回归;

)2)密集的anchor box可以有效提高网络目标的召回能力,对小目标的检测有非常明显的提高。

2 .缺点:

) anchor机制要求设置超参。 “比例”和“纵横比”aspect ratio很难设计。 这需要很强的先验知识。

)2)冗馀框非常多)一张图片内的目标只是有限的,每个anchor设置大量的anchor box会产生大量的easy-sample,即完全不包含目标的背景框。 这引起正负样本严重失衡的问题,也是one-stage算法难以超越two-stage算法的原因之一。

)3)网络实质上看不到anchor box。 基于anchor box进行边界回归,就像范围小时的强制记忆。

三.如何实现anchor boxes的

答:yolo上anchor box的第一个版本参考了RPN网络进行了一些优化。 RPN网络选择三组固定大小的长宽比分别为2:1、2:1和2:1,每个特征图上的点对应于这九个anchor boxes,yolo在这一点上进行了改进,yolo

四.坐标预测方式

1、根据预测目标和anchor的偏差进行预测,公式如下。

这里为什么选择sigmoid函数作为中心点坐标预测方式? 这种目的是将目标偏差限制在一个蜂窝小区的范围内,sigmoid可能的值范围是[ 0,1 ]。

五.损失函数

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。