yolov3的基本工作原理,yolov3目标检测完整步骤

了解title: yolov3算法

date :2021-11-2114336045336042

tags:

TOC :真

此粘贴记录学习yolov3算法后的个人理解

首先我们来了解一下yolov3算法物体检测的具体流程：

前向传播：处理数据集的图像，填充变为大小相同的图像，强调操作数据。 (注意：处理后需要对label的) tx、ty、tw、th )进行相应的修改，并且需要用label提高可信度初始化为0 )将图像放入darknet53网络，依次输出三种不同标准的特征图偏移ty、tw、th、confidence、cls的计算公式：通过计算得到pre_x、pre_y、pre_w、pre_h ()

loss计算：将label转换为与tx、ty、tw、th、confidence、cls相同的格式，通过gt得到obj_mask、noobj_mask数组。 (有物体的grid_cell，[noobj_mask]为1 ) pre_x，pre_y，pre_w，用Pre_h和gt_bbox计算iou，将没有物体但iou大于thresh的grid_cell复位为1 ()，即，该gt_bbox跟在他之后使loss回归计算(loss=位置误差分类yolov3主要改进使用darknet53主干网，有更好的特征提取能力，加强小物体的检测能力设置3种不同规格的anchor、3种scale，分别分配3种不同尺度的anchor使用不同的特征将多分类任务分解为多个二分类进行判断(sigmoid )1.darknet53主干网络yolov3使用Darknet53主干网络，与v2的darknet19相比添加了残差链路模块，为3*3 将置换为padding=1的卷积层的13*13的性能贴图进行2倍上采样和26*26的拼接，26*26的性能贴图上采样和52*52的拼接，浅层网加强对物体的模型检测。

注意：使用11卷积减少训练参数，最终输出的功能贴图通道数为(3) 80 )5) )=255

在这里附上他人流程图的地址

2 .偏移量的计算

在此，sigmoid函数的作用是将预测框的中心锁定在实框内部，加快网络前期的收敛速度。

以后计算loss时，通过逆导出该公式，计算出tx、ty、tw、th的值和网络输出的x、y、w、h，计算损失。

3 .利用k均值聚类获得的anchor yolov3将利用v2的k均值聚类用于coco数据集获得的九个不同的anchor分成三组，分别将大中小三种不同规格的物体划分为三组

4 .损失计算

对于有物体的grid_cell计算位置误差，对于没有物体的grid_cell只计算可靠度误差

注： yolov3仅将实际物体中心所在的grid_cell视为有该物体，认为没有剩下。如果存在多个形状正好与一个grid_cell相似的物体，则yolov3缺省地复盖先前物体的信息。

位置误差使用MSE损失函数，通过乘以(2-w*h )项增加模型对小框的惩罚，可靠度和分类误差使用BCE损失函数，两者计算合计

是的，yolov3差不多结束了。如果有什么错误的问题的话，谢谢你拿出来