yolo算法的原理与实现,yolo算法实现具体步骤

yolo算法介绍

(2020-06-06 16:49:28 )

在揭示了Yolo模型之后，必须再次感慨人类的智慧，是一个巧妙的模型。

要理解Yolo，首先要弄清楚Yolo会解决什么问题，解决这个问题必须做什么。

因为Yolo是多目标检测，所以需要解决两个问题。

1 )可以从一幅图像中识别多个不同类型的物体

2 )然后用一个框分割一个个物体，得到物体的尺寸。

直观地看这两个问题，一个是分类问题，另一个是回归问题。分类问题是指可以从图像中识别出不同的物体类型，回归问题是指可以通过非线性拟合计算出物体的尺寸坐标。

通过掌握问题解决的本质，可以明确示例培训是如何设计的。分类问题是通常的图像识别，但在回归问题中，需要用恰到好处的边框包围识别目标物。这个框的尺寸可以作为目标值。这将建立输入和输出之间的关系。输入是图像，输出是种类和尺寸。

要对图像中的物体进行分类，首先要解决如何从图像中发现该物体，最直观的方法是用不同大小的框进行扫描。此框称为窗口，与得到的物体的尺寸不同。这就是RNN的方法，但是这个方法计算量很大，所以出现了Yolo。其核心思想体现在如何从一张图像中准确地获得目标上。基本的思路是，首先将图像像围棋方格一样进行划分，然后以每个网格为中心进行目标检测。请注意，此处的网格仍然是窗口的概念，不是物体大小。具体过程是这样的。训练是针对每个网格进行的，该网格能否表示某个物体和物体尺寸是在训练集中获得的。预测也是按网格进行的。

这样，如果说识别了有多个网格的物体，该如何处理就有了问题。这里使用基于IOU的极大值以外的抑制算法。找出最合理的框框，以得分最高的为准，将同类且IOU大于0.5的视为同一物体，认为同类IOU小于0.5的为统一物体，但可能出现在照片的不同位置。

之后，人们发现了如果在同一个格子中检测到两个物体怎么办的问题。这提出了Anchor

box的概念是格子之前的输出是物体种类的信息，但它不是现在，可能是2个或3个。这时，发生了新的问题。有这么多事先画好的预选框，各种目标都有可能重叠。怎么合理分配呢？这是聚类和金字塔技术相结合的方法：

1 )聚类是指根据尺寸自动分类不同的预选框

2 ) Yolo根据模型建立金字塔模型，将不同的预选框按大小分配给不同的特征层。

据此，大尺寸在深层识别，小尺寸在浅层识别，还实现了语义语境分析功能，最终得到了完善的多目标检测算法。

市场占有率：

我喜欢

赠送金笔

正在加载，请稍等……。

正在加载注释，请稍候.

发表评论

登录名：密码：找回密码注册，记住登录状态

昵称：

评论转载这篇博文

发表评论

以上网友发言仅表达了其个人观点，并不代表新浪网的观点和立场。