首页 > 编程知识 正文

yolo算法的原理与实现,yolo算法实现具体步骤

时间:2023-05-05 20:33:24 阅读:186264 作者:422

yolo算法介绍

(2020-06-06 16:49:28 )

在揭示了Yolo模型之后,必须再次感慨人类的智慧,是一个巧妙的模型。

要理解Yolo,首先要弄清楚Yolo会解决什么问题,解决这个问题必须做什么。

因为Yolo是多目标检测,所以需要解决两个问题。

1 )可以从一幅图像中识别多个不同类型的物体

2 )然后用一个框分割一个个物体,得到物体的尺寸。

直观地看这两个问题,一个是分类问题,另一个是回归问题。 分类问题是指可以从图像中识别出不同的物体类型,回归问题是指可以通过非线性拟合计算出物体的尺寸坐标。

通过掌握问题解决的本质,可以明确示例培训是如何设计的。 分类问题是通常的图像识别,但在回归问题中,需要用恰到好处的边框包围识别目标物。 这个框的尺寸可以作为目标值。 这将建立输入和输出之间的关系。 输入是图像,输出是种类和尺寸。

要对图像中的物体进行分类,首先要解决如何从图像中发现该物体,最直观的方法是用不同大小的框进行扫描。 此框称为窗口,与得到的物体的尺寸不同。 这就是RNN的方法,但是这个方法计算量很大,所以出现了Yolo。 其核心思想体现在如何从一张图像中准确地获得目标上。 基本的思路是,首先将图像像围棋方格一样进行划分,然后以每个网格为中心进行目标检测。 请注意,此处的网格仍然是窗口的概念,不是物体大小。 具体过程是这样的。 训练是针对每个网格进行的,该网格能否表示某个物体和物体尺寸是在训练集中获得的。 预测也是按网格进行的。

这样,如果说识别了有多个网格的物体,该如何处理就有了问题。 这里使用基于IOU的极大值以外的抑制算法。 找出最合理的框框,以得分最高的为准,将同类且IOU大于0.5的视为同一物体,认为同类IOU小于0.5的为统一物体,但可能出现在照片的不同位置。

之后,人们发现了如果在同一个格子中检测到两个物体怎么办的问题。 这提出了Anchor

box的概念是格子之前的输出是物体种类的信息,但它不是现在,可能是2个或3个。 这时,发生了新的问题。 有这么多事先画好的预选框,各种目标都有可能重叠。 怎么合理分配呢? 这是聚类和金字塔技术相结合的方法:

1 )聚类是指根据尺寸自动分类不同的预选框

2 ) Yolo根据模型建立金字塔模型,将不同的预选框按大小分配给不同的特征层。

据此,大尺寸在深层识别,小尺寸在浅层识别,还实现了语义语境分析功能,最终得到了完善的多目标检测算法。

市场占有率:

我喜欢

0

赠送金笔

正在加载,请稍等……。

正在加载注释,请稍候.

发表评论

登录名:密码:找回密码注册,记住登录状态

昵称:

评论转载这篇博文

发表评论

以上网友发言仅表达了其个人观点,并不代表新浪网的观点和立场。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。