接棒手(yolov3是什么语言)

作者| Amusi

编辑|群集结束

今天的刷屏动态一定是YOLOv4！

在这篇文章中，阿莫西会告诉你在别处看不到的东西(大神接棒)。欢迎继续阅读！

此前，YOLO系列(v1-v3)的作者Joe Redmon宣布不再继续CV方向的研究，在学术界引起轩然大波。YOLO的父亲宣布退出简历，并承认他不能忽视自己工作的负面影响：

推文链接：https://twitter.com/jeremyphoward/status/1230610470991589376

阿墨西故意去谷歌学术搜索YOLOv1-v3的参考文献，参考文献总数超过16000篇！

一个

大神，拿去吧！YOLOv4来了！当人们以为再也见不到YOLOv4的时候，鹅今天来了！

YOLOv4的作者阵容中没有Joe Redmon，这也印证了大神曾经说过不会继续CV研究的消息。但是杜牧有一篇YOLO之父乔雷德蒙的论文。为什么它的名字敢叫YOLOv4？你不怕被喷吗？

在这里，阿墨西花一点时间向大家介绍这个有趣的事情。

先说：大神接棒。

停了两年多的YOLO github官网正式更新了README，那么更新了什么呢？继续往下看。

YOLO官方网站：https://github.com/pjreddie/darknet

YOLO官方github正式加入了YOLOv4的论文和代码链接，这也意味着YOLOv4得到了Joe Redmon的认可，同时也代表了Yolov4的止步与合作。

关于YOLOv4，阿墨西曾经写过这样一篇文章进行预宣传(现在想想，应该是全网介绍的第一篇):在等待YOLOv4的同时，还在更新中。

YOLOv4的第一部作品是Alexey Bochkovskiy。用过YOLO的同学，尤其是用过Windows版YOLO的同学，一定很熟悉这个名字！

因为他是另一个github版本darknet的维护者，这是YOLOv4的代码基础：

https://github.com/AlexeyAB/darknet

根据阿莫西的猜测，阿列克谢波奇科夫斯基是一位独立的研究者，在这里我们更愿意称之为YOLO接受者和YOLO社区推动者。在这里我不会过多重复Alexey。想知道的同学可以看看：在等YOLOv4的同时，还在更新中。

值得一提的是，这个版本的darknet提交次数已经达到了1777次。想象一下，如果你每天提交一次更新，那么你需要持续更新近五年！

一般我们只用两个字来形容这种人：代码怪物！

2 YOLOv4车身

论文：https://arxiv.org/abs/2004.10934

代码：https://github.com/AlexeyAB/darknet

每个人一定都被文章开头的图片所吸引。图片右上角的YOLOv4好亮。AP越高，FPS越快！而YOLO之所以被大家追捧的原因之一就是它的快速和精准。

COCO上的YOLOv4可以达到43.5% AP，速度高达65 FPS！

YOLOv4的特点是有一个主控，俗称堆叠。然而，能取得如此高的性能，最终一定是不断试错、不断叠加、不断调整参数的结果，这是笔者所称赞的。我们来看看都堆放了哪些材料：

加权残差连接(WRC)跨阶段部分连接(CSP)跨小批量归一化(CmBN)自我对抗训练(SAT)错误激活镶嵌数据增强

egularizationCIoU loss

本文的主要贡献如下：

1. 提出了一种高效而强大的目标检测模型。它使每个人都可以使用1080 Ti或2080 Ti GPU 训练超快速和准确的目标检测器（牛逼！）。

2. 在检测器训练期间，验证了SOTA的Bag-of Freebies 和Bag-of-Specials方法的影响。

3. 改进了SOTA的方法，使它们更有效，更适合单GPU训练，包括CBN [89]，PAN [49]，SAM [85]等。文章将目前主流的目标检测器框架进行拆分：input、backbone、neck 和 head 具体如下图所示：

对于GPU，作者在卷积层中使用：CSPResNeXt50 / CSPDarknet53

对于VPU，作者使用分组卷积，但避免使用（SE）块-具体来说，它包括以下模型：EfficientNet-lite / MixNet / GhostNet / MobileNetV3

作者的目标是在输入网络分辨率，卷积层数，参数数量和层输出（filters）的数量之间找到最佳平衡。文中称：CSPDarknet53在检测上的表现要优于CSPResNext50，关于CSP，不了解的同学可以看一下这篇文章：《增强CNN学习能力的Backbone:CSPNet》

总结一下YOLOv4框架：

Backbone：CSPDarknet53Neck：SPP，PANHead：YOLOv3

YOLOv4 = CSPDarknet53+SPP+PAN+YOLOv3

其中YOLOv4用到相当多的技巧：

用于backbone的BoF：CutMix和Mosaic数据增强，DropBlock正则化，Class label smoothing用于backbone的BoS：Mish激活函数，CSP，MiWRC用于检测器的BoF：CIoU-loss，CmBN，DropBlock正则化，Mosaic数据增强，Self-Adversarial 训练，消除网格敏感性，对单个ground-truth使用多个anchor，Cosine 大力的红酒 scheduler，最佳超参数，Random training shapes用于检测器的Bos：Mish激活函数，SPP，SAM，PAN，DIoU-NMS

看看YOLOv4部分组件：