作者| Amusi
编辑|群集结束
今天的刷屏动态一定是YOLOv4!
在这篇文章中,阿莫西会告诉你在别处看不到的东西(大神接棒)。欢迎继续阅读!
此前,YOLO系列(v1-v3)的作者Joe Redmon宣布不再继续CV方向的研究,在学术界引起轩然大波。YOLO的父亲宣布退出简历,并承认他不能忽视自己工作的负面影响:
推文链接:https://twitter.com/jeremyphoward/status/1230610470991589376
阿墨西故意去谷歌学术搜索YOLOv1-v3的参考文献,参考文献总数超过16000篇!
一个
大神,拿去吧!YOLOv4来了!当人们以为再也见不到YOLOv4的时候,鹅今天来了!
YOLOv4的作者阵容中没有Joe Redmon,这也印证了大神曾经说过不会继续CV研究的消息。但是杜牧有一篇YOLO之父乔雷德蒙的论文。为什么它的名字敢叫YOLOv4?你不怕被喷吗?
在这里,阿墨西花一点时间向大家介绍这个有趣的事情。
先说:大神接棒。
停了两年多的YOLO github官网正式更新了README,那么更新了什么呢?继续往下看。
YOLO官方网站:https://github.com/pjreddie/darknet
YOLO官方github正式加入了YOLOv4的论文和代码链接,这也意味着YOLOv4得到了Joe Redmon的认可,同时也代表了Yolov4的止步与合作。
关于YOLOv4,阿墨西曾经写过这样一篇文章进行预宣传(现在想想,应该是全网介绍的第一篇):在等待YOLOv4的同时,还在更新中。
YOLOv4的第一部作品是Alexey Bochkovskiy。用过YOLO的同学,尤其是用过Windows版YOLO的同学,一定很熟悉这个名字!
因为他是另一个github版本darknet的维护者,这是YOLOv4的代码基础:
https://github.com/AlexeyAB/darknet
根据阿莫西的猜测,阿列克谢波奇科夫斯基是一位独立的研究者,在这里我们更愿意称之为YOLO接受者和YOLO社区推动者。在这里我不会过多重复Alexey。想知道的同学可以看看:在等YOLOv4的同时,还在更新中。
值得一提的是,这个版本的darknet提交次数已经达到了1777次。想象一下,如果你每天提交一次更新,那么你需要持续更新近五年!
一般我们只用两个字来形容这种人:代码怪物!
2 YOLOv4车身
论文:https://arxiv.org/abs/2004.10934
代码:https://github.com/AlexeyAB/darknet
每个人一定都被文章开头的图片所吸引。图片右上角的YOLOv4好亮。AP越高,FPS越快!而YOLO之所以被大家追捧的原因之一就是它的快速和精准。
COCO上的YOLOv4可以达到43.5% AP,速度高达65 FPS!
YOLOv4的特点是有一个主控,俗称堆叠。然而,能取得如此高的性能,最终一定是不断试错、不断叠加、不断调整参数的结果,这是笔者所称赞的。我们来看看都堆放了哪些材料:
加权残差连接(WRC)跨阶段部分连接(CSP)跨小批量归一化(CmBN)自我对抗训练(SAT)错误激活镶嵌数据增强
egularizationCIoU loss本文的主要贡献如下:
1. 提出了一种高效而强大的目标检测模型。它使每个人都可以使用1080 Ti或2080 Ti GPU 训练超快速和准确的目标检测器(牛逼!)。
2. 在检测器训练期间,验证了SOTA的Bag-of Freebies 和Bag-of-Specials方法的影响。
3. 改进了SOTA的方法,使它们更有效,更适合单GPU训练,包括CBN [89],PAN [49],SAM [85]等。文章将目前主流的目标检测器框架进行拆分:input、backbone、neck 和 head 具体如下图所示:
对于GPU,作者在卷积层中使用:CSPResNeXt50 / CSPDarknet53
对于VPU,作者使用分组卷积,但避免使用(SE)块-具体来说,它包括以下模型:EfficientNet-lite / MixNet / GhostNet / MobileNetV3
作者的目标是在输入网络分辨率,卷积层数,参数数量和层输出(filters)的数量之间找到最佳平衡。文中称:CSPDarknet53在检测上的表现要优于CSPResNext50,关于CSP,不了解的同学可以看一下这篇文章:《增强CNN学习能力的Backbone:CSPNet》
总结一下YOLOv4框架:
Backbone:CSPDarknet53Neck:SPP,PANHead:YOLOv3YOLOv4 = CSPDarknet53+SPP+PAN+YOLOv3
其中YOLOv4用到相当多的技巧:
用于backbone的BoF:CutMix和Mosaic数据增强,DropBlock正则化,Class label smoothing用于backbone的BoS:Mish激活函数,CSP,MiWRC用于检测器的BoF:CIoU-loss,CmBN,DropBlock正则化,Mosaic数据增强,Self-Adversarial 训练,消除网格敏感性,对单个ground-truth使用多个anchor,Cosine 大力的红酒 scheduler,最佳超参数,Random training shapes用于检测器的Bos:Mish激活函数,SPP,SAM,PAN,DIoU-NMS看看YOLOv4部分组件:
感受一下YOLOv4实验的充分性(调参的艺术)
感受一下性能炸裂的YOLOv4实验结果
论文篇幅很长,高达17页,干货满满!推荐大家阅读原文和源码进行深入理解。
跟我一起喊:大神接棒,YOLOv4 来了!
AI 科技评论系列直播
1、ACL 2020 - 复旦大学系列解读
直播主题:不同粒度的抽取式文本摘要系统
主讲人:jmdyb、ggdgq
直播时间:4月 25 日,(周一晚) 20:00整。
直播主题:结合词典的中文命名实体识别【ACL 2020 - 复旦大学系列解读之(二)】
主讲人:沉静的小鸽子, 大意的楼房
直播时间:4月 26 日,(周一晚) 20:00整。
直播主题:ACL 2020 | 基于对抗样本的依存句法模型鲁棒性分析
【ACL 2020 - 复旦大学系列解读之(三)】
主讲人:贪玩的八宝粥
直播时间:4月 27 日,(周一晚) 20:00整。
2、ICLR 2020 系列直播
直播主题:ICLR 2020丨Action Semantics Network: Considering the Effects of Actions in Multiagent Systems
主讲人:王维埙
回放链接:http://mooc.yanxishe.com/open/course/793
直播主题:ICLR 2020丨通过负采样从专家数据中学习自我纠正的策略和价值函数
主讲人:tzdmp
回放链接:http://mooc.yanxishe.com/open/course/802(回放时间:4月25日上午10点)
直播主题:ICLR 2020丨分段线性激活函数塑造了神经网络损失曲面
主讲人:jjdxh
直播时间:4月24日 (周五晚) 20:00整
如何加入?