首页 > 编程知识 正文

推荐算法综述,试验优化设计与统计分析

时间:2023-05-05 20:06:05 阅读:142418 作者:104

出处丨专知

转载于自极市平台,文章仅用于学术共享。

导读

近年来一些研究讨论了如何在不需要目标域监控的情况下,在附加数据集上使用隐式线索,以较少的样本检测器改进鲁棒任务的概念。 本综述从当今经典和最新研究成果,以及未来研究展望,多方面进行了综述。

论文链接: https://arxiv.org/abs/2111.00201

摘要

为了现实世界数据的长尾分布以及降低数据采集和注释成本的迫切需要,学习适应具有少量标记数据的新类别少样本目标检测是一个迫切而长期的问题。 近年来一些研究讨论了如何在不需要目标域监控的情况下,在附加数据集上使用隐式线索,以较少的样本检测器改进鲁棒任务的概念。 3358 www.Sina.com/http://www.Sina.com /特别提出了基于数据的训练数据分类和训练阶段访问的相应监控形式。 根据该分类法,对正式定义、主要课题、基准数据集、评价指标、学习策略进行了重要评述。 另外,为了系统地发展这个问题,我们还详细研究了如何相互作用的目标检测方法。 最后,总结了少样本目标检测的研究现状和未来的研究方向。

给定一组类别,目标检测器的目的是检测图像或视频中这些类别的所有实例综述从当前的经典和最新研究成果,以及未来的研究展望,从多方面进行了综述。,例如智能监控[1]、增强现实[2]、自动驾驶[3]等。

迄今为止,传统的方法试图利用手工特征来穷尽搜索[4]-[7]目标,需要大量的先验知识来手工设计人脸、行人、交通标志等适合特殊目标检测的特征。 由于Alexnet在2012年[8]的ImageNet上的出色性能,深度学习在计算机视觉领域开始受到越来越多的关注。 它可以从训练数据中自动挖掘隐含的任务概念,与传统方法相比获得较大的性能优势。 特别是近年来,深度学习方法在目标检测[9]-[12]方面取得了重大突破。 为了提取稳健的概念,深度学习模型倾向于获取和训练丰富的标签数据。 然而,对于给定任务,大量收集被良好标记的数据并不总是容易的,花费时间和精力来准备:(1)数据,并且标记实例(13 )大约要花10秒。 )2)由于现实世界数据的固有长尾分布,濒危物种等罕见事例出现的频率非常低。 具体来说,日常的APP应用中强烈要求通过“少样本学习”来降低成本,但通用的技术和策略可能容易将噪声作为过拟合等一般概念或不适合等的分支来捕捉。 但是,通过显示小数据和相关标签,即使是孩子也可以快速提取任务特定的概念。 因此,如图1所示,不仅需要尽可能少的监测,而且应该优于/接近于多样本检测器,鼓励开发较少的样本目标检测(FSOD )。 特别是严格限制监督总量,不限制监督形式。 这里主要讨论三个主要的少采样头的设置,如Section I-B所示。

近年来,少样本学习取得了一些重要突破,尤其是少样本分类[FSC][14]-[27]。 受FSC最近进展的启发,初期工作是将FSOD视为FSC问题,首先利用SS[28]这样的区域提议算法生成初步感兴趣区域(RoI ),无论是否包含目标,对各RoI进行分类。 但是,与FSC不同,FSOD更复杂,不仅要按RoI分类,还必须按RoI确定准确的位置。 孤立地看待两个互补的子任务是不可能的。 由于太多低质量和模糊建议可能会混淆元识别器,因此初始工作的精度相对较低。 后续工作开始采用新方案,同时优化两个子任务少的样品检测器,获得高质量的方案。 具体来说,[29]一些基于测量的方法为边界框回归器提供了类特定的概念,例如纵横比和目标大小。 另外,现有的方法仍然依赖于现有的检测器,例如R-CNN、YOLO和SSD的变体[9]-[12]、[30]、[31],它们最初被设计用于处理多样品问题,特别是经典框架不仅涵盖了所有的位置搜索是否覆盖目标,还需要将特征与目标形状关联起来,其主干网还要求将形状和类概念有效地编码为新的类目标语义。 但是,在低资源报头字段中,类内的变化过大或过低是非常普遍的,类内的变化往往导致类间的差异变低,类内的变化低时,数据的多样性往往变低(例如,备用) 由于难以利用有限的数据学习鲁棒编码器,使用较少的样本检测器无法从非鲁棒特性中提取高质量的建议。 因此,许多FSOD方法利用附加数据集[32],[33]来获得这些重量级框架的通用概念。 例如,事前训练的骨干[8]、[34]-[36]等。 这有助于解决较少的样本课题,而不是从一开始就进行训练。 为了提高性能,一些作品设想了与共享可视组件(颜色/形状/纹理)等基类关系密切的新类,并添加了将共享概念有效转移到新类的附加约束(KL发散) 但也带来了区域转移[37]、[38]等新问题,源区知识不能很好地适应目标区。 在这种情况下,这种训练的前一阶段对新任务的影响较小,FSOD方法容易混淆高度相似的类,并且域间和域内的噪声支持较少,因此在定位新类[38]-[41]的目标时不确定

性(章节I-C)。此外,大多数FSOD方法都集中在经典的N-way K-shot设置上,因为它不需要考虑不平衡问题,与其他经典设置相比,在Section I-B中,它不需要从从目标域收集的额外未标记数据中获取隐含信息。总之,FSOD还有很长的路要走。

在这里,我们将本文的范围限制在如何在少样本/有限监督设置下学习一个合格的检测器。为了内容的完整性,我们还简要回顾了目标检测、少样本学习、半监督学习和弱监督学习的进展。主要贡献总结如下:

我们识别了少样本学习问题,并提出了一种新的基于数据的分类方法,以研究FSOD的主要挑战和现有解决方案。

系统总结现有解决方案。我们的综述的概要包括少样本目标检测问题的定义,基准数据集,评估指标,主要方法的总结。特别地,对于这些方法,我们提供了详细的分析,这些方法如何相互作用,以促进这个有前景的领域的发展。

提出并讨论了本课题潜在的研究方向。

本文仅做学术分享,如有侵权,请联系删文。

重磅!计算机视觉工坊-学习交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有ORB-SLAM系列源码学习、3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、深度估计、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列三维点云系列结构光系列手眼标定相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的tsdxn聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。