首页 > 编程知识 正文

g10代码详解,giorgio

时间:2023-05-04 15:22:13 阅读:8817 作者:2353

通用化身份验证: ametricandalossforboundingboxregression一、动机:在目标检测任务中,如果回归loss相同,则IoU可能会有很大不同

如下图(a )所示,3张图具有相同的L2距离,但IoU值完全不同。 坐标的表示方法为(x1、y1、x2、y2 )。

图(b )为L1距离。 坐标表示方法中,x、y、w、h )、x、y为中心点坐标。

IoU有尺度不变性的优点,但是将其作为损耗函数,在几个方面存在问题,所以不能直接使用。

二、IoU的优点:以IoU为距离的情况(例如: liou=1ioul _ { iou }=1- iou liou=1iou ) ) ) ) )下,是一个度量。 因为它包含所有作为度量的属性,如非阴性、不确定性对称性和三角不均匀性。 IoU具有尺度不变性,这意味着任意两个区块a和b的相似性与他们的空间尺度无关。 三. IoU作为测量和损耗的函数同时使用时,存在两个问题。如果两个目标不重叠,则IoU变为0,对两个目标之间的距离没有反应。 在这种无重叠目标的情况下,如果将IoU用作损耗函数,则梯度将为0,并且无法优化。 IoU无法区分两个对象之间的对齐方式。 更确切地说,在不同方向上具有相同相交级别的两个重叠对象的IoU完全相等。

四、本文的主要贡献:以GIoU为比较任意两条界线的尺度。 使用GIoU作为两个轴对齐矩形的损失提供了分析解。 将GIoU损耗添加到最流行的目标检测算法中,如Faster R-CNN、Mask R-CNN和YOLO v3 ),在标准目标检测标准下表现出了提高的性能。 五、GIoU:对任意两个a、b框,首先找到包裹它们的最小框c。 然后,计算c((a(b )的面积相对于c的面积之比,注: c((a(b )的面积是从c的面积减去a(b的面积而得到的) . 从a、b的IoU值中减去该比得到GIoU。

以GIoU为测量值时的性能:以GIoU为距离时,LG iou=1gio ul _ { giou }=1- gioulgiou=1g iou,非阴性、不确定性、对称性及三角不均匀性。 尺度不变。 GIoU只是IoU的下限,giou(a,b ) giou(a,b )。 a、b的形状相似且接近时,lImabgIou(a、b )=I

o U ( A , B ) lim_{A→B}GIoU(A,B) = IoU(A,B) limA→B​GIoU(A,B)=IoU(A,B).
-1 ≤ GIoU(A,B) ≤ 1。A,B完全重合时,GIoU(A,B) = IoU(A,B) = 1. (A∪B)/C→0 时,也就是A∪B的面积相对于C可很小很小时,GIoU收敛于-1.GIoU考虑到了 IoU 没有考虑到的非重叠区域,能够反应出 A,B 重叠的方式。
GIoU:

IoU和GIoU做为边框损失函数时的算法流程:

B p B^p Bp:预测框       B g B^g Bg:ground truth      B c B^c Bc:最小包围框
A p A^p Ap:预测框面积     A g A^g Ag:ground truth面积

输入预测框的 ( x 1 , y 1 , x 2 , y 2 ) 值 (x_{1},y_{1},x_{2},y_{2})值 (x1​,y1​,x2​,y2​)值和 ground truth 的 ( X 1 , Y 1 , X 2 , Y 2 ) (X_{1},Y_{1},X_{2},Y_{2}) (X1​,Y1​,X2​,Y2​)值。将预测值排序:使得 x 2 > x 1 , y 2 > y 1 x_{2}>x_{1},y_{2}>y_{1} x2​>x1​,y2​>y1​。分别计算预测框的面积 A p A^p Ap和 ground truth 的面积 A g A^g Ag。计算两者交集的面积 I .找出最小包围框 ( x c 1 , y c 1 , x c 2 , y c 2 ) (x_{c1},y_{c1},x_{c2},y_{c2}) (xc1​,yc1​,xc2​,yc2​).计算IoU,GIoU计算 L I o U L_{IoU} LIoU​, L G I o U L_{GIoU} LGIoU​ 六、实验结果

所有对比实验中(网络:Faster R-CNN,Mask R-CNN and YOLOv3 / 数据集:PASCAL VOC, MS COCO),加过IoU损失和GIoU损失的mAP都在原来的基础得到了提升,在此不一一分析。下图为检测效果图,从左往右分别为 L G I o U L_{GIoU} LGIoU​, L I o U L_{IoU} LIoU​ ,网络原来的损失函数。实线为ground truth,虚线为预测框。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。