首页 > 编程知识 正文

voc2007数据集,制作自己的voc数据集

时间:2023-05-03 13:21:53 阅读:18599 作者:4785

Pascal VOC数据集介绍:

Challenge and tasks仅介绍检测和分段的相关内容。 数据格式测量方法voc2007、voc2007挑战和任务给出自然图像,从中识别特定物体。

可以识别的物体有20种:

personbird,cat,cow,dog,horse,sheepaeroplane,bicycle,boat,bus,car,motorbike,trainbottle,chair,ding ting

* Classification (跳过) ) ) ) )。

* Detection:用边框(bbounding box )框包围图像中的所有目标

* Segmentation:可拆分图像中的所有目标

* Person Layout (跳过) () ) ) ) ) 0

这里只介绍检测和分段。

Dataset中的所有标记图像都具有检测所需的标签,但只有部分数据具有segmentation标签。 VOC2007包含9963张标记的图像,由train/val/test三部分组成,共标记24,640个物体。 VOC2007的测试数据标签已经公布,之后没有公布(只有图像,没有标签)。 对于检查任务,VOC2012的trainval/test包含08-11年的所有对应图像。 trainval有11540张照片,共有27450个物体。 对于拆分任务,VOC2012的trainval包含07-11年的所有支持图像,而test仅包含08-11年。 trainval有2913张照片,共有6929个物体。 etectiongroundtruthandevaluationgroundtruthannotationfoldervoc 2007/folder filename 009961.jpg/filenamesourcedatabasethevolor数据库seannotationpascalvoc 2007/annotationimageflickr/imageflickrid 334575803/Flickr id/sourceownerflickriddictioncanary-image shape---width 500/width height 374/height depth3/depth/size segmented0/segmenth -有分割标签--object namedog/name吗! ---类别--pose未指定/pose! -物体的样子-- truncated0/truncated! ---物体是否被部分遮挡-- difficult0/difficult! -是否为难以识别的物体,主要是指只有连接身体背景才能判断类别的物体。 虽然有标记,但一般会忽略这样的物体-- bndbox! ---边界盒----xmin 69/xmin ymin4/ymin xmax 392/xmax ymax 345/ymax/bnd box/object/annotation evaluation提交的结果是

imageidentifierconfidencelefttoprightbottom示例:

co MP3 _ det _ test _ car.txt :000004.7027328911251646000006.870849373168229000006.85234640715750006.900000006 简单流程如下,详见https://sanchom.WordPress.com/tag/average-por age

通过confidence对结果进行排序,计算与top-1,2, n对应的precision和recall,将recall分为n个区间t in [t1, 分割为tn],找到满足recall=t的最大presicision,最终得到n个最大precision,求出它们的平均值的APS=[]fortinNP.arange(0.1.1, 0.1 ) :# )将recall分成多个区间)在与所有recall t相对应的precision中找到最大值mask=TF.greater_equal ) v=TF.reduce _ max () mask ) ) APS.append ) v/11.) )时,得到其平均值AP=TF.add_n ) APS )的voc2010在recall区间的划分上有变化。 如果有m个正采样,则将recall划分为[1/M,1/(m-1 ),1/(m-1 ),1) ]。 剩下的步骤不会变。

输出的bbox和一个ground truth bbox的IOU大于0.5,如果类别相同,则为True Positive,否则为False Positive,对于一个groundtruthbox,则为一个True Positive

*类别分段:标记了每个像素的类别

*对象分段:指示每个像素属于哪个物体

每个Evaluation类的precision和总体precision。

参考3358 host.robots.ox.AC.uk/Pascal/VOC/http://host.robots.ox.AC.uk/Pascal/VOC/VOC 2007/3358 deder

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。