voc2007数据集,制作自己的voc数据集

Pascal VOC数据集介绍：

Challenge and tasks仅介绍检测和分段的相关内容。数据格式测量方法voc2007、voc2007挑战和任务给出自然图像，从中识别特定物体。

可以识别的物体有20种：

personbird，cat，cow，dog，horse，sheepaeroplane，bicycle，boat，bus，car，motorbike，trainbottle，chair，ding ting

* Classification (跳过) ) ) ) )。

* Detection:用边框(bbounding box )框包围图像中的所有目标

* Segmentation:可拆分图像中的所有目标

* Person Layout (跳过) () ) ) ) ) 0

这里只介绍检测和分段。

Dataset中的所有标记图像都具有检测所需的标签，但只有部分数据具有segmentation标签。 VOC2007包含9963张标记的图像，由train/val/test三部分组成，共标记24，640个物体。 VOC2007的测试数据标签已经公布，之后没有公布(只有图像，没有标签)。对于检查任务，VOC2012的trainval/test包含08-11年的所有对应图像。 trainval有11540张照片，共有27450个物体。对于拆分任务，VOC2012的trainval包含07-11年的所有支持图像，而test仅包含08-11年。 trainval有2913张照片，共有6929个物体。 etectiongroundtruthandevaluationgroundtruthannotationfoldervoc 2007/folder filename 009961.jpg/filenamesourcedatabasethevolor数据库seannotationpascalvoc 2007/annotationimageflickr/imageflickrid 334575803/Flickr id/sourceownerflickriddictioncanary-image shape---width 500/width height 374/height depth3/depth/size segmented0/segmenth -有分割标签--object namedog/name吗！ ---类别--pose未指定/pose！ -物体的样子-- truncated0/truncated！ ---物体是否被部分遮挡-- difficult0/difficult！ -是否为难以识别的物体，主要是指只有连接身体背景才能判断类别的物体。虽然有标记，但一般会忽略这样的物体-- bndbox！ ---边界盒----xmin 69/xmin ymin4/ymin xmax 392/xmax ymax 345/ymax/bnd box/object/annotation evaluation提交的结果是

imageidentifierconfidencelefttoprightbottom示例：

co MP3 _ det _ test _ car.txt :000004.7027328911251646000006.870849373168229000006.85234640715750006.900000006 简单流程如下，详见https://sanchom.WordPress.com/tag/average-por age

通过confidence对结果进行排序，计算与top-1，2， n对应的precision和recall，将recall分为n个区间t in [t1，分割为tn]，找到满足recall=t的最大presicision，最终得到n个最大precision，求出它们的平均值的APS=[]fortinNP.arange(0.1.1， 0.1 ) :# )将recall分成多个区间)在与所有recall t相对应的precision中找到最大值mask=TF.greater_equal ) v=TF.reduce _ max () mask ) ) APS.append ) v/11.) )时，得到其平均值AP=TF.add_n ) APS )的voc2010在recall区间的划分上有变化。如果有m个正采样，则将recall划分为[1/M，1/(m-1 )，1/(m-1 )，1) ]。剩下的步骤不会变。

输出的bbox和一个ground truth bbox的IOU大于0.5，如果类别相同，则为True Positive，否则为False Positive，对于一个groundtruthbox，则为一个True Positive

*类别分段：标记了每个像素的类别

*对象分段：指示每个像素属于哪个物体

每个Evaluation类的precision和总体precision。

参考3358 host.robots.ox.AC.uk/Pascal/VOC/http://host.robots.ox.AC.uk/Pascal/VOC/VOC 2007/3358 deder