索引图像最近有语义分割相关的内容,但我不太清楚数据集(例如voc2012 )的图像格式,所以我会调查资料并记录在这里。
相关链接:
1、索引图像概念: https://baike.baidu.com/item/索引图像
2、博客说明: https://blog.csdn.net/xuyunyunaixuexi/article/details/85016882
1、索引图像读取索引图像的读取采用matlab读取,方式如下。
(本人正在加载VOC2012的索引图像,但图像地址自己更改)
[X,map1]=im read (…/VOC 2012 data/VOC dev kit/VOC 2012/segmentation object/2007 _ 00032.png ); [Y,map2]=im read (…/VOC 2012 data/VOC dev kit/VOC 2012/segmentation object/2007 _ 00033.png ); 的知识点,百度百科已经详细介绍过了,上面的代码所示,每个索引格式的图片都可以得到矩阵和地图。
矩阵中的像素值是多少呢,对应于地图中的RGB的各成分比率。
下图显示了map映射图的一部分,即map1。
显示图像矩阵的一部分,即x,如下图所示。
从这两者中可以找到与图像所在位置对应的颜色。
从图像矩阵图中可以看出,第108行和第138列的像素值为2,对应于map图,已知第3行(像素值从0开始)的RGB编码的比例,即其位置的颜色。
2、索引图片分析链接中的博客已经做了非常详细的介绍。 如下图所示,假设该索引图像的位深度为8 (位深度可以自己选择),则2的8次方为256,该索引图像最多可以表示256种颜色)各颜色已经与像素值一一对应)。 另外,从我们的matlab读取中也可以看出,map映射表有256个对应值,验证了图像矩阵表的最小值为0,最大值为255,深度也为8。