Dicom全称是医学数字图像与通讯,这里讲diocm格式文件的解读,读取本身是没啥难度的 无非就是字节码数据流处理。只不过确实比较繁琐。
dicom中文协议文档:http://download.csdn.net/download/wenzhi20102321/9897014
dicom文件结构:
整体结构先是128字节所谓的导言部分,跳过就是了,接着就是四个字节组成的字符串,然后是dataElement元素依次排列的方式, 就是一个dataElement接一个dataElement的方式排到文件结尾.我们要读取dicom里面的各种数据就是在各个数据元素中。通俗的讲dataElement就是指tag,就是破Dicom标准里定义的数据字典,每个dataElement中的tag决定自身或整个文件的某些数据类型或自身dataElement内容类别。
其中tag和VR是要重点理解,也是比较难理解的!
tag是4个字节表示的 前两字节是组号后两字节是元素号 比如0008(组号) 0018(元素号)。
我们获取dicom里面的数据,就是根据tag,来知道这个dataElement里面是否是我们需要的数据,然后读取该dataElement里面的数据。
0002组描述设备通讯,0008组描述特征参数,0010组描述患者信息,0028组描述图像信息参数
还是有很多其他组号的,但是里面的数据不常用到,tag总共大约有2000个,但是我们常用的数据就那么几个!
上面这段话,信息量其实是很多的,比如什么是显示VR、隐式VR,传输语法又是怎么回事?VR请往下看,传输语法一两句话是说不清楚的!
tag的dataElement结构,分为下面三种: 1.显示VR:VR为OB OW OF UT SQ UN的元素结构 组号元素号VR预留值长度数据元素值2222(0x00,0x00)4由数据长度决定组号和元素号组成tag,上面的数组表示给类型占有的字节长度
2.显示VR:VR为普通类型时元素结构(少了预留那一行) 组号元素号VR值长度数据元素值2224由数据长度决定 3.隐式VR时元素结构(也就是dataElement中没有VR这个值) 组号元素号值长度数据元素值224由数据长度决定上面三个表格是从网上获取来的,我在dicom协议中没有看到具体的介绍,也不知怎么验证正确性!
暂时先按照上面的理解,有问题再去思考吧。
http://blog.csdn.net/wenzhi20102321/article/details/75127101
使用工具snate DICOM打开dicom文件,查看数据效果:
工具下载地址,下载后直接用:http://download.csdn.net/download/wenzhi20102321/9895616
上面图片每一行数据就是一个dataElement数据,可以看到tag值,VR值,VL值,VF值。
但是一般工具也是看不到图像的tag数据,因为他的VF数据有几万个字节,怎么显示!
怎么理解VR呢,VR其实就是表示一种类别,表示的是该dataELement的类别。
VR,类似于java的String,Long,VR有LO(LongString长字符串),IS(IntergerString整形字符串),DA(data日期)等等共27中类型。
http://blog.csdn.net/wenzhi20102321/article/details/75127140
数据内容的存储与表现格式与VR是关联的,但比较恶心的是,VR不是一定存在,也就是可能有隐式的情况(需要根据元素标识进行判断),此外VR的属性还可能是UN(Unknown)等等等等。当然除非你要自己写解析,否则了解到这就可以了。dicom文件中的全体数据必须具有相同的数据结构。
VR和Tag还是很有关联的。
我们知道tag是有很多的,大概2000个,也就是说有2000种tag。
但是VR只有27种。
每一种Tag其实是有一个固定的VR类型,也就是说不同的dicom文件他的同一个tag,VR肯定也是相同的。
但是,不同的tag可能对应同一个VR类型。这就类是于java中的姓名和身份证号码都是String类型的。
数据长度:所有DICOM数据元素都应该为偶数长度,若为奇数,追加空格或空NULL
得到这个VL的数值大小就知道这个dataElement的字节长度。
值是整个dataElement里面数据的表现形式,如:用户名,年龄,性别等等数据,当然,图像字节的数据也在对应的VF里面,但是表现不出来。
整理根据以上的分析相信解析一个dicom格式文件的过程已经很清晰了吧
第一步:跳过128字节导言部分,并读取”DICM”4个字符 以确认是dicom格式文件
第二步:读取第一部分 也就是非常重要的文件元dataElement 。读取tag 并根据0002,0010的值确定dataElement的VR是显式还是隐式和dataElement的传输语法。
其他一个字节是八位,这是固定的。
机器语言都是二进制(0,1)的数据保存和读取;
一个字节byte就是有八位,比如:0001 0100
但是我们数据的读取都是读取字节byte的,比如前面说的128字节,说的就是128个byte数据
后面四个字节,就是4个byte,这四个字节是可以组成字符串“DICM”
接着就是四个字节的tag,但是这四个字节的tag不能组成字符串
上面说到一个字节是8位,前面四位范围是0000-1111,后面也一样,正好是0到15.
所以一个字节用16进制可以表示为0x00-0xff.同二进制00000000-11111111是一样的。
比如我们看到tag:0020 0010,其实是0x00200010,16进制的!
第一个字节为:0x00
第二个字节为:0x20
第三个字节为:0x00
第四个字节为:0x10
再验证下上面那句话,一个字节8位,所以用一个16进制的数值表示4位,两个16进制的数值就表示8位了!
所有tag四个字节,为啥是8个数值表示!
比如java代码,
读取到dicom的DICOM字符串和第一个:Tag值,VF值
程序运行后效果:
上面图片标记错了,第一个tag应该是:0002 0000
使用工具查看这个文件,第一个数据也是,这个tag数据:
dicom传输的相关知识也只能介绍到这里,上面很多知识还没有理解透彻,只是把这些知识罗列出来,给大家参考一下!
dicom文件解析知识的其他地址: 1.dicom文件详解http://blog.csdn.net/wenzhi20102321/article/details/75127362
2.dicom文件的值类型VR详解http://blog.csdn.net/wenzhi20102321/article/details/75127140
3.dicom文件tag详解http://blog.csdn.net/wenzhi20102321/article/details/75127101
4.android 解析并显示dicom文件的数据和图像http://blog.csdn.net/wenzhi20102321/article/details/75040225
5.java代码使用ImageJ解析dicom文件成图片http://blog.csdn.net/wenzhi20102321/article/details/74995084
前面5个是我自己写的,后面是一些我自己看过的相关资料:
6.Dicom文件解析http://blog.csdn.net/leaf6094189/article/details/8510325
7.使用dcm4che3获取Dicom的bmp格式缩略图http://blog.csdn.net/Kerrigeng/article/details/60866656
8.使用dcm4che3解析DICOM中,中文乱码问题http://blog.csdn.net/Kerrigeng/article/details/53942846
9.使用dcm4che3对jpeg压缩的dcm文件进行解压http://blog.csdn.net/Kerrigeng/article/details/62215647
10.DICOM的常用Tag分类和说明http://www.cnblogs.com/stephen2014/p/4579443.html
11.dicom的还单身的毛衣zssure的博客,几十篇文章http://blog.csdn.net/zssureqh/article/category/1389985
12.dicom协议中文文档下载http://download.csdn.net/detail/wenzhi20102321/9897014
13.Sante DICOM Editor 4,查看dicom文件的工具,直接打开用http://download.csdn.net/detail/wenzhi20102321/9895616
共勉:其实所有人都是一样的,不管你是否有很多钱,或有多健康。