首页 > 编程知识 正文

数据元定义和应用领域,元数据的定义

时间:2023-05-05 13:33:50 阅读:185387 作者:3478

1、数据元:

      数据元( Data Element),也称为数据元素,是用一组属性描述其定义、标识、表示和允许值的数据单元,在一定语境下,通常用于构建一个语义正确、独立且无歧义的特定概念语义的信息单元。

     数据元可以理解为数据的基本单元,将若干具有相关性的数据元按一定的次序组成一个整体结构即为数据模型

    数据元一般由对象类、特性和表示3部分组成: 

        (1)对象类(Object Class)。是现实世界或抽象概念中事物的集合,有清楚的边界和含义,并且特性和其行为遵循同样的规则而能够加以标识。

        (2)特性(Property)。是对象类的所有个体所共有的某种性质,是对象有别于其他成员的依据。

        (3)表示(Representation)。是值域、数据类型、表示方式的组合,必要时也包括计量单位、字符集等信息

基本属性

       根据mrddt,黄亮,yjfdfj等编著.作战数据管理:国防工业出版社,把数据元的基本属性做如下描述:

1)标识类属性:适用于数据元标识的属性。包括中文名称、英文名称、中文全拼、内部标识符、版本、注册机构、同义名称、语境。 

(2)定义类属性:描述数据元语义方面的属性。包括定义、对象类词、特性词、应用约束。

(3)关系类属性:描述各数据元之间相互关联和(或)数据元与模式、数据元概念、对象、实体之间关联的属性。包括分类方案、分类方案值、关系。

(4)表示类属性:描述数据元表示方面的属性。包括表示词、数据类型、数据格式、值域、计量单位。

(5)管理类属性:描述数据元管理与控制方面的属性。包括状态、提交机构、批准日期、备注。

数据元分类:按不同的分类方式

1、按照应用范围:分为通用数据元、应用数据元(或称“领域数据元”)和专用数据元

2、按照数据类型:文字型数据元、数值型数据元

3、按照数据项:简单数据元和复合数据元

数据元命名规则

        数据元的名称是为了方便人们的使用和理解而赋予数据元的语义的、自然语言的标记。

       根据甜蜜的御姐,玩命的发卡,ssdll,靓丽的红牛,张睿,刘斌,哭泣的白云,ggdz,美满的糖豆,紧张的裙子编著.作战仿真数据工程:国防工业出版社,2014.09对数据元的表述,主要包括如下内容:

        一个数据元是由对象类、特性、表示3个部分组成的,相应地,一个数据元的名称是由对象类术语、特性术语、表示术语和一些描述性限定术语组成的,数据元的命名规则主要对各术语成分的含义、约束、组合方式等进行规范。 

数据元的命名规则主要包括以下内容。 

1)语义规则:规定数据元名称的组成成分,使名称的含义能够准确的传达。

(1)对象类术语表示作战仿真领域内的事物或概念,在数据元中占有支配地位。

(2)专用数据元的名称中必须有且仅有一个对象类术语。

(3)特性术语用来描述数据元的特性部分,表示对象类的显著的、有区别的特征。

(4)数据元名称中必须有且仅有一个特性术语。 

(5)表示术语用来概括的描述数据元的表示成分。

(6)数据元名称需要有且仅有一个表示术语。

(7)限定术语是为了使一个数据元名称在特定的相关环境中具有唯一性而添加的限定性描述。限定术语是可选的。对象类术语、特性术语和表示术语都可以用限定术语进行描述。

2)句法规则:规定数据元名称各组成成分的组合方式。 

(1)对象类术语应处于名称的第1(最左)位置。 

(2)特性术语应处于第2位置。

(3)表示术语应处于最后位置。当表示术语与特性术语有重复或部分重复时,在不妨碍语义精确理解的前提下,可以省略表示术语。 

(4)限定术语应位于被限定成分的前面。 

3)唯一性规则:防止出现同名异义现象。

在同一个相关环境中所有数据元名称应是唯一的。为规范数据元的命名,除了需要遵守上述的命名规则外,还需要对数据元名称各成分的术语作统一的规范。数据元名称中的术语应采用仿真领域标准、公认的术语,在数据元注册系统中可以构建一个仿真领域的术语字典,作为数据元命名时各术语成分的统一来源。

数据元提取
    自上而下提取法

        对于新建系统的数据元提取,一般适用这种“自上而下”的提取法。基本步骤是,在流程和功能分析的基础上,通过建模分析,确立关心的“对象”。在概念数据模型和逻辑数据模型的基础上,分析提取数据元及其属性。具体标识如下信息:

(1)确定数据元的来源和上下文;(2)标识数据元概念所基于的对象和特性,形成数据元概念; (3)定义并标识包含数据值的数据元; (4)标识数据值所表示的值域和允许的值;(5)对数据元进行分类等。 




自下而上提取法

    自下而上提取法也称逆向工程,对于已建系统的数据元提取,一般适用这种“自下而上”提取法。在这种情况下,数据元直接来自各个信息系统。数据元创建者依据数据元标准化方法,对信息系统及相关资源的数据,在分析、梳理的基础上,归纳整理出数据元;根据数据元的实际应用,阐明并写出相关数据元在采集、存储和交换过程中各个属性以及属性的约束要求;描述和定义各个属性所需要的属性描述符及其约束要求;

根据给定的命名、定义、标识规则和表示规范,形成数据元。具体的步骤如下:

(1)理解数据元,自下而上提取法的第1步就是获取对数据元的理解: 

①与该数据元有关的有哪些数据? ②是否有数据值得定义或描述?③有没有允许值或者实例? ④数据值是通过算术公式计算还是统计得出的? 

(2)内容研究,在研究数据元的基本属性之前,应对下列问题做出研究: 

①该数据元是否在国际、国内或者其他组织标准中进行了定义?②该数据元是否已经存在于注册系统中,有没有重新应用的潜力?(3)根据应用场景或上下文,确定数据元的定义。(4)根据应用场景或上下文,确定数据元的允许值和值域。(5)根据应用场景或上下文,确定数据元的表示词类。(6)根据应用场景或上下文,确定数据元的名称和标识符。(7)根据应用场景或上下文,确定数据元的其他属性 应用范围
     数据元早期在金融、医疗等应用非常广泛,国家相关单位也出具了对于数据元管理的一系列技术标准和行业标准等 例如: GB/T 18391.1 信息技术 数据元的规范和标准化; CFDAB-T-0301.1-2014 食品药品监管信息基础数据元 应用举例

CFDAB-T-0301.3-2014(食品药品监管信息基础数据元 )

 

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。