首页 > 编程知识 正文

元数据管理,元数据管理方案

时间:2023-05-03 07:08:12 阅读:185372 作者:4984

参与建设《国家科技基础条件平台》中的一个项目,当拟定一种技术规范时,碰到了“元数据”“数据元”的相关概念,从别处引用如下描述:


一、元数据 通常,元数据被定义为“关于数据的数据”,但是该定义并不确切,因而会导致歧义和混乱。实际上,元数据是一种信息和文献,它使得数据在经历了时间的推移后,对于用户来说,依然具有可理解性和共享性。它使得在元数据可获得的情况上,数据依然是有用的、可共享以及可理解的。
所有产生数据的组织都有义务提供(生成)必要的元数据,使得数据对于它的内部和外部用户都是可理解的。仅仅使用户可以获得数据,而缺乏理解和解释数据必要的信息显然是不够的。
每一个提供数据的组织还有一个义务就是对元数据的成分及构成,给出确切的定义。其原因包括三个方面:
a)在一定的相关环境中,必须对数据和元数据给出明确的界定;
b)元数据的整个范围必须被确定,即:充分、全面地描述数据所必需的所有元数据;
c)由于每一个组织对元数据的需求和应用都相差甚远,因而无法对元数据给出一个普遍可以接受的定义。
       因为元数据也是数据,因此也可以像对数据库中其它类型的数据一样,在其储存库中,对元数据进行存储和检索。有序地存储和应用元数据,就可能使数据得到迅速、有效的使用。通过联机数据传播、发送,数据及其元数据就可以同时获得。这样,数据用户就可以通过元数据来了解其需要用的数据的信息。


    由于各种组织提供了不同类型的数据,因此,对元数据也有不同的需要和要求。但是,元数据宽泛的分类模式使之在不同组织间具有更多的共性。一个普遍确立的分类模式是:
a)  系统──计算机程序设计及数据库管理所必需的物理及逻辑特征,包括文件的定位、存储介质、记录格式、数据库模式、数据字典等信息;
b)应用──数据理解和应用所必需的信息,以及术语定义、搜集程序和工具、数据采集处理等信息;
c)      管理──成本、时间表、预算及与数据搜集项目、分析管理的相关信息。


综上所述,元数据是数据,并且就形式而言,可以依据数据模型和元模型进行组织。
对元数据的全面理解是所有数据用户建立此类模型的首要步骤。这些模型将成为建立元数据库的基础。同时这些模型也成为一些元数据分类的依据,因而,它们也成了分类方案的部分。
关于元数据的另一种观点则考虑了数据和元数据的可能用户的因素。每一类型的用户会有不同的需求,而且一些用户的需求是互不重叠的。一个程序员也许只需知道系统的元数据,而一个管理人员可能只想看看管理元数据。通常,数据分析员有更为广泛的需求,特别当他们是数据提供组织的外部用户时。总之,不同类型的用户,其需求(基于他们利用数据要回答和解决问题的类型)和水平都会对生成适合于他们的元数据产生影响。


二、数据元

有关数据元的相关信息是元数据的不可缺少的组成部分。GB/T 18391.2至GB/T 18391.6是这样描述元数据的:一个组织的数据元必须具备元数据。这些元数据将便于用户理解和共享该组织的数据。对于潜在的数据用户来说,分类、基本特性、定义、命名和注册是信息的最主要的几个方面。
将元数据存储于一个库中并使之条理化就需要建模。GB/T 18391.2至GB/T 18391.6是这样描述信息元模型的:元模型是从一个注册系统或库中获取信息所必需的。开发这样的元模型是一件不太容易的事情,但它的开发将大大地增加该标准实施的有用性。
元数据不可能涵盖理解数据元所要表示的数据所必需的所有信息。许多关于数据的内容和管理元数据及组织在该标准中是缺省的,而计算机处理的元数据几乎也是缺省的。例如,一个收集调查资料的组织将会有许多关于如何收集数据的信息。这些诸如样本和问卷设计等常常是理解数据所必要的。但是,样本和问卷设计并不是用来表示和描述数据元的元数据的一部分(源自GB/T 18391)。
确立一个宽泛的元模型将有可能对额外的元数据进行描述。内容、计算机处理和管理区域均超出了GB/T 18391的范围,它们都需要开发自己的元模型和数据模型。可扩展性将会使新模型拥有自己的位置,以适应于基本的数据元的元模型。这样,就可以建立起一个更加完善的模型。


转载自: http://www.cnblogs.com/cngreatwall/archive/2009/08/18/1548935.html

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。