首页 百科知识 2.2.1元数据的基本概念

2.2.1元数据的基本概念

时间:2024-10-15 百科知识 版权反馈
【摘要】:当前元数据的研究重点主要是网络环境下的数据描述和数据管理问题。——元数据,即代表性的数据,通常被定义为数据之数据。元数据源于数字信息世界。元数据的形式是多样化的,并不一定是数字形式的。它是对业务数据进行元数据描述的依据。元数据的内容可根据实际的不同需求作不同的归类,上述元数据的内容在电子数据交换中可以有多种形式的排列或分解扩充,具体视运作机制和标准化需求而定。

2.2.1 元数据的基本概念

元数据的概念起源于计算机科学,是在人们亟需解决网络资源无序化的环境下提出的。当前元数据的研究重点主要是网络环境下的数据描述和数据管理问题。

元数据的英文名称为Metadata。最早出现在美国航空航天局(National Aeronautics and Space Administration,NASA)的《目录交换格式》(Directory of Interchange Format,DIF)手册中。一般的定义是:元数据是关于数据的数据(Data About Data)。但这个定义无法清晰地反映出元数据的内涵。于是,一些专家和学者就把这个解释加以扩展和深化。比较具有代表性的几种定义有:

——元数据是关于数据的结构化的数据(Structured Data About Data)。这个概念突出了元数据的结构化特征。

——元数据是与对象相关的数据,此数据使其潜在的用户不必预先具备对这些对象的存在或特征的完整认识。它支持各种数据操作。用户可能是程序,也可能是人。

——元数据是对信息包(Information Package)的编码描述。元数据的目的在于提供一个中间级别的描述,使得人们据此可以做出选择,确定孰为其想要浏览或检索的信息包,而无须检索大量不相关的全文文本。

——元数据,即代表性的数据,通常被定义为数据之数据。它包含用于描述信息对象的内容和位置的数据元素集,促进了网络环境中信息对象的发现和检索。

——元数据是关于数据的数据。此术语指任何用于帮助网络电子资源的识别、描述和定位的数据。

元数据源于数字信息世界。它意味着元数据能够采用多种形式,以不同的级别存在,为了满足不同的目的,可以通过多种方式生成。元数据的形式是多样化的,并不一定是数字形式的。只是随着计算机技术的发展,人们越来越频繁地生成为计算机所能识别和采用的数字式元数据,并将原有的元数据集成到数字信息系统之中。

元数据不仅与对信息对象的描述有关,还能够说明被描述资源的使用环境、管理、加工、保存和使用等方面的情况。

元数据可以来自各种不同的资源,元数据可以由人类(编制者、信息专家或使用者)提供,也可以由计算机自动生成,或者通过一项资源与另一项资源的关系来推断,如超链接。

不同业务领域元数据的具体内容因业务范围的不同而不可能完全相同,对于电子数据交换基础数据来说,元数据一般应当包括下列内容:

(1)标识信息

是关于业务数据的基本信息。数据的拥有者可以通过标识信息对有关业务数据的基本信息进行详细的描述,如数据所在的数据集的名称、作者信息、数据所在的环境、所采用的语言、专题分类、访问限制等,同时用户也可以根据这些内容对自己所找到的数据有一个总体的了解。

(2)数据质量信息

对业务数据进行总体评价的信息。通过这部分内容,用户可判断数据的可靠程度、完整性、一致性等等,以决定是否利用这些数据来满足自己的业务需求,而数据的拥有者也可以通过这部分内容描述自己的数据质量及评价方法和过程。

(3)继承信息

产生业务数据(即建立数据集)时所涉及的有关事件、参数、数据源等信息,以及负责这些数据的组织机构信息。通过这部分内容便可以对建立数据集的中间过程进行详细的描述,使用户明了数据的来龙去脉和有关的责任机构。

(4)数据的表示信息

主要用于数据格式和类型方面的信息。数据格式提供数据表达的规则,数据类型定义存储在数据元集合中的数据值的种类。利用这部分信息,用户可以在获得数据后对其进行各种分析和处理。

(5)实体和属性信息

这是关于业务数据内容的信息,包括数据所代表的实体类型、它们的属性及属性值域等方面的信息。通过该部分内容,数据的拥有者可以详细描述业务数据中的各实体名称、标识码以及含义等内容,也可以帮助用户知道数据实体的属性、含义及来源等。

(6)发布信息

是关于业务数据和数据集发布及获取方法的信息,包括发布部门或单位、数据资源描述、发布部门责任、订购程序、用户订购过程以及使用数据的技术要求等内容。通过发布信息,用户可以了解到数据在何处、怎样获取、获取方式以及获取费用等信息。

(7)元数据参考信息

是关于数据当前现状及其负责部门或单位的信息,包括元数据时态信息、联系地址、标准信息、限制条件、安全信息以及元数据扩展信息等内容。它是对业务数据进行元数据描述的依据。通过该元数据的描述,用户便可了解到所使用的描述方法的实时性等信息,以加深对业务数据内容的理解。

元数据的内容可根据实际的不同需求作不同的归类,上述元数据的内容在电子数据交换中可以有多种形式的排列或分解扩充,具体视运作机制和标准化需求而定。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈