数字图书馆中的数字资源是通过元数据来进行标引和著录的。元数据作为描述信息资源的工具,往往由多个按照规定的编码语言和编码方式对信息资源的属性进行特征描述的元素组成,这些元素按照规定的相互关系和整体结构形成具体的元数据格式,这种元数据往往应用于特定的主题或专业领域,适用于一组或多组相关的信息资源类别。
国际上比较有影响的元数据格式主要有:DC(Dublin core,都柏林核心元数据格式),描述的对象是网络资源,目前已发展为应用最广的元数据格式,在图书馆及相关领域也得到了广泛使用;MARC(machine readable cataloging format,机读目录格式)是适用于书目记录数据系统最完善、类目(字段)最复杂、标准最严密的元数据格式,近年来美国国会图书馆和OCLC对MARC进行了多次局部的修订,以适应网络化环境;VRA(core categories for visual resource association,美国视觉资料协会核心类目元数据标准),主要为描述网络环境下艺术、建筑、手工艺、史前古器物、民间文化等艺术类视觉资料的著录而起草,以后逐渐扩大应用到非艺术类领域;CDWA(categories for the description of works of art),是针对描述艺术作品的需求而设计的类目;FDADAG(foundation for documents of architectural drawings advisory group,建筑文献基础建筑图样咨询组格式元数据标准),是描述建筑图样类目的指南,能为描述与访问建筑文献信息提供指标;REACH(record export for art and cultural heritage,艺术与文化遗产数据输出格式元数据标准),用于文化艺术类作品数据输出格式的元数据标准;GILS(government information locator service,政府信息定位服务元数据标准),旨在为公众提供可以方便检索、定位、获取公共信息资源的服务,描述对象主要是来自政府的公用信息资源;TEI(text encoding initiative),是用于电子形式交换的文本编码标准,其中规定了对电子文本的描述方法、标记定义、记录结构;FGDC(federal geographic data committee,数字化地理元数据内容规范),是关于地理资料收藏、著录和交换的元数据标准。
在DC元数据的基础上,针对医学信息资源数据量巨大、内容繁杂、形式多样的特点,国外的研究人员制定了医学元数据,主要有以下几种:
1.OhioLINK医学元数据 OhioLINK的Lifescience/Medicine数据库直接采用DC元数据格式和美国国立医学图书馆医学主题词表(MeSH)。
2.元数据规范(meta data schema) 美国国立医学图书馆的元数据规范直接复用DC的8个元素;将DC的一些限制属性定义为元素;扩展了DC的限制属性,并定义为元素;根据医学资源的特点扩展了8个新元素。
3.医学核心元数据(MCM) 为提高医学文献检索的专指度,美国俄勒冈州医学院研究的医学核心元数据项目(MCM)在DC基础上开发了一套元数据及编码规则,并用MeSH描述主题。它复用了DC的15个元素;对部分限制属性进行了限制;增加了两个限制属性;定义了一些自己的规范,如资源类型模式,有35种资源类型和模式。
4.法文健康资源目录和索引(CISMeF) CISMeF主要包含循证医学资源、教学资源及病人信息和公共健康方面的资源。CISMeF使用两种标准工具:MeSH和DC元数据格式。复用了以下4种元数据集:①DC元数据元素集,用来描述所有有关健康的资源,复用了DC的11个元素,形成了8个新元素;②IEEE1484学习对象元数据,用来描述教育资源;③描述循证医学的元数据,用来对资源内容进行控制;④卫生资源发现、描述和评鉴语言(HIDDEL)元数据集,用来增强资源的透明度、可信度和质量。
我国的研究人员也在进行中文医学元数据的研究,希望在DC等元数据的基础上,通过参考、比较国外的医学元数据并借鉴他们的优点,制定出我国的医学元数据标准。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。