3.3 知识组织系统描述标准
知识组织系统是实现知识组织和知识服务的重要支撑工具,因此,不同国家、不同组织机构花费大量人力、物力和财力来构建各种各样的知识组织系统,有的应用广泛,蜚声国际,譬如DDC、 LCC、LCSH等;有的仅内部使用,从未见诸报端。对这些知识组织系统资源进行管理应列入国家信息资源储备,具有重要意义。国外有一些专门的组织机构或企业展开了这类注册管理服务,如道琼斯公司2001年建立的Taxonomy Warehouse,管理了670余部词表、分类法资源,涉及73个领域,39种语言[9]。基于这样一个注册管理,能够实现资源共享,避免重复建设,减少建设成本。目前,国内知识组织系统资源管理明显不足,没有专门机构负责,有多少中文知识组织系统资源,有多少术语词汇、涉及哪些领域,由谁拥有和修订维护,怎么获取,向谁咨询都是未知,这成为我国知识组织系统资源建设面临的最大障碍。因此,非常有必要建立知识组织系统注册管理机制,交由专门机构负责统计管理。
知识组织系统描述模型是实现其注册管理的依据,知识组织系统的注册管理一般分为四个层次:元数据体系注册、术语注册、服务注册及数据标准注册[10]。因此,知识组织系统的描述也可从资源整体描述、单个术语概念描述、服务描述、数据标准描述四个方面展开。
3.3.1 知识组织系统整体描述
知识组织系统资源整体描述是将一个分类法、一个词表或一个本体等作为一个整体资源来描述,是为实现对各种具体知识组织系统的管理。2001年,OCLC依据DC元数据的核心元素集,提出了知识组织系统注册元数据草案(目前为第3版),从整体上描述每个知识组织系统资源[11],见表3-1。
该描述模型分别从宏观和微观两方面整体描述了知识组织系统的内容、结构和相关信息,基于此,可实现知识组织系统的初步注册和管理,从而便于知识组织系统的发现、评价、共享、复用和协作。当然,该草案只提供了知识组织系统资源整体注册元数据的核心元素,还可以仿照DC通过限定词、修饰语等方式建立更详尽的知识组织系统整体描述元数据体系。
表3-1 知识组织系统描述元数据
续表3-1
图表来源:Networked Knowledge Organization Systems(NKOS)Registry Reference Document for Data Elements[OL].http://staff.oclc.org/~vizine/NKOS/Thesaurus_Registry_version3_rev.htm.
3.3.2 术语概念描述
除了知识组织系统资源整体描述外,从应用角度出发,更应对其实体单元(语词或概念)进行描述注册,即目前深受关注的术语注册服务。W3C组织推荐的SKOS标准,是一种基于概念建模的知识组织系统形式化表示框架,亦可作为知识组织系统概念描述模型。
各类型知识组织系统虽然各有特点,但它们之间很难清晰划分界限,因此SKOS最关注的是求同存异,将这些知识组织系统共同的地方提取出来进行表示,以便于他们在计算机环境下进行数据交换和共享。SKOS建立在资源描述框架(Resource Description Frame,简称RDF)的基础上,扩展了RDF Schema的描述能力。作为RDF的一个应用,SKOS数据可以采用抽象的RDF句法,如RDF/XML来表示成RDF三元组,因此,通过SKOS描述方式知识组织系统可以被表示成机器可读、可理解的数据。SKOS的推广和应用对于促进知识组织系统在网络环境下的应用、推动语义web的发展具有非常重要的实践意义。
SKOS被设计成模块化、可扩展的语言家族,由三部分组成:SKOS核心(SKOS Core)、SKOS映射(SKOS Mapping)和SKOS扩展(SKOS Extensions)。SKOS Core是一个表示概念体系基本结构和内容的模型,SKOS Mapping用于描述不同概念体系的概念间的映射,SKOS Extensions用户描述SKOS的特定应用。目前SKOS Core基本发展成熟,形成了相应的语法标准和应用标准,后两种还处于研发阶段。
其中SKOS Core提供了一套RDF词汇表(如表3-2所示),可用作术语概念及其属性关系以及与具体知识组织系统资源之间关联的描述模型[12]。
表3-2 SKOS Core词汇表
而正在发展的SKOS Mapping试图提供不同知识组织系统的术语概念之间的映射表示,分别提供了skos:closeMatch,skos:exactMatch,skos:broadMatch,skos:narrowMatch和skos:related-Match五种映射属性来描述来自不同概念体系中的概念的对应关系。
当然,除了采用SKOS格式表示,还可以采用MARC、Zthes等标准格式来描述,但其基本描述元素大同小异。对知识组织系统中的术语概念进行注册,目的是将表达概念的词汇、体系及关系转换成机器可处理、可理解的关联数据资源,使其成为语义网中的一部分资源,从而实现术语概念的注册、管理、查询浏览、链接和匹配[10]。
3.3.3 知识组织系统的服务与数据标准描述
知识组织系统服务注册是对其所能提供的各种网络服务web services的描述,包括提供给用户的检索、链接、浏览和识别服务以及提供给机器用户的诸如各种可用的web services及其API、web services的类型、访问协议、检索与获取方式、可用格式等,知识组织系统服务注册实现了其应用的共享。
知识组织系统数据标准注册主要是对其数据字典、数据模型、体系和编码集的描述,将有助于知识组织系统的标准化、规范化,推动其复用、共享与互操作。
目前,知识组织系统的描述,尤其是其元数据体系注册和术语注册受到了OCLC、JISC、W3C等多个组织机构的关注。从列席在JCDL、ECDL及DC等国际会议上NKOS Workshop讨论中可知,一方面这些机构正在制定各种描述规范,另一方面已开始提供各种注册系统和注册服务来管理和描述现有的各种知识组织系统资源。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。