8.3 知识组织系统与术语服务
术语服务是指各种类型知识组织资源(包括规范文档、主题词表、分类表等)的Web服务。其目标是为人和计算机获取和理解知识组织资源中的概念以及概念间的关系提供方便,帮助软件开发者研制工具以改进搜索引擎性能,提高检索效率[8]。
人类知识体系是一个庞大的概念体系,对知识进行加工、组织、传播和利用的前提是清楚认识概念与概念表现形式的联系与区别。概念是科学思维的结晶,是抽象的,需要用词汇术语外在表示出来。也就是说术语是概念的外在表现形式,是概念的载体。一般人们对概念与表达概念的词汇不加区分,但在知识组织过程中,这种区分认识显得尤为突出与重要。概念被抽象出来是唯一指定的资源个体,一个概念资源可以用多个词汇术语来表示。
JISC在对术语服务的研究报告中认为[9]:术语服务是用于展示和应用词表,包括受控词表和非受控词表,词表中的词、概念及关系的一系列服务。其目的在于提供检索、浏览、发现、翻译、映射、语义推理、主题标引和分类、获取、提示等各种服务。这些服务可以是机器对机器(Machine to Machine,简称M2M)的,也可以是交互式的、面向用户的服务,可以作为直接元素为最终用户使用,也可以用于支撑相关应用场景的其他服务。
术语服务是知识组织系统网络化的一个有效方法,其目的不仅是要用不同的格式存取知识组织系统和提供服务,更重要的是使之成为语义网中的数据资源———即不仅是将知识组织系统作为一个整体资源存在,更重要的是将表达概念的词汇、体系、概念之间的关系都通过链接成为数据资源[10]。基于知识组织系统的术语服务体现了知识组织系统的构建从电子化化向网络化转变的过程,从机器可读向机器可理解和可处理转变。
8.3.1 国内外术语服务现状
随着网络信息技术的发展和知识组织系统有关研究的不断深入,欧美一些国家的信息研究机构开始关注如何利用网络信息技术和知识组织系统提供网络术语服务,帮助人类和计算机用户更容易地访问和获取数字资源和服务,其中以OCLC和JISC最为关注。
2004年2月,由JISC和英国图书馆网络工程事务所(UKOLN)共同主办的JISC术语服务研讨会在伦敦举行。该研讨会回顾了利用知识组织系统提供网络信息服务的有关研究发展状况及项目,提出了加快定义和构建术语服务和工具以满足英国高等教育和继续教育领域的教学和研究需求,讨论了在公共信息环境中解决跨域术语服务问题,并声明了JISC的有关发展战略及研究活动[11]。
此外,OCLC、FAO以及欧美其他一些信息研究机构都开展了有关术语服务的研究活动。国外术语服务主要研究项目如表8-1所示。
表8-1 国外主要术语服务研究项目一览表
续表8-1
国内的术语服务受限于国内受控词表缺乏标准化、电子化程度低、兼容性差等因素,相关研究甚少。深圳大学图书馆中文叙词表本体网络术语学服务运用本体技术在一定程度上改进了中文叙词表查询扩展等检索服务功能及其维护机制[12]。但与国外有关项目比较,国内知识组织系统的术语服务仍存在一系列需要不断改进和努力完善的地方,如基于机器对机器的Web服务研究应用、词表的映射匹配、可视化展示、语义查询扩展等方面。
8.3.2 术语注册
在提供术语服务之前,先要实现术语注册。术语注册是指列举、描述、识别和指出在信息系统和信息服务中可以获得的一系列词汇,包括免费的和公共可获得的、收费的和受限的,或者组织内部的词汇列表。术语注册内容可以只包括词表结构级别的信息,或者也可以包含成员词、概念和关系,甚至包括基于自动分类、词条扩展、消歧、翻译和语义推理等术语的一系列服务列表。数字信息服务环境中的术语注册应该既能够有利用人类查找和获取其内容,也能够利于机器对机器的访问调用。
术语注册的目的是实现各种知识组织系统的网络化,使分布在各种知识组织系统中的术语成为共享的网络资源。为此需要在注册中达到以下要求[13]:
(1)充分表达术语数据的结构信息;
(2)实现知识组织系统的编码化,便于提供web服务,比如XML、RDF等;
(3)提供检索和浏览机制;
(4)使用URI来表示概念;
(5)采用通用公开的协议和标准。
2007年12月3日至2008年6月3日,在JISC资助下,由UKOLN领导并联合Glamorgan大学和OCLC进行了为期6个月的术语注册调研项目(Terminology Registry Scoping Study,简称TRSS)。该项目的目标是获悉在资源发现领域共享信息基础架构的研究进展情况;描述术语注册领域范围和使用潜力;分析基于术语注册的服务需求;使有关项目和人员明晰共享信息基础架构中该组成部分的必要性。
中国科学技术信息研究所2007年至2009年承担的国家“十一五”科技支撑计划重点项目“科技文献信息服务系统关键技术研究及应用示范”子课题“知识组织系统集成及服务体系研究与实现”研究中也初步实现一个术语注册管理平台———汉语科技词系统,如图8-10所示。这是一个集词表注册、映射、集成、构建和服务于一体的管理平台,这应该算得上是目前国内首个通用的知识组织系统注册、构建、发布和应用平台。7.3节所述及的“新能源汽车”领域知识组织系统即依赖该管理平台完成。
图8-10 汉语科技词系统技术路线图
图表来源:朱礼军.中国科学技术信息研究所“汉语科技词系统建设与应用工程”任务书
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。