4.2 知识组织系统设计影响因素
任何一个组织或机构都会使用一个或多个知识组织系统,而决定设计和使用什么样的知识组织系统,是该组织或机构信息资源组织和信息服务的核心问题。知识组织系统的设计和选择必须要有实用价值,要充分考虑各种影响因素。
4.2.1 应用环境
应用环境是影响知识组织系统设计的一个主要因素。印刷环境和网络环境,对信息组织提出了不同的要求,同时也为知识组织系统的设计和应用创造了各种各样的条件。
印刷环境下,知识组织系统与信息资源本身是分离的,借助于目录卡片或联机目录来揭示信息资源的内容和特征,并提供检索途径和文献线索。具体的文献信息的组织是严密的线性等级体系,每一个文献单元都有唯一的排架位置。因此,在印刷环境下,线性结构的分类体系是主要的组织工具,主题词表则是作为深层揭示内容的工具。这是一种并行模式的知识组织系统整合设计方案。
网络环境中,知识组织系统与信息资源本身可以是关联的,超链接为两者之间的直接关联创造了条件。在这种环境下,分类体系用于信息资源的分类标引和组织,建立分类知识导航,提供分类浏览与分类查询手段。由于不存在为文献实体定位唯一的排架位置问题,因此,网络环境中,分类体系可以抛弃线性知识组织的束缚,整个类目体系则形成一个多角度展开、有多重入口的网状结构。以网状的分类体系组织网络环境中的信息网,更符合人类对知识认识的立体化要求。此外,相对于传统环境,网络环境中词表的地位更加突出,尤其在信息检索过程中,具备丰富词间关系的主题词表在检索的后控制中有助于扩检、缩检和检索式交互构建。而且,网络环境为分类和主题的一体化创造了条件,在分类控制下进行主题检索,能够缩小检索范围,提高检索的精度。分类主题一体化是网络环境中知识组织系统设计的主要模式,这也是一种并行模式的知识组织系统整合设计方案。
本文对于应用环境的探讨局限于网络环境,对于学术信息资源来说,网络环境中的信息组织模式主要有两种———学科信息门户和数字图书馆。
(1)学科信息门户
学科信息门户亦称为主题网关,英文名称为Subject Port、Subject Information Gateway或Subject Gateway,是网络环境中组织学术性信息资源的一种经济而有效的形式。具体说来,学科信息门户是根据特定的目标,选定特定的学科领域,对有关的网站网页进行搜索和收集,加以合理的组织,使之能够提供检索、浏览和链接的信息集合。学科信息门户致力于将特定学科领域的信息资源、工具与服务集成到一个整体中,为用户提供一个方便的信息检索和服务入口[7]。学科信息门户是经过严格质量控制的,服务于特定学科领域的研究或教育需要的网络资源目录服务系统,例如EELS、SOSIG、中国科学院建立的图书情报学科信息门户、资源环境学科信息门户、化学学科信息门户等等,它们的共同特点可以概括为[8]:
①针对限定的专业领域,主要针对学术信息和教育科研用户;
②描述组织对象往往是资源集合,例如网站、数据库、整本全文期刊、数字化服务系统等;
③一般有严格的资源选择标准,资源选择标准可能考虑资源的相关性、覆盖面、权威性、实质性、可获取性、更新程度等,往往由图书情报专家和学科专家对资源进行选择和评鉴;
④按照一定元数据格式进行完整著录,按照严格的知识组织系统进行组织,知识组织系统往往采用标准的主题词表和分类法;
⑤提供结构化检索界面和专业化检索方式,并可能提供词表浏览、词汇选择等帮助功能。
理想的学科门户应该从仅收录互联网资源发展到囊括馆藏实体资源(包括二次文献数据库、全文数据库、馆藏目录、联合目录)的集成化系统,两种资源在同一界面实现无缝存取、整合,成为易于检索易于利用的有机整体,即“hybrid libraries”(复合图书馆)[9]。
学科信息门户主要以某个学科领域内的学术信息资源为组织对象,信息资源的质量较高,组织控制程度较深。从某种程度上讲,学科信息门户的建设过程是传统图书馆文献信息处理过程在网络信息组织领域的再现和模拟。分类浏览和主题检索是学科信息门户组织信息和对外服务的两种基本方式。在学科信息门户中,一般利用某个通用的分类法或根据自己的实际情况自编一个分类法,结合超链接技术组织资源,从而向用户提供浏览途径。如中国科学院国家科学数字图书馆(Chinese National Science Digital Library,简称CSDL)的6个学科信息门户(物理、数学、化学、生命科学、资源环境科学、图书情报),均采用自己的分类系统向用户提供分类浏览服务。学科信息门户中的主题检索,相对优于普通的搜索引擎,在对检索词的控制和选择上,除了可以直接使用关键词检索外,大多提供受控词表帮助用户选择合适的检索词。因此,学科门户的信息资源组织大多采用受控词表规范标引和检索,以达到提高检全率和检准率的目的[10]。由此可见,学科信息门户对于分类组织和主题组织工具的要求比较高,此外,还会根据具体学科特点和资源特色应用资源类型、地域等知识组织工具。
(2)数字图书馆
数字图书馆是以数字化资源为馆藏,以先进的信息处理技术与计算机设备为手段,以国际互联网为服务平台,以信息收集、开发、管理、存储并提供利用为己任的分布式、面向对象的数字信息空间[7]。数字图书馆发展初期侧重于数字图书馆的资源建设,把数字化制作作为主导任务,从而忽视了把知识组织系统融入数字图书馆中的工作。在服务主导型数字图书馆模式提出以后,人们越来越重视数字图书馆架构中知识组织系统的设计与应用,尤以本体和语义网的建设为重。数字图书馆的许多功能都依赖于知识本体,而本体的产生构建则与传统的文献分类法、主题词表有着密切的关系,传统的分类表、叙词表是本体构建的重要资源和基础[11]。数字图书馆是网络环境中信息资源的分布式组织模式。由于数字图书馆是一个开放式的系统,构成数字图书馆数据层的各个“存储小间”有着不同的目标和存储对象,每个“存储小间”分别在本地对各自的信息进行组织,并施以相应的知识组织系统。各个“存储小间”由不同的单位或机构来建设和管理,并在此基础上进行各个信息仓储之间的关联,最后在总体上构成一个分布式的系统[7]。因资源库是分布式的,由多个单位建设,数字图书馆中各个资源库采用各自的知识组织系统,所以整个数字图书馆的知识组织系统是分布式的并行模式。但现在一些数字图书馆也开始提供整合检索界面,往往借助知识组织系统的互操作,提供分类浏览界面实现交叉浏览,如欧盟的Renardus项目。
4.2.2 信息资源数量和类型
信息资源的数量和类型也是影响知识组织系统设计的一个重要因素。信息资源数量越多、类型越多、语种越丰富对于知识组织系统的要求也越高。一些小型机构,收藏的信息数量较少、类型比较单一、对信息的检索要求不高、也不可能投入太多人力来组织这些信息资源,因此,一般采用单一的知识组织工具来加工、组织。比如,一些企事业单位的资料室,其收藏仅仅为了满足本单位员工的工作、学习、娱乐,不可能投入太多财力、人力在信息资源的收藏加工上,因此只需要采用一个简单的知识组织系统来组织文献,足以满足需求。然而,在一些大型机构,尤其是一些专业的文献信息服务机构,如公共图书馆、高校图书馆、情报所等,文献收藏、加工、检索是其主要服务内容,所以,这些机构文献信息收藏数量必然不菲、类型必然多样,对信息组织的要求也必然很高。为了高质量地加工、组织这些文献,提供高效率的检索服务,必然要求采用多种知识组织系统对文献多角度揭示和组织,以便提供多途径检索服务。
4.2.3 学科背景
综合性信息资源的组织要求综合性的知识组织系统,专业性信息资源的组织则最好能设计针对某个具体学科的专业知识组织系统。综合性信息资源的知识组织系统以宽泛为主;专业性知识组织系统的设计则以精细为目的,并能针对学科的特色来构建。如化学专业的知识组织系统,除了基本的分类体系和专业词表外,针对分子式描述和检索,还应设计相应的特色知识组织工具。
4.2.4 用户类型
传统环境下,用户以专业的图情人员为主,但在网络环境中,知识组织系统的用户以计算机和普通用户为主。对于计算机而言,要求知识组织系统机器可读、可处理和可理解,具备规范的形式化知识描述机制。对于网络普通用户而言,要求知识组织系统采用自然语言、简单易用、易懂。自然语言和形式化语言之间存在一定的矛盾,具备多个词汇入口的后控制词表,是解决这一矛盾的有利工具。因此,网络环境中词表的构建多以大量增加入口词、建立自然语言叙词表为目标。
4.2.5 已有知识组织系统的现状
知识组织系统的设计,遵循一个从无到有、从粗到细、从简到精的原则。已有知识组织系统是设计更高级知识组织系统的基础,比如农业科学,已有《农业专业分类表》、《农业科学叙词表》,并且在两者之间已经建立了分类主题对应的关系,那么对于农业学科的知识组织系统设计来说,主要的工作是电子化和改编,以适应网络中农业信息组织的需要,并且在此基础上向更高级的知识组织系统,如农业本体论的构建发展,从而在知识组织层面实现对农业信息的组织。中国农业科学院科技文献信息中心积极参与FAO的AOS合作项目,投入到农业叙词表向农业本体的转化工作中[12]。
知识组织系统在用户的信息需求和信息资源之间起着桥梁的作用。利用知识组织系统,用户可以找到自己感兴趣的信息,而不必事先知道它的存储位置。无论是通过浏览或是直接的检索,无论是通过浏览网页上的主题或者利用搜索引擎,知识组织系统都能够通过一个知识发现的过程来指导用户。因此,知识组织系统的选择、设计是信息资源建设的核心问题,设计整合知识组织系统,要充分考虑应用环境、资源数量和类型、学科特点、用户类型以及已有的知识组织系统基础等因素。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。