2.3 信息检索系统
2.3.1 检索系统的概念
检索系统是用以存储和检索文献线索或报道、累积和查找文献线索的工具,它是在一次文献的基础上经过加工、整理、编辑形成的二次文献。根据检索方式的不同,可分为手工检索系统和机械检索系统。手工检索系统主要指各种目录、题录、文摘和索引。机械检索系统主要指利用力学、光学、电子学等手段帮助查寻的工具,如机检穿孔卡片、光电检索系统、计算机检索系统等。随着信息时代的到来,计算机检索已成为主流,并广泛应用于现代信息检索过程。
检索系统的基本功能是存储和检索信息,主要体现在四个方面:一是根据学科和主题集中信息。避免了直接检索的分散性、盲目性和偶然性,从而提高了信息的查全率和查准率。二是缩短了检索过程,节省了查找时间。检索者不必去阅读大量分散的原始信息,只需反映原文状况的具体著录事项,因而提高了检索速度和效率。三是便于按分类或主题等不同的检索途径,灵活地从多个角度进行检索。四是有助于消除语言文字障碍。针对读者利用文献信息时常受到语种的限制而漏查了一些有重要参考价值的信息,检索系统可以用一种语言来收录和报道不同文种的信息,而读者只需要掌握一二种主要语言,即可查阅多语种的信息资料。
2.3.2 检索系统的基本类型
(1)按其正文的内容性质,可分完全二次信息检索系统和部分二次信息检索系统。
完全二次信息检索系统主要有目录、题录、索引、文摘等类型。这些检索系统仅提供信息的线索,包括各种印刷性检索系统和检索性文摘数据库。部分二次信息检索系统主要包含以参考工具书为代表的准检索系统书和全文数据库资源。完全二次信息检索系统的主要类型有:
目录(Bibliogrphy,Catalogue)。目录一般以整本的图书、期刊等作为报道单元,描述比较简单,每一个条目的著录项有:书(刊)名、卷(册)数、作者、出版年月、出版地及书(刊)收藏情况等,主要用于查找出版物的出版或收藏单位。根据编制目的及社会职能,目录可以分为国家目录、馆藏目录、联合目录和出版社与书商目录等。
题录(Title)。题录是在目录的基础上发展起来的、以出版物中的“篇”作为著录单元的检索系统。一篇文献作为一条款目,如期刊中的一篇论文。因此,在揭示文献信息的内容上比目录更进一步。题录的特点是“快”和“全”。题录一般不做过多的加工,不做内容摘要,仅列出篇名、著者、出处。由于题录和索引在功能上有相近之处,有时人们把题录也称为索引,例如我国的《全国报刊索引》就是典型的题录型检索系统。
索引(Index)。索引是指按照一定信息构成如题名、人名、地名、主题词、分子式和各种号码(如专利号、报告号等)对一组信息集合的系统化的指引。索引条目通常有三个著录项目:标目(标识)、说明语和存储地址。这三项中,第一项和第三项是必须的。标目是索引条目所指示的信息某方面的特征,其属性值有著者名、主题词等,存储地址是所指示的属性值对应的特定信息内容在信息集合中的地址,多数是流水号。主题索引、著者索引是最常用的索引。
文摘(Abstract)。文摘是将论文或专著的内容加以浓缩,以精练的语言把文献信息的重要内容、学术观点、数据及结构准确地摘录下来,并按一定的著录规则与排列方式编排起来,供读者查阅使用的一种检索系统。将描述文献外表特征的著录加上文摘,按一定的顺序排列起来,即形成文摘型检索刊物,常简称为文摘。其实质就是题录加上内容摘要。
(2)按其物质形态可分为印刷型、电子型和其他类型的检索系统。
印刷型检索系统是将科技文献的各种特征按照一定的规则和格式记录在书本上的检索系统。这类检索系统往往有统一的名称,定期连续出版,所以也称作检索期刊。
电子型检索系统是以数字存储技术为基础出版的检索系统,目前主要包括计算机光盘检索系统、计算机专业学术资源数据库、网络检索系统等。它的优点是:一次输入,多项检索;检索速度快、质量高;原文获取非常便利。这是目前检索工作主要依靠的检索系统。
其他类型的检索系统包括卡片式检索系统、缩微式检索系统等。这类检索系统目前仅在很少领域还保留使用。
(3)按收录范围可分为综合性检索系统、专业性检索系统和单一性检索系统。
综合性检索系统:综合性检索系统收录范围和涉及学科广,信息类型和语种多,因而适应面较广,是科研工作最常用的检索系统。世界著名的综合性检索系统有:美国的《工程索引》、《科学引文索引》,英国的《科学文摘》等。
专业性检索系统:专业性检索系统的收录范围限于某一学科领域,适应于检索专业信息。如《中国石油文摘》、《中国化学化工文摘》、《美国石油文摘》等都是专业性检索系统。
单一性检索系统:单一性检索系统只限于收录某一种特定类型文献。学科范围可宽可窄。检索特定类型信息,检索效果往往比综合性、专业性检索系统好。单一性检索系统包括如专利索引、科技报告文摘、学位论文索引、会议文摘、标准目录等。
2.3.3 检索系统的一般结构
一个完善的检索系统一般由使用说明、目次表、正文、索引、附表等五个部分组成。
(1)编辑使用说明。介绍检索系统的编辑出版机构、学科范围、编排体例、使用方法等。起着指导用户选择并使用检索系统的作用。
(2)目次表。目次表反映检索系统结构的概貌,用于组织文献条目。多数检索系统的正文都是按分类的方法组织编排的,所以正文前面有详简不等的目次表(有时成为目录或分类类目等),可作为从分类入手查找文献的一种途径。
(3)正文部分。这是检索系统的主体。正文部分为检索者提供了判定原文献内容是否符合提问需要及获取所需原始文献全文的线索的依据。如果我们把检索系统比作一幢大楼,那么其正文部分就是大楼的房间。
(4)索引。是为用户提供多种检索途径的工具,按时间划分,有期索引、卷索引、年度索引、多年累积索引;按检索标识划分,有主题索引、分类索引、著者索引等。它帮助用户从不同的途径获取正文部分所存储的相关文献。索引相当于一幢大楼各房间的钥匙。
(5)附录。多是附在检索系统后面的与其内容相关的文字或图表,如年号对照表、机关团体和刊物名称缩写对照表。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。