5.6 联机信息资源检索
5.6.1 联机检索系统的组成
联机检索系统是由联机中心、通信网络、用户检索终端三大部分组成。
1.联机检索中心
该中心主要由中央计算机、联机数据库、数据库检索与管理软件以及其他设备等组成。
中央计算机又称“主计算机”,是整个联机检索系统的核心部分,对整个系统的运行进行管理和控制。其功能是在系统软件和检索软件的支持下,完成信息的存贮、处理和检索操作。
联机数据库是实现联机检索的物质基础,是各种数据库的统称。联机检索系统中的数据库由若干相互关联的数据库(称为文档),按适当的结构形式组成一个文献信息集合体。在这些数据库中,有的是一种印刷出版物的机读版本,例如COMPENDEX数据库是《工程索引》的机读版本;INSPEC数据库是《科学文摘》的机读版本;CA Search数据库是《化学文摘》的机读版本。各种数据库在联机检索系统中称为文档,大型数据库可分为若干个文档进行存储,例如联机检索DIALOG系统中把CA Search数据库的全部数据分存于6个文档:308号、309号、310号、311号、312号、399号文档。
在国际联机检索系统中,每个数据库都由数个文档组成。在文献型数据库中,将所有记录按其存取号排列起来,是顺排文档。顺排文档可联机和脱机打印输出。对每条记录的每个可检字段的每个可检词,按其位置排序,经抽词后排列成基本索引和辅助索引,是倒排文档。倒排文档供联机检索时使用。
2.通信网络
通信网络起着连接用户检索终端与联机检索中心的桥梁作用,是联机检索系统的脉络。
通信网络除通信卫星外,还有公用电话通信网和数据通信网(专为计算机通信用的)。公用电话通信网采用拨号方式和租用专线两种。用户检索终端通过拨号与联机检索中央计算机接通,进行检索,其结果也通过电话线传送。按时计费,是一种较经济的方式,但质量不高。租用电话专线,通信质量高但费用也较高。
数据通信网,同样分为公用数据通信网和专用通信网。用户一般通过公用数据网进行检索。较大的公用数据通信网络都有几十至几百个分布在国内外不同城市的节点(数据通信网络中设有电子交换机的地点),每个节点都有一个电话号码。用户再利用专用电话连接各节点。当用户拨通本地节点号码时,该网络就会询问用户进网密码、用户终端标识以及用户所用的联机检索系统的标识,以便判断用户的合法性,并根据终端的通信速率以最好的方式在用户终端与中央计算机之间传输信息。我国主要通过美国的Tyment、Telent和欧洲经济共同体的Euronet这三个公用数据通信网进行国际联机检索。专用数据通信网络是联机检索系统经营公司装备的私人数据通信网络。
3.用户检索终端
国际联机检索中的用户检索终端的基本设备有终端计算机,打印机,调制解调器和一部供上线用的电话机。检索终端是用户通过网络向中央计算机发送或接收信息的设备,可分为具有输入/输出功能的终端和具有处理能力的终端。前者只能发送和接收信息,后者带有处理器,可用来处理已套录下来的数据,还可以对待发送的原始数据进行处理,以节省联机时间。
调制解调器(MODEM)是联机检索系统中不可缺少的信号转换设备。其基本功能是将中央计算机或终端发送的数据信号,在进入通信网络之前转换成音频信号,同时将线路接收的音频信号变换成串行的数字信号并传入数字接收器,即调制解调器就是将数字信号与音频信号相互转换的设备。此外,它还具有在发送设备、接收设备和终端设备之间建立同步交换与控制数据流量的辅助功能。
5.6.2 国际著名的联机检索系统
国际上著名的联机检索系统有DIALOG系统、ORBIT系统、ESA/IRS系统和STN系统。此处只介绍DIALOG和ORBIT系统。
1.DIALOG系统
(1)概况。DIALOG系统是当今世界上规模最大的联机检索系统,拥有10万多用户终端,遍及80多个国家的400多个城市。DIALOG系统也是我国用户使用最多的系统。总部设在美国加利福尼亚州的帕洛·阿尔托(Palo Alto)市,现属于Knight-Ridder公司。DIALOG系统由460多个数据库组成,内容包括:综合性学科、自然科学、应用科学、社会科学、人文科学、商业经济等。收录的文献类型有:书报、期刊、专利、会议录、科技报告、工业标准、学位论文、政府报告、经济预测、新产品通告、商标、公司厂商名录、统计数据、市场行情、广告等。除了大量书目文献型数据外,还开发了各种数据型、事实型和全文型的数据库。同时开发了只读光盘数据库。
DIALOG系统中,每一个单独的数据库称为文档,并用数字作标识,称文档号,如《工程索引》是8号文档。大的数据库再按年份分成若干小文档,分别给予单独的文档号,如《科学引文索引》又分成434和34号两个文档。
DIALOG系统的服务方式有:定题服务、追溯服务、联机订购原始文献和电子邮件等。可以通过国际互联网访问它。
(2)DIALOG系统的基本检索指令。DIALOG提供4种检索模式:菜单式检索(menu search)、命令检索(command search)、目标检索(target search)和www上运行的检索界面(KR ScienceBase)。
DIALOG系统的检索过程是通过输入该系统设置的指令,由指令进入文档记录中查找相关的检索词来完成,虽然在网络环境下用户可以利用DIALOG Select进行检索,但是通过层层超链接检索的速度相对于指令检索慢,所以掌握基本的检索指令是必要的。
DIALOG系统有30多条指令,基本指令主要有Begin(或b)、Select(或s)、Select Step(或ss)、Type(或t)、Display(或d)、Display Steps(或ds)、Pause、Logoff hold、Logoff等。指令的一般输入格式如下:
①Begin(或b)——开库指令,输入该指令后,系统便进入计时状态,调用所查的文档并对文档作出说明。如:?b478,表示输入该指令后系统将调出478号文档,并显示该文档的有关说明。
②Select(或s)——查找指令,在该指令后面输入检索词或代码,系统就会从数据库中查出含有这些检索词或代码的文献记录,将检索结果反馈给用户,并赋予一个集合号,此指令可用于基本索引或辅助索引的检索。如:?s robot control,表示输入该指令后系统将查找含有robot control的文献记录。
③Select Step(或ss)——分步骤查找指令,其功能与Select(或s)相同,特点是系统对被组配的每个检索项都赋予一个集合号,以供用户在检索过程中不断修改检索策略,重新进行组配时用。
④Type(或t)——数据连续显示或打印指令,输入该指令后,系统连续显示查找记录或打印出命中的文献记录,如:?Type sl/TI,Au/1-5,表示将显示或打印1~5号文献的题目和作者。
⑤Display(或d)——数据分屏显示指令,如:?Display sl/3/1-5,表示将显示1~5号文献中的第3号文献记录。
⑥Display Steps(或ds)——显示检索步骤指令。
⑦Pause——暂停指令,输入该指令后系统暂停且保持最低的收费状态。
⑧Logoff hold——关机指令,输入该指令后系统保留用户检索结果,时间为30分钟,系统不收费。
⑨Logoff或off Quit Byt——关机指令。
(3)DIALOG的Internet界面
①利用Web直接上网检索。其Web网址为http://www.dialogweb.com.这种方式检索费用最低,仅在运行和调用数据的一刹那计算Internet费用,缺点是如果用户需要将所有检索过程存盘,就要一屏一屏地存盘,否则随着检索指令的变化,不及时存盘,数据容易丢失。
②特别为专业人员推出的Web界面。其网址为http://www.dialogclassic.com这是最新推出的界面,速度快,检索过程中的每一屏幕均被保留,不会丢失数据,便于存盘。界面是专业人员熟悉的界面,能很快地从旧检索方式转入并适应新的Web界面。
③非专业检索人员web界面。其网址为http://www.dialogselect.com。DIALOG Select作为在Internet上的“傻瓜”界面,主要针对一般用户,而非专业人员。初学者、最终信息用户和不愿学习DIALOG检索指令的人可使用其“傻瓜”功能。
2.ORBIT系统
该系统是目前仅次于DIALOG系统的国际联机检索系统,总部设在美国加利福尼亚州的圣莫尼卡,现属美国Pergamon出版公司。该系统拥有200多个数据库,涉及的专业范围有:化工、能源、生物化学、计算机科学、商业、医学、社会科学等。存贮的文献类型与DIALOG系统相同,有一小部分数据库也和DIALOG系统相同,只是数据库数量不及DIALOG系统,但它具有自己的特色,对化工、石油、环境科学、生物化学、运动科学、安全科学等专业文献的收录较齐全。再加上软件技术先进,便于操作,因此该系统的服务深受各国科技人员的重视。
5.6.3 我国的联机检索系统概况
我国的联机检索服务始于1980年,其发展历程是先利用国际联机检索系统,后来逐渐构建国内的联机检索体系。从1980年起,先后在国内设立了100多个国际联机检索终端。通过国际卫星通信线路与DIALOG、ORBIT、ESA/IRS等12个国际大型检索系统联机,部分地满足了国内用户的信息需求,并在此基础上逐步建立自己的联机检索系统。国内联机检索系统,比较有影响的有:
1.BDSIRS系统
该系统是我国第一个联机信息检索系统。由北京文献服务处于1983年利用引进的国外文献数据库建立起来的。该系统利用专线连接检索终端。该系统的数据库主要是书目型数据库,内容有:美国政府报告通报、世界专利索引、军用标准和馆藏文献等。是目前国内较大的计算机检索系统。
2.计算机信息检索系统(IBMCDS/ISIS和VAXTRIP)
由中国科技信息所筹建。它分为西文数据库和中文数据库两大部分。西文数据库有INSPEC、COMPENDEX、EI-MEETING、西文资料馆藏数据库、西文期刊馆藏数据库、中国学术会议论文数据库(西文版)、《中国学位论文数据库》(西文版)。中文数据库包括学术会议论文、国家级科研成果,适用技术成果、“星火计划”适用技术、中国科技期刊联合目录、中国国家标准、中国专利和中国企业名录等8个数据库。
3.机电信息检索系统(MEIRS)
由机电部科技信息所筹建。该检索系统包括金属文摘(METADEX)工程材料文摘(EMA)、工程索引数据库(COMPENDEX)、机械文摘(ICMEC)中国机械工程文摘数据库、机械工业科技成果信息数据库和中国机电企业信息数据库等7个数据库。
4.化工联机信息检索系统(CHOICE)
由化工部化工信息研究所建立。可检索的数据库有:化学文摘、中国化工文摘数据库、全国化工产品数据、化工产品价格数据库、化工要闻数据库等5个数据库。
其中,后三个检索系统借助于邮电部建立的我国第1个公用数据网(CNPAC)在1990年实现联网。我国用户可以通过CNPAC网或公用电话网与这三家的检索系统联接,检索它们的数据库。
5.6.4 联机检索策略及检索步骤
1.联机检索策略
编制联机检索策略一般要经过分析课题、选择检索系统数据库、构造检索提问式、选择检索方法和途径以及调整检索策略等。但由于联机检索费用较高,所以检索者一定要对联机中心的所有数据库十分了解,要选准所用数据库;否则既费时费力,又影响查全率和查准率。
2.联机检索步骤
检索策略制定好了,就得进行下一项工作,联机和检索,其步骤如下:
(1)同系统中央计算机接通,具体实施如下:①使终端机处于工作状态,既可传送信息也可接收信息;②打开终端设备与国际数据通信网联络;③键入终端标识符;④键入联机检索服务机构代号,并回车;⑤键入你的密码,接着键入联机检索系统的名称(如DIALOG),并回车。若顺利,则显示“Entry you password”,请键入系统给你指定的密码,并回车。
(2)选择数据库(或文档);
(3)输入检索词和检索提问式;
(4)浏览选择检索结果;
(5)需要时,再调整检索词和检索提问式;
(6)打印检索结果;
(7)退出系统。只键入指令“LOGOFF”。
习题:
1.简述搜索引擎的基本类型及特点。
2.申请一个免费邮箱,并发一封邮件(要求带附件)。
3.请在网上检索出四川“九寨沟”的有关概况,并写出检索步骤及检索式。
4.请在网上检索有关“摩擦学”方面最新的图书书名、作者、出版社,并写出检索步骤及检索式。
5.你能在网上检索到有关“周恩来”的文献资料吗?请简述之。
6.档案有三种密级,请在网上检索是哪三种密级,并写出检索步骤及检索式。
7.分别用Yahoo中国和搜狐的分类目录查找出“山东大学”的相关信息,并写出检索步骤及检索式。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。