第五节 检索工具与检索步骤
检索工具是指按照一定的著录规则编制而成的用以报道、存储和查找文献信息的工具。传统的检索工具以手工检索工具为主。随着计算机技术的发展,数据库与计算机检索成为主流的检索工具和检索形式。
数据库是能够满足某种特定目的或特定数据处理系统需要并按照一定方式存储的相互关联的数据集合,具有:数量大、种类多、动态性强、更新快、检索方便等特点。
一、数据库的类型
1.书目数据库(Bibliographic Database)
书目数据库是指存储二次文献信息的数据库,也称二次文献数据库,又可分为题录数据库、文摘数据库、目录数据库等,检索结果是所需文献的线索而非全文。许多书目型数据库是印刷型文献检索工具的机读版本。
2.全文数据库(Full-text Database)
全文数据库是指存储文献全文或其中主要部分的数据库,如新闻数据库、期刊全文库、法律法规数据库、百科全书数据库等,可直接获取文献全文。有的有相应的印刷型文献,如《中国学术期刊全文数据库》,有的则是纯电子出版物。
3.事实型数据库(Factual Database)
事实型数据库是指存储机构、人物、地名、产品、物质和材料的特性、事件等信息的数据库。循证医学类数据库就是典型的事实型数据库,如The Cochrane Library,National Guideline Clearinghouse(NGC,美国国家临床实践指南数据库)和Micromedx Healthcare Series(临床暨循证医药学数据库)等。
4.数值数据库(Numeric Database)
数值数据库是指专门存储数值性信息的数据库,包括各种统计数据、科学实验数据、科学测量数据等。例如,医学上使用的化学制剂、药物的各种理化参数、人体生理上的各种数值、人口统计数据都有相应的数值数据库;化学物质结构数据库、生物蛋白质序列数据库也大都属于此类。
5.电子图书(eBook)
电子图书是指以数字形式存储,通过计算机或专用阅读设备查阅的数字化书籍。电子图书主要有两种类型:一种是将传统的纸本图书经过数字化加工处理后的电子图书;另一种是原生的电子图书,即出版时就有电子文本的电子图书。国内比较著名的电子图书平台有超星网、书生数字图书馆、方正Apabi数字图书馆等。
6.搜索引擎(Search Engine)
是随着Internet的发展以及网上信息资源的数量、种类不断激增,从1994年开始发展起来的查找Internet信息资源的工具,也称网络检索工具。搜索引擎其实是一个专门搜集网站或网址的网站,它根据用户的检索需要,把Internet中可能相关的信息线索整合在一起并提供超链接,为用户提供网上信息资源的导航和检索服务。比较著名的搜索引擎有Google、Baidu等,生物医学专业搜索引擎则有医源(Medical Matrix)等。
二、数据库的结构
数据库一般由若干文档组成,每个文档又由若干记录组成,每条记录则包含若干字段。
1.文档(File)
文档在数据库中有顺排文档和倒排文档之分。顺排文档按照每条记录的顺序号排列,是数据库的主体,又称“主文档”。数据库中得到的检索结果都来自于顺排文档。倒排文档是提供快速检索顺排文档的工具,在一个数据库中可能有若干个,如主题词索引、著者索引、刊名索引等,它按照索引词的顺序排列。大型数据库的文档还可以指数据库中某个学科或专题文献记录的有序文献集合,如MEDLINE数据库可以按时间分成不同的文档,便于用户检索不同时间段的文献。
2.记录(Record)
记录是构成数据库的基本信息单元,每条记录都完整地描述了其原始信息的外部特征和内部特征。如书目数据库中的一条记录通常代表一篇文献,而其他数据库的一条记录可能是一组数据。
3.字段(Field)
字段是组成记录的数据项。书目数据库中的字段反映一篇文献的具体特征,如篇名、著者、出处、主题词、关键词等。每个字段都设有字段标识符,便于计算机识别。
三、检索途径
数据库的检索实际上就是通过对字段的检索获得文献记录。不同的字段提供了不同的检索途径。
1.自由词检索
自由词检索又称文本词(TextWord)检索。自由词是著者写文章时选用的自然词语,一般包括标题词、关键词、文摘词、全文词。自由词不受主题词表约束,同一概念用词取决于著者的偏爱。利用自由词检索时必须同时考虑到与检索词相关内容的同义词、近义词、动词、名词等作为检索词,不然容易造成漏检。
2.主题词检索
主题词检索利用主题词索引查找文献,其检索标识是主题词。主题词是一种规范化的检索语言。主题词的规范作用在于对同义词、近义词、拼写变异词、全称缩写等进行归并,保证一词输入,多词命中,避免文献的漏检。主题词由主题词表控制。
3.分类检索
分类检索根据课题内容的学科属性,通过特定的分类法检索文献。其检索标识是分类号或类目名称。分类检索层次分明,可以触类旁通,同一类的文献集中在一起,便于族性检索。缺点是专指性不强,不如主题检索准确。
4.标题检索
标题检索是利用文献标题(篇名)中的名词术语查找文献的检索方法。由于文献标题(篇名、书名)一般能反映文献的主要内容,因此利用题目中名词术语可以较为准确地查到所需文献。
5.著者检索
著者检索利用文献上署名的作者或编者的姓名作为检索词查找文献。通过著者途径可以准确查找到同一著者的多种(篇)著作。由于世界各国风俗各异,对姓名的写法也不一样,因此使用著者途径查找文献应遵循所用数据库的著者索引编制规则。
6.刊名检索
刊名检索利用刊名全称或缩写查找特定期刊上刊载的文献。
7.机构检索
机构检索以机构名称作为检索词来查找该机构学者发表的文献。有些数据库把机构名称并入地址字段。
8.其他检索途径
缺省检索或默认检索(一般默认在几个字段中检索,比单纯检索某一字段得到的检索结果要多)、引文检索、序号检索等。
四、检索步骤
1.课题分析实质内容,弄清信息需求,明确检索目的,确定检索要求
(1)明确该课题检索的目的
弄清楚检索是为什么而进行的。通常检索目的可分为三种:①科研攻关型,是要解决研究或临床中的一些技术难题,如某一理论依据、实验方法、诊治过程等的具体问题,这类检索要求查准;②课题普查型,是要针对某一课题搜集系统详尽的资料,这类检索要求查全,申请发明、申报成果奖励、鉴定及课题立项等属于此类;③研究探索型,是要密切跟踪、了解国内外某一方面的最新成果,掌握最新科研动态,这类检索要求信息的新颖性、及时性强。
(2)明确该课题对检索范围的要求
包括课题内容涉及的主要学科范围、地区、时间、文献类型及文种,以避免浪费时间和精力。
(3)明确该课题的已知条件
如著者姓名、文献篇名、主题概念;将已知线索一一分析出来,弄清检索课题的主要内容,用自然语言来表达这些内容要求,用主题词表核对确定的主题词,并为机检自由词检索提供专业术语和常用词汇。
检索之前要充分掌握本课题有关信息,并利用综述、进展、专著、教科书以及已有原始文献后面所附的参考文献,借以获得一批原始文献,有助于准确课题分析,确定检索要求。
2.制定检索策略
(1)选择检索工具信息源及其检索方法
注意多种检索工具在收录文献范围和报道时差上的互相配合使用,以保证查全查准。
(2)选择检索途径及其检索标识
检索途径的选择取决于课题对文献本身的特定要求和已掌握的线索,并要综合利用多种检索途径进行互补。检索标识应首选主题词,其次才选用自由词(关键词)。检索标识的表示应符合两方面的要求:一是切题性,即检索标识反映信息需求;二是匹配性,即检索标识和检索系统的存储特征标识相一致。用主题词检索时,就要用词表或索引指南等工具选准主题词,手检时还要注意所用检索标识历年中的变化,用相应时期的词表或索引指南核对(计算机检索时系统可自动转换)。用关键词检索时,要列举出尽量多的有实质意义的关键词及其同义词。用分类途径检索时,要用分类表确定恰当的分类号,并查对交替类目。用著者检索时,要把握各种可能出现的姓名拼写形式。
(3)制定检索式,确定具体的查找程序
从某种意义上讲,检索式是检索策略的具体体现,它的质量好坏,将关系到检索策略的成败。要注意根据检索过程中的反馈信息(检索结果),不断对检索式进行调整。
3.查找文献线索
课题分析和制定检索策略都是进行文献检索的准备工作。而这一步骤是文献检索的核心。检索时可根据检出文献数量和内容判断结果是否符合检索要求。如不满意,可调整检索策略。
4.索取原始文献
索取原始文献进行阅读利用是文献检索的最终目的。
1)根据检得的文献情况,确定最有用的文献和较有用的文献,将其发表出处的全称确认清楚。可用检索工具的“引用期刊目录”或“资料来源目录”将缩写名称还原成全称。在综述和论文后面的参考文献中常见到:“ibid”、“idem”等,它们分别表示“出处同上”、“同著者”之意。
2)利用馆藏目录、联合目录或在有关学术机构图书馆的主页上通过联机书目检索确定文献收藏单位,向收藏馆索取。
3)利用全文数据库、网上期刊全文资源直接查找原文。
4)向著者或二次文献出版机构直接索取。对于国内缺藏的中外文文献,可通过检索出的第一著者工作单位或电子邮箱直接向著者本人写信索取。有的书目数据库实现了文献检索和全文获取一体化,提供全文订购服务。
5)利用图书馆文献传递服务获取原始文献。
文献检索应做好检索过程记录,将课题内容、检索范围和检索过程中的各个步骤、有关书刊收藏资源情况等详细记录下来。这样,一方面使检索工作的结果得到充分利用,在日后补充资料或扩大检索线索时能心中有数地制定和修改检索策略,少走弯路;另一方面也是培养良好的治学作风和形成积累资料习惯的好方法。可以利用数据库提供的个性化服务功能定制自己的个人图书馆,用于保存检索式,以方便检索新文献,或者获得新消息通报。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。