首页 理论教育 档案计算机检索

档案计算机检索

时间:2023-03-27 理论教育 版权反馈
【摘要】:凡输入计算机的每一个检索项均可成为检索入口。例如,“女性*教师”表示检索有关女教师方面的档案。查全率指满足利用者要求的全面程度,即检索出的有关档案与全部有关档案的百分比。与之相对应的是误检率,即检索出的不相关档案与检索出的全部档案的百分比。
档案计算机检索_文书处理与档案管理

随着计算机技术的广泛应用,档案的检索工作也越来越多地利用和依赖计算机辅助。

一、计算机检索的特点

档案计算机检索在检索方法、检索性能上具有与手工检索不同的特点。表现为:

1.检索方式自动化

计算机检索代替了手工检索繁琐的查找劳动,可根据操作人员的指令在数据库中自动搜寻所需档案,将搜寻到的档案输出。

2.检索速度快

计算机检索比手工检索的速度大为提高,可以大大减少利用者的等待时间。特别是按专题批量查找档案时,其快速检索功能表现得更为显著。

3.检索途径多元化

计算机检索系统具有一次输入、多次输出、多样化输出的功能。凡输入计算机的每一个检索项均可成为检索入口。计算机不仅可以按著录项目进行单项检索,还可以把若干项目结合起来检索,如把文件的责任者、主题词、时间三个项目结合起来检索,可以获得同时满足这些条件的文件。计算机不仅可以对著录项目进行检索,还可以录用光盘、缩微存储技术或计算机生成的电子文件进行全文检索。

4.检索效率高

软件设计科学,数据录入完整时,计算机检索的查全率和查准率可大大高于手工检索。

5.检索灵活方便

网络化的计算机应用系统可以为分散的、远距离的利用者提供快速的联机检索,实现档案的异地查询和档案信息资源的更大共享。

6.系统依赖性

计算机检索必须有效地结合计算机及检索软件运用,若档案管理软件没有预设检索功能,计算机就不能进行有效检索。

二、了解计算机检索系统

档案计算机检索系统按它的功能和过程分成三个模块:输入模块、存储模块和检索模块。

1.输入模块

输入模块包括文献的选择、标引、加工和输入等一系列的过程和设备。

(1)文献的选择和标引

计算机文献检索系统的基础是数据库,没有数据,计算机检索便成为无米之炊,数据的数量和质量对于计算机检索系统的性能具有直接影响。在档案检索系统构成中,工作量最大、最难以完成的是数据的采集和录入工作。

(2)文献的输入

键盘输入是目前普遍采用的一种输入方式,由操作人员按动计算机的键盘将内容输入计算机,主要优点是可以及时修改校对,缺点是需要花费大量的人力和时间。此外,还有利用光学字符识别装置输入和利用电子计算机缩微输入。

2.存储模块

档案文献资料输入计算机,经过校对后,按照事先编好的程序再转存入外存储器,主要有磁带、磁盘(包括硬盘、软盘)和光盘等。数量众多的大容量的外存储器构成了档案系统的核心数据库,供检索服务利用。

3.检索模块

这是查找利用者通过计算机搜寻所需要的档案资料的入口和平台。

三、掌握计算机检索策略

检索策略是人们进行检索的方案和计划。无论是手工检索还是计算机检索,都需要制定和实施一定的检索策略,不同的是在手工检索系统中,检索策略形成和记忆于检索者的脑海中,检索者会边检索边思考,并根据实际情况做出相应调整,这样检索策略就隐含于检索的过程之中,并不明确表现。而在计算机检索中,由于人的意识和检索系统的分离,对检索策略的制定必须预设于系统之中,检索策略的调整也独立于扫描匹配的过程,不能同时进行,这就要求事先制定明确的检索策略,并转化为计算机能理解的指令,这样才能保证检索过程的顺利进行,也是影响检索效果的重要因素。

编制检索策略包括选择检索途径和检索词以及确定检索词之间逻辑关系。检索策略的编制成果是检索表达式。检索表达式主要有逻辑表达式和加权表达式,其中最常用的是逻辑表达式。

逻辑表达式是英国数学家乔治·布尔发明的逻辑算符,它能对检索词的关系进行表达和限制,所以又称布尔逻辑表达式。主要有以下三种:

1.逻辑“与”关系(AND)

表示两个之间的重合关系,即必须同时满足这两个检索条件,一般用符号“*”或“· ”表示。例如,“女性*教师”表示检索有关女教师方面的档案。逻辑“与”关系是一种限定关系,这种关系用得越多,表示限定条件越严格。一般情况下使用逻辑“与”关系有利于提高查准率。

2.逻辑“或”关系(OR)

表示两个词之间的任选关系,即满足其中之一的检索条件即可,一般用符号“+”表示。例如,“教师+医生”表示检索有关教师或医生方面的档案。逻辑“或”关系为检索提供了选择的可能,这种关系使用越多,表示选择的范围越大。一般情况下使用逻辑“或”关系有利于提高查全率。

3.逻辑“非”关系(NOT)

表示否定关系,即检索目标包括这方面内容,一般用符号“—”表示。例如,“干部—共产党员”表示检索有关非党员干部的档案。逻辑“非”关系用排除法控制检索结果,有利于提高查准率。

用上述三种关系表达检索范围而形成的表达式称作检索表达式。在每一次检索过程中计算机根据表达式所规定的范围进行检索,科学地运用这三种关系编制检索策略可以有效地提高查全率和查准率。

【知识拓展】

检索效率

检索效率是指在检索过程中满足利用者需要的全面性和准确性程度,它是衡量检索系统性能以及每一个检索过程质量高低的最基本的指标。检索效率通常采用查全率和查准率两个指标来衡量和表示。

查全率指满足利用者要求的全面程度,即检索出的有关档案与全部有关档案的百分比。与之相对应的是漏检率,即未检索出的有关档案与全部有关档案的百分比。其公式如下:

查准率是指满足利用者需求的准确程度,即检索出的有关档案与检索出的全部档案的百分比。与之相对应的是误检率,即检索出的不相关档案与检索出的全部档案的百分比。其公式如下:

影响检索效率的因素较多,在诸多因素中,检索语言处于举足轻重的地位。这是因为,检索语言将文献主题和检索提问转换成规范的检索标志,从而可能实现标引用语和检索用语的准确匹配,保证高质量地完成检索过程。如果没有检索语言,则往往可能发生匹配误差,造成检索失误。所以,人们常把检索语言比喻为存储与检索之间的桥梁,检索语言的质量直接影响到检索效率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈