第四节 网络环境下的档案信息检索
一、登录档案信息网站,直接获取档案信息
(一) 我国的档案网站资源
现阶段,我国的国家级档案馆、地方级档案馆以及高校档案馆基本建立了自己的档案网站。我国的档案网站基本以电子政务网为依托,能够提供案卷级或文件级档案目录检索,少数网站能提供开放档案的原文检索。令人关注的是,我国越来越多的网站能提供现行文件在线检索,以及重要的视频信息和网上图片展览,丰富了电子政务信息服务的内容和方式。此外,档案网站基本登载档案新闻、档案政策与法规以及相关的政务信息等。获得档案馆网址的方法十分简单,在常用搜索引擎(如Baidu、Google)的检索栏中输入关键词之后,即可获得有关档案馆的资料,同时也得到对应的网址。公众还可以通过中华人民共和国国家档案局主页(网址为:http://www.saac.gov.cn/)的“友情链接”栏目,链接到我国各省的地方档案馆,较为方便。但我国目前的各级、各地、各类型的档案网站资源处于分散状态,尚未对这些资源进行集成组织,无法实现一站式检索,只能分别登录不同的档案网站,才能检索和获取相应的档案线索、档案原文信息以及电子政务现行文件信息。
(二) 国外有代表性的档案信息网站资源
通过国外档案信息网站,可从浩如烟海的外文网站中准确、快速地找到所需的档案信息资源。以下仅提供具有代表性的部分网站信息。
(1) 国际档案理事会(ICA,International Council on Archives,网址:http://www.ica.org/)
国际档案理事会是非政府间的国际档案专业组织。网站刊登国际档案理事会地区分会、业务处和委员会的有关情况,各类会议信息,还含有新闻,项目资料和会议文件等出版物信息。该网站提供了ICA-List serv (the List serv of the International Council on Archives)这个重要的档案学术交流平台(网址:http://www.ica.org/4715/ica-listserv/ica-listserv.html)。用户可通过两种方式订阅:电子邮件方式和网站直接订阅,订阅之后可与这个平台上的档案学术讨论组进行交流,也可以发表自己的学术观点。
(2) 联合国教科文组织的档案门户网站(网址:http://portal.unesco.org/ci/en/ev.php-URL_ID=5761&URL_DO=DO_TOPIC&URL_SECTION=201.html)
此站点由联合国教科文组织的通信和信息部门维护,可以链接到世界各国的档案馆,还收录了世界范围内的档案教育、培训、工作等信息。
(3) 欧洲保护与获取委员会(ECPA,The European Commission on Preservation and Access,原网址:http://www.knaw.nl/ecpa/)
该委员会成立于1994年,旨在保护欧洲地区各种档案、图书资料汇集的有效可用,包括书本、文件、照片、电影、磁带、磁盘等其他各种载体。ECPA网站因TAPE (Training for Audiovisual Preservation in Europe)项目的完成已经关闭,我们登录TAPE网站(http://www.tape-online.net),能够了解欧洲声音文献遗产保护的培训信息、出版物信息。该网站在线提供大约170条有关声音文献数字化和保护的研究文献记录。
(4) 美国档案工作者协会(SAA,Society of American Archivists,网址:http:/ /www. archivists. org/)
该网站收录了美国档案工作者协会SAA的教育指南信息(the SAA Directory of Archival Education),包括SAA制订的《档案高等教育指南》(2002)、美国各州和加拿大设有档案学专业方向的大学名录及链接信息、SAA的培训信息,以及SAA协会指南,美国和加拿大档案组织的链接信息,SAA会员信息,SAA的年度会议信息等。值得关注的是,该网站还提供SAA主办的American Archivisit (《美国档案工作者》杂志)的目录信息和较早发表的论文全文,以及Archival Outlook (《档案概览》,每年公开发行6期,属新闻报道)的目录信息(限注册用户)。
(5) 原始资料库(Repsitories of Primary Sources,网址:http://www.uiweb.uidaho.edu/special-collections/iil.htm)
该站点目前提供了通向世界上超过5 000个档案馆和手稿库房的链接,可获取有关手稿、档案、古籍善本、历史照片的信息,提供地区首字母索引检索方式。该原始资料库链接的所有网站都经过专人定期检查,确保其有效可用。
(6) 美国手稿馆藏联合目录(NUCMC,National Union Catalog of Manuscript Collections,网址:http://www.loc.gov/coll/nucmc/)
这是由美国国会图书馆手稿部创建和维护的档案资源网站。NUCMC建立于1959年,它的任务是提供全国文献遗产的书目检索和利用服务,可通过网络免费搜索、直接登录NUCMC主页,以及通过OCLC WorldCat档案与手稿目录进行检索。此外,该网站还提供其他有关的信息,例如:美国国会图书馆馆藏检索、其他部门的馆藏、产品和服务的信息,检索工具和检索注意事项的介绍;美国国会图书馆之外的有关档案馆和手稿库房的资源;有关档案专业组织、档案教育、电子讨论组和期刊、助学金、奖学金、聘用机会等方面的信息;编码档案著录(EAD)及其应用的信息等。
二、利用搜索引擎获得档案信息
(一) 利用专用搜索引擎搜索档案信息
1.美国国家档案与文件管理局(NARA)的站内搜索引擎
(1) ARC (Archival Research Catalog,http://www.archives.gov/research/arc/)
ARC是一个网络档案专业数据库,它覆盖了NARA所辖各机构的馆藏,包括:总馆、华盛顿地区、各地区分馆和总统图书馆的馆藏,NARA所藏档案的20%都能在ARC里进行检索。在利用ARC进行搜索之前,应对ARC档案的构成有所了解。ARC档案的著录级别按照从总到分,从大到小可分为:档案组合或集合(Record Group,Collection)→系列(Series)→文件单元(File Unit)→记录(Item),具体如图9-1所示。
ARC的资源类型包括:档案文本、图片、地图、声音文件等各种类型档案的数字形式,共有124 000张照片供搜索。可采用基本检索和高级检索两种方式进行检索。用户进入ARC的检索界面,选择检索主题,在检索框中输入关键词,并可根据检索结果调整检索策略,建议采用高级检索方式限制检索条件,以获得精确的检索结果。ARC的检索功能包括:通过计算机自动标引和链接实现了按机构名和人名进行专门检索的功能,用户可直接输入人名或机构名进行检索。检索结果可按时间、形成者、所藏机构、所属全宗等不同方式进行排序。检索结果建立了超链接,可链接到相关的全文、照片、录音和录像;可链接到文件形成者、文件中涉及的人名、地名、机构名;还可以显示每份档案在各个著录级别的情况,由此了解一个全宗内档案间的联系,进而链接到其所属的类别、系列乃至全宗,查看该类别与全宗的其他档案。此外,ARC还专门设置了族谱和家族史检索,以及针对教学需求的检索功能。
图9-1 ARC档案构成图
(2) AAD (Access to Archival Databases,网址:http://aad.archives.gov/aad/)
美国国家档案馆档案数据库(ADD)是为了实现NARA的任务,即为公众提供对重要证据的便捷获取(ready access to essential evidence)而开发的,是在美国“电子文件档案馆项目”(Electronic Records Archives Program)的支持下发展起来的第一个公开性可利用的应用系统,该项目旨在解决以电子形式日益增长的政府文件的保管问题。
ADD主要用于检索NARA所保管的电子文件,它对档案实体采用现代数字技术进行具体描述(动感摄影、三维图片处理),甚至辅以影像背景、语言文字和音乐等方式对其进行抽象呈现,能帮助用户更好地理解文件。AAD系统可以在线利用由20个联邦机构所产生的近5 000万份涵盖多个主题范围的历史上的电子文件。
ADD的案卷保管者将所有的文件主题归纳为不同的类别(Series)供用户选择,它们是:所有类别(All Series)、族谱与个人历史(Genealogy/Personal History)、私营部门(Private Sector)、战争与国际关系(War/International Relations)、其他记录的索引(Indexes to Other Records)、地点(Places)、政府开支(Government Spending)、时间段(Time Spans)。对ADD检索前,用户首先确定欲检索的领域,选择其中的一个类别。点击该类别后便会看到相关信息,如此类别所含文档的集合列表、文档号、创建者、创建时间等,这些信息有助于用户判断该类中的记录是否与自己的兴趣相关。点击其中的任何一个文档集合又可以获得关于该集合的进一步的信息,即一个或多个与之相联系的资料文件(Data File)。
2.英国国家档案馆(The National Archives of the United Kingdom)的档案数据信息检索引擎
①A2A (Access to Archives,网址:http:/ /www. nationalarchives. gov. uk/ searchthearchives/accesstoarchives. htm)
用户可以通过A2A查找和检索到英格兰、威尔士地区的档案信息资源,档案的产生年代可由今追溯到18世纪,主要包括人口普查记录,出生、结婚及死亡记录,移民记录,家族档案等。英格兰、威尔士境内的当地文件办事处、图书馆、大学、博物馆以及国家和专门机构保存维护这些档案,并向公众提供利用。由英联邦档案馆的主页进入。
②Archon Directory(网址:http:/ /www. nationalarchives. gov. uk/archon/)
可由英联邦档案馆的主页进入。用户可检索英联邦的所有库房和在不列颠国家档案馆登记册(BNRA)数据库中收录的世界上其他藏有手稿的库房。Archon是英联邦档案人员和查找英国历史的手稿资源的用户的主要信息通道,由英国皇家历史手稿委员会负责维护。
(二) 利用通用搜索引擎搜索档案信息
(1) Webcrawler (网址:http://www.webcrawler.com/)
它是第一个提供大范围搜索的WWW搜索引擎,提供主题查询和关键词搜索两种服务。关键词搜索的功能非常强大,支持自然语言检索、布尔检索和近似检索,检索结果按主题相关性。用户能通过它同时查找Google,Yahoo! ,Windows Live,Ask等几大搜索引擎的数据库,并给出一份组合的查询结果清单。
(2) Google历史档案搜索服务(网址:http://news.google.cn/)
这项搜索服务集成在Google的资讯栏目里。通过该服务,你可以方便快速地查看以前发生过的事和新闻评论等。比如以“非典防治”为关键词进行搜索时,可以得到从2003年至今关于“非典防治”的各类网络信息,包括与“非典防治”相关的图片和网页信息。
(3) 中国Web信息博物馆(网址:http://www.infomall.cn/)
该馆是在国家“973”和“985”项目支持下,北京大学网络实验室开发建设的中国网页历史信息存储与展示系统。目前已经维护有30亿以中文为主的网页,并以平均每月4 500万网页的速度扩大规模。它的基本使命是以一种集中的形式,全面展现中国互联网上信息的历史;为社会提供多种海量网络信息产品,供相关科研人员进行研究。这是一项社会公益事业,所提供的信息产品均免费(收取介质和处理成本除外)。使用时签署数据使用协议,即可得到相关产品。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。