首页 理论教育 数字资源长期保存瞭望

数字资源长期保存瞭望

时间:2023-03-04 理论教育 版权反馈
【摘要】:进入新世纪,在数字资源长期保存问题上展现了新的风景,数字资源长期保存的可能性展现出新的曙光。20世纪只有将数字信息资源长期保存视为自己本职工作的图书馆、档案馆与博物馆才会提出这个问题,并一直在进行努力。

数字资源长期保存瞭望(1)

刘家真

(武汉大学信息管理学院 武汉 430072)

【摘要】在研读大量中外文献基础上,对数字资源长期保存领域近5年有重大影响的研究成果进行分类、归纳,从中探索该领域的研究动向与发展趋势。与20世纪不同的是:数字资源的长期保存研究代表了公共利益,已有更多的机构加入了该领域研究;数字资源长期保存研究加速了从理论到实践的转变,越来越多合理可行的管理策略与技术方案正在用于实际工作;多方位的合力、多元化的支持与脚踏实地的研究与创新性的实践是数字资源长期保存今后很长一段时期的发展方向。

【关键词】数字资源 长期保存 国际 国内 管理策略 技术方案

A Trend on the Long-term Preservation of Digital Resources

Liu Jiazhen

School of Information Management of Wuhan University,P.R.China,430072

【Abstract】In this article,the author,on basis of many Chinese and foreign documents,classifies and concludes the far-reaching research findings on digital resources long-term preservation in recent five years,and explores the study trend in this field.Contrast to the 20th century,the study on digital resources long-term preservation represents the public benefits and more organizations are involved in this field;It accelerates the transformation from theory to practice,and more and more reasonable and practicable management strategies and technological projects are used in practice;Extensive collaboration,multiplicate support,down-to-earth research and creative practice will become the trend of digital resources long-term preservation in the following years.

【Key words】Digital Resources Long-term Preservation International Domestic Management Strategies Technological Projects

信息技术革命所产生的奇迹之一就是计算机存储能力不断增加,其成本却在不断降低;数字功能越来越多;网络沟通能力越来越强。这一切创造了一个又一个人间奇迹,人类基因图谱、复杂的基因数据库、气象信息的复杂模型和分析工具、全新的艺术表现形式、在线账号、数字视频和数码照片等令人眼花缭乱的数字资源与时俱进、层出不穷!尽管信息技术也使存储数字信息变得更加容易而且成本低廉,但从长期保存的角度来看,快速增长的数字信息存在着潜在风险:长期管理数字信息所必须的技术、策略、方法和资源并没有与创造和捕获数字信息的技术的更新换代步伐保持一致,这是一个严峻的挑战。谁将担负起保存数字文化遗产的责任呢?保存数字文化遗产与保存物质文化产品有什么不同。在新技术环境中,图书馆、档案馆、博物馆将如何应对这一挑战。这是20世纪最后10年,世界各国在数字资源长期保存问题上研究得最多的问题。进入新世纪,在数字资源长期保存问题上展现了新的风景,数字资源长期保存的可能性展现出新的曙光。以下是近5年来数字资源长期保存领域的进展概述。

1 数字资源长期保存已经被更多机构视为自己的核心任务

今天更多的人已经认识到,如果人类要向非印刷的世界迈进,必须翻越“数据保存”这座大山。许多政府机构、私人团体、非营利性组织与商务部门,甚至公民个人现在都很关心保存它们各自的数字信息资产,这是明显区别于20世纪的。20世纪只有将数字信息资源长期保存视为自己本职工作的图书馆、档案馆与博物馆才会提出这个问题,并一直在进行努力。而如今令人振奋的是,政府与科学家群体的参与为数字资源长期保存添加了动力。

1.1 政府组建实验室研究保护数字信息的技术方案

电子政务是政务管理创新与信息技术运用的整合体,发展电子政务,创新政府管理模式,提高政府管理效率是今天全世界诸多国家的发展潮流。但在电子政务的建设中具有许多的困惑与瓶颈,其中数字信息的长期保存是最引人注意的,毕竟电子政府不可能在缺乏数字记忆的状况下存在(2),况且提供给市民的可信的前端服务是要建立在部门的后台信息是可信与长期保存基础之上的。然而,不断升级的电脑系统与更新换代频繁的软件成为建立电子政府体系的鸡肋与制约电子政府发展的瓶颈。

从2001年开始,许多国家政府(如美国、英国、德国、荷兰等)启动Digital Preservation Testbed(保存技术试验室)项目并组建了一个特殊的电子实验室,由IT行业专家与处理电子政府相关事务的工作人员组成项目组,对不同类型的电子文件和记录进行实验,被试验的材料大多来自于不同的政府组织产生的各类文件,包括电子邮件、文本文件、电子数据表和数据库等。按照已经计划好的程序,精密地分析和评估电子记录,以鉴别不同的保存技术对它们的内容、结构和形式造成的影响,以找出克服技术淘汰、有利于数字信息长期保存的最佳技术方案。已经或正在被鉴定的保护技术手段有:迁移、仿真和XML(可扩展标识语言),其实这些都是20世纪数字信息保存领域提出的维护数字信息可读的有争议的主要技术手段,Digital Preservation Testbed会比较这三类保护方法的优点、缺点以及它们的效果及成本(3),以期获得最有利于政府信息资源长期保存的技术手段。

1.2 科学家联席会议研究科学记录的长期保存策略

技术上的快速进步正在影响着科学工作的方式,使得科学领域产生了大量的数字数据。数据是科学研究的基础,它们有很高的经济和社会价值。随着科学思想的前进和新观点的产生,科学数据经常会被反复使用,因此对这些数据的保存尤其重要。

为此,来自13个国家的近70位不同科学领域的研究者、数据管理员、信息专家、档案馆员和图书馆员,于2003年12月在里斯本的国家图书馆召开了科学数据长期保存的国际研讨会,讨论了科学记录长期保存问题中的某些关键性问题(4)

2004年10月,欧洲航天署举办“从保存到获取”研讨会,专门就确保对科学技术数据的长期保存和增值问题展开研究(5)

2005年11月,在英国爱丁堡召开了长期保存科学数据的会议,这次会议根据科技数据的特性与需求讨论了科学数据的长期保存问题(6)

尽管不同的学科有着各自独特的学科要求和惯例,但大家共同认为,科学数据能够得以长期保存的关键在于:鉴定被保存数据的价值、保留相关的元数据以及基金管理部门应当具有保存科学数据的意识(7)

随着数字对象越来越复杂,长期保存变得越来越困难。鉴于鉴定可以有效地评价保存活动,专家们强调在数字对象的生命周期中应尽可能早地采取鉴定措施。为了实现这一点,必须详细定义和执行鉴定的标准和策略。有专家还提出了鉴定科学数据必须考虑的关键问题(8):

(1)这些数据对其他研究机构或者政府有用吗;

(2)这些数据可被理解吗;

(3)如果这些数据丢失会有什么严重的后果。

如果以上问题的任何一个得到否定回答,那么这些数据就不值得被保存。为了保证鉴定效果,科学家和档案工作者应联合起来进行,鉴定过程应尽可能在数字数据生命周期的早期开始进行。

为了保证长期保存的科学数据具有持久价值,科学工作者认为在科学数据的长期保存中,保存元数据特别是背景元数据尤为重要(9)。数字化科学数据如果失去了保存背景,该数据从本质上看将是毫无价值与利用意义的。考虑到数字化科学数据的特殊性,许多科学家认为有必要保留阅读数据的硬件和软件,例如先前的穿孔卡片如果没有读出设备是无法让人理解的。

2 数字资源保存行动获得更多的投资,其研究项目不断启动

在跨入21世纪的短短5年中,世界各国都加大了对数字资源长期保存研究的支持力度,各国都展开了多项数字资源保存工程。说其是工程是因为每个项目都由多个机构组成项目组,其最终结果不仅是研究报告,而且是推进长期保存数字资源走向实质性阶段的启动方案。以下是(RLG)研究图书馆组织数字新闻向全球推荐的尚在进行中的大型数字资源保存工程。

(1)Portico项目(2004~2007年,美国NDIIPP资助)。

美国国会图书馆的国家数字信息基础设施和保护工程(NDIIPP)以300万美元资助Portico项目,该项目是研究电子出版物的保护与长期获取,为期5年,2007年完成(10)

(2)数字保存的环境工程(ECHO DEPository(11))(2004~2007年,美国NDIIPP资助)。

这是美国NDIIPP的子项目(NDIIPP共有8个子项目),其研究的主题是“网络资料存档的方法论及其实践”,它将开发查找、分析、捕捉网络内容的工具,评价已开发的Web资源存储软件,指导保护Web资源的战略研究。

(3)激励数据创建者建立符合档案要求的数据(12)(2005~2006年,美国NDIIPP资助)。

这项工程主要研究如何促进数据创建者与数据归档间协作的方法,它探讨数据创建者在保存数据中可能遇到的障碍,以及如何产生激励机制使他们储存的数据符合档案要求。

(4)数字财产评估工具(13)(DAAT)(2004~2006年,英国JISC资助)。

该工程的主要目标是建立数字资源保护需求评估,开发一种可确定数字财产保护需求优先级别的工具。由信息系统联盟委员会(JISC)提供基金资助,它已经支持了该研究领域的11项工程。

(5)元数据世代研究(14)(2005年,美国微软研究中心、OCLC与大学研究会共同资助)。

似乎这不是一个数字保存研究工程,但是元数据是所有数字工程,包括数字保存在内的一个焦点,该项目旨在开发最有效的元数据生产工具,这不仅可降低元数据的采集成本,也将使数据的长期可读性更加切实可行。

(6)数字化理论知识宝库(DARE)(15)(2003~2006年,荷兰国家图书馆、荷兰学皇家艺术与科学院、荷兰科学研究机构资助)。

该工程将开发一种共享结构,可使学术理论研究成果更易于访问,该资源共享结构对于数字保存工程是至关重要的。

(7)可持续的数字库房(16)(2004~2006年,澳大利亚,系统基础设施创新工程(SII)资助)。

该项目研究如何将保存元数据融入数字库房系统,研究GIS元数据捕获工具及通用文件格式的可持续模式等。

(8)数字财产的长期管理(17)(2004~2006年,英国信息系统联盟委员会资助)。

这是英国信息系统联盟委员会(JISC)资助的数字保存和记录管理的8个工程之一,它研究数字修复的系列工具,并推荐有价值的相关成果。

(9)数字档案资格审核及数字档案资格认证(18)(2005~2006年,美国梅隆基金会资助)。

这项工程将提出数字档案审核及资格认证应开展的活动和程序,将分担RLG/NARA数字保存证书特遣队的部分工作。开展获取数字档案资格证(Digital Archive Certification)活动,可保障归档数据的可长期保存性,这一新添的举措也使证书在其发展史上更具实用性。

(10)数字保存群(19)(2004~2006年,欧盟数字图书馆的网络优势(DELOS)资助)。

这是涉及探讨数字资源保存领域的研究方法的工程,它包括数字资源保存策略与结构的检验与确认的方法研究,包括数据储存系统和保存方式的调查,文档格式登记报告以及它们和保护策略的关系,数据库房功能分析等。

(11)虚拟档案实验室(20)(美国国家档案和记录管理局(NARA))。

该项目旨在建立一个数字保存研究试验台,其关注的焦点是数字资源的可测量性、持久性与真实性,这项研究成果将用于电子文件管理的实践中。该项目的成员单位是美国国家档案和记录管理局、圣地亚哥超级计算机中心与马里兰大学高级计算机研究学院。

以下是我国近5年展开的相关研究的不完全统计:

(1)基于XML的电子文件元数据标准研究。

2004年,国家社会科学基金重点项目“基于XML的电子文件元数据标准”通过立项,标志着我国电子文件元数据标准进入了实质性研究阶段,该项目研究是有利于数字资源共建、共享与长期保存的。

(2)保证数字信息长期可读的管理方案研究(中国国家自然科学基金,2002~2003年)。

该项目针对数字资源长期保存中的问题,提出了建设性方案:分析与评价了已有的技术解决方案,提出了技术方案的选择与评价标准;提出了适于数字信息长期保存的文件格式要求;针对数字文献资源的生命周期,提出维护数字资源长期保存与读取的全程管理措施(21)

(3)中国文化资源保存库的国家战略研究(中国国家自然科学基金,2004~2007年)。

该项目正在进行中,已取得的成果有:

对我国Web资源采集策略与归档网络文献的选择提出了建议,包括Web空间的划定、Web资源的采集方式、采集频率的确定等,并探讨了Web资源的采集中的法律问题、技术问题、保存责任问题与资金问题等,包括提出了网络文献选择的决策流程等(22)

在对我国图书馆、档案馆与信息中心数字资源的现状调研基础上,提出建立数字资源档案数据储存基地的建议与详细建设方案(23)

从长期保存数字资源角度,对我国电子出版物的管理提出建议(24)

(4)吉林省数字图书馆建设发展对策研究(25)(2001.7~2002.12,吉林省哲学社会科学规划基金)。

在这项研究中,提出应将数字信息的长期保存作为数字图书馆建设的重要目标。

(5)我国数字图书馆标准规范建设之数字资源惟一标识符应用规范(2002年10月开始)。

这是一项由中国科学院文献情报中心牵头,中国国家图书馆、CALIS中心、中央党校图书馆与中国医科院信息中心参加的项目,项目目标是确立我国数字图书馆中数字对象惟一标识符应用规范,建立基于URI机制的数字对象惟一标识符的命名原则、体系结构和基本解析规则,选择确认合适的数字对象惟一标识符标准,实验建立惟一标识符解析机制,实验建立开放惟一标识符解析机制,实验建立分布式惟一标识符解析机制。(26)”这类规范的建立是有利于我国数字资源长期获取与保存的。其已经形成的成果有:中国数字资源惟一标识符发展战略、元数据著录实验系统需求分析、数字资源惟一标识符解析系统应用规范、数字资源惟一标识符的现状与发展。

3 数字资源长期保存已经开始应用性部署

数字资源长期保存是近20年发展起来的崭新的领域,但发展速度较快。进入21世纪以来,数字资源长期保存已经由理论研究进入实质性行动。图书馆、档案馆和其他文献管理机构达成了共识,那就是“数字资源保存是需要提出的问题与解决问题,不能仅仅停留在理论层面而应该深入实践,需要提出一个合理的可解决问题的管理策略与技术措施”(27)。2004年10月在英国图书馆会议中心举办“DPC数字化保存联盟”论坛上提出,应当加速数字资源保存从理论到实践的转变(28)。在数字资源保存行动方面的典型事例如下:

3.1 走向实用的网络欧洲版本图书馆(NEDLIB)项目(29)

网络欧洲版本图书馆(NEDLIB)是一项欧洲国家图书馆的合作项目,其目的是构建一个联网的欧洲版本图书馆的基础结构。参与该项目的8个欧洲的国家图书馆在研究电子出版物工作流程的基础上,就如何建立全欧洲的电子出版物储存系统达成共识。为使网络欧洲版本图书馆项目实施,在项目组研究工作结束后,该项目成员的8个国家图书馆用不同的途径建立了本国的本土储存系统,使网络欧洲版本图书馆得以成为现实。例如,荷兰国家图书馆通过与IBM荷兰总部的合作,依据NEDLIB项目组提出的NEDLIB/OAIS模型,开发了数字档案信息系统(DAIS),英国图书馆和IBM的英国总部也进行了类似的工作。各国的数字档案信息系统(DAIS)是欧洲版本图书馆的本土数据栈系统,这类系统具有以下功能:

第一,可全自动批量储存CD-ROMs、电子图书等电子文献并记录其技术元数据。被记录的技术元数据主要是文件格式、应用软件、操作系统和硬件平台等技术支持方面的信息,它们被NEDLIB项目组认为是确保现在和将来访问与读取能力的先决条件。

第二,技术元数据可被自动处理并转化为XML DTD格式后编入索引,并下载到该系统的元数据储存处。

第三,该系统是建立在OAIS模型基础上,其中的档案信息包(AIP)既能够存放电子出版物的原始版本,也能存放格式转换后的版本,同时保存已经安装入AIP内的出版物的影像,这将既利于保存又便于访问。

第四,该系统还设计了档案存储单元的备份、灾难修复工具和数据管理等模块。

NEDLIB就是这样从理论走向实践,最后成为全欧洲共享的具有长期保存数字资源功能的数字图书馆。

3.2 OAIS模型扩展了它的实用性

在长期保存数字信息的过程中存在一对矛盾,即必须保存历史的可信与数据不可避免地需要改变。长期保存信息是为了信息以不变的、可信的状态传承给未来,但IT技术的持续进步要求被保存的数据随当前技术的发展而改变,否则就有可能无法识别。OAIS(开放档案信息系统)模型提供了一个参考结构以平衡这对矛盾,通过OAIS模型,既可保持数字对象的不变又使之与IT技术发展同步,同时还可利用技术的发展去改进保存资源的服务性工作。然而,作为一个高水平的概念模型,OAIS没有具体的可执行方案,即使它从空间科学领域发展到国际性的、多种学科的领域,甚至2002年成为了国际标准ISO 14721:2002(30)

为了让理论成果为实践服务,记录领域的一个跨国的多学科研究协作机构interPARES项目(电子文件的长久真实记录的国际研究项目)修改并扩展了OAIS,使其更适应具体领域应用的需求(31)。interPARES项目开发了一个综合性的IDEF过程模型以用于需要保存可信数字记录的地方,该模型保留了OAIS的功能,但增加了特殊的档案需求和档案理念。档案需求被作为对数字信息保存过程的特殊控制,档案理念则是进一步完善保存过程的基础。interPARES保存电子记录模型设计了一些特殊的渠道,可使已保存的数据适应IT技术的进步(32)。为此,OAIS参考模型被欧美等国的图书档案界广泛采纳,以规范数字资源的存取和长期保存。在美国、英国、澳大利亚和欧盟许多已经建立或正在建设的数字档案馆都建立在OAIS模型的基础上,有些已经建立的数字档案馆还在OAIS模型的基础上进行了扩建(33)。此外,一些国家的数字图书馆、科学数据中心以及商业机构等领域也采用OAIS模式管理数字资源(34)。我国国家图书馆于2002年3月出台了《中文元数据方案》以支持数字资源的保存和检索利用,该元数据方案在总体框架结构上就采用了OAIS参考模型(35)

3.3 将数字资源保存理念融进实践的OCLC

从2000年开始OCLC与RLG合作,从WordCat由目录数据库和在线联机目录转换成全球联网的包含文本、图片、声音和动画在内的信息资源开始,拟建立一个全世界的知识基地,该基地不同于一般信息资源中心的是,它将进行战略整合以支持数字资源保存行动,即通过提供一整套综合的、基于网络的工具和服务的支持,把网上投稿、标引、检索、访问、转换、传递和保存知识等活动整合成一个连续体,使知识的保存成为现实。现在,该项设想的建模已经完成,其远景是延伸OCLC的合作领域,以应对创建与维护全世界知识保存基地的所有挑战(36)

OCLC认为,要合理延伸OCLC和保存资源的各种服务就要创建一个泛用型的数字档案馆,为图书馆、档案馆和博物馆储存多样化信息、提供多种产品和服务,为此他们集合了长期以来的研究成果以及在软件开发和保存信息资源合作中形成的力量,利用OCLC现有的人力资源与物力资源启动了数字档案馆的建设项目。为了能与其他数字档案馆协同工作和具有更广泛的扩张性,OCLC把开放的档案信息系统(OAIS)作为数字档案馆建设的参考模型。

识别用来获取和管理数字对象的工作流程、为数字对象安装元数据装置是OCLC数字档案馆建设的基础性工作,这些工作于2002年已完成。如今,OCLC数字档案馆系统已经具有了以下功能:获取网上文献、为数字对象建立保存元数据、将数字对象采集进数字档案馆并长久保存。在建设数字档案馆的过程中,OCLC认为以下工作极为重要:

(1)基于OAIS参考模型(37)

(2)为数字档案馆创建保存元数据。

保存元数据是指公共机构用来执行某种数字保存形式的元数据,保存元数据包括检索型元数据、管理型元数据和结构型元数据。OCLC认为,其中结构型元数据应十分详细,因为它允许对原始资料的重新排序。重视保存元数据的创建与捕获是基于长期保存数字文献的以下两项功能的实现:

第一,使管理人员能够采取适当的措施长久地保存数字对象的比特流;

第二,保证归档文档的内容能够被还原和翻译。

为此,在确定数字档案馆第一阶段需要哪些保存元数据时,OCLC主要考虑到拟保存的数字对象类型与用户需求。OCLC还发明了易于创建元数据的新工具与数据采集机。利用该工具,档案馆可以将保存元数据连同数据一起从目录档案中转移,且可与从对象上摘录的保存数据一起更新(38)

(3)必须有一个计划好的迁移路径。

数字档案馆的责任是要长期保存数字资源,当数据来源提供者(如出版商等)不再支持来源数据的读出或因技术的发展要求更换新系统时,数字档案馆应为它所支撑的数据提供迁移,因此数字档案馆必须为所有的数字对象事先设计迁移路径。

(4)为保全数字资源信息提供支持。

缺乏保障数字信息安全的措施,会危及数字资源信息的保全。OCLC除将数字档案馆的内容副本和元数据都以离线方式安全地储存在隐密设备中外,还在设计第三方鉴定软件与探讨如何有效地实行其鉴定机制以适应社会的需要,第三方鉴定软件充当数字公证人的角色,数字对象的创建者用该软件在创建的数字对象上加载一个数字标识和时间标签后,将该数据传送至鉴定软件的公司。在该数据长久保存的过程中,将来的用户随时可发送注册信息到鉴定软件公司,通过判断注册信息是否与文件上原始的数字标识和时间标签相匹配来检验数字对象的安全。这种服务还可记录数字对象物主的变化,进一步校验数据的真实性,并可提供数据的来源。此外,2002年夏天OCLC还与两个图书馆合作启动一项数据鉴定导航的项目(39)

3.4 加强了保存技术在实用层次上的检验

把保存数字资源已有的成果转化为保存数字资源实际行动,国外的许多图书馆与档案馆都在进行中,如澳大利亚国家图书馆的具体行动如下(40):

第一,研究建立过时软件的版本仓库的可行性,使其作为维护数字资源持续获取的短期策略。

第二,检验媒介转换、迁移、仿真、数据恢复和其他维护数字资源获取的技术方法的可行性。

第三,对澳大利亚国家图书馆已收藏的数字资源的长期保存实施恰当的管理,并对处境危险的数字资源采取维护行动,如鉴定处境危险的数字对象类型和文件格式,并更新或迁移它们;考查和严格地评估媒体转换、迁移、仿真、数据恢复和其他应对技术改变而维护获取的技术方法的可行性。

3.5 我国的相关实践与数字资源保存行动

在数字资源长期保存的研究方面,我国起步较晚,但在国家数字图书馆建设与web资源保存上,都考虑到了数字资源长期保存问题。如在我国国家数字图书馆工程建设中,就注意使用适应中文文献和文字特点的、国际国内已有的、成熟的、广泛应用的标准(41),以此来规范我国值得长期保存的数字资源的建设,从数字资源生命周期的开始注意到其长期共享与有效读出的问题。又如,我国已启动的两个Web资源采集的试验项目,一个是2003年由中国国家图书馆启动的“网络信息资源保存”试验项目(42),2003年11月20日该项目主页http://www.webarchive.nlc.gov.cn开通,并提供服务;另一个是中国Web信息博物馆(Web Infomall)(43),该项目是在国家973和985项目支持下,由北京大学计算机系网络与分布式系统实验室开发建设的中国网页历史信息存储与展示系统,其主页是http://www.infomall.cn。Web Infomall现收藏有从2001年以来约5亿个中文网页,积累有10万亿字节的数据量,它还正以每天增加数10万网页,平均每月增加1 000万个网页的速度扩张。此外,我国许多大学和科研机构的档案馆也承担了本单位Web资源保存任务。

4 数字资源长期保存领域已经积累了大量的知识和经验

数字资源长期保存在中国是一个新的研究方向,在欧洲和美国也是近20年来刚刚发展起来的,尽管与其他研究领域相比,其历史很短,但由于其重要性与迫切性,世界各国进行了许多有益的探索和研究,现已经积累了许多有益的知识与经验。现不完全地归纳如下:

4.1 不能将数字资源作为物理对象来保存,我们需要保存的是数字对象再造文献的能力

数字对象是信息对象,它包括任何类型或格式的信息,是采用数字形式的一种信息表达法(44)。数字文献是由许多数字对象组成的,究竟我们需要保存数字文献的什么才能传存我们的文化呢?这是一直困扰我们的问题,至今我国图书馆、档案馆均将数字文献作为物理对象保存,也就是像保存书、模拟磁带或唱片一样,仅仅是考虑到维护其介质形体完整,尽管国内不少论文也涉及数字储存技术问题,但考虑到技术进步带来的数据迁移是否会变更数据,是否会有损其完整与可信等问题,至今这种状况也没有什么改变。Kenneth Thibodeau对这个问题进行了透彻的研究(45),他认为所有的数字对象都是具有多种本质属性的实体,其重要特征包含在三种层次中,即它是一个物理对象,也是一个逻辑对象,还是一个概念对象,它在任何一个层次上的属性都是明显不同的。从物理层面讲,数字对象仅仅是指物理媒体上的标记符号;从逻辑层面讲,它是由软件识别和处理的对象;从概念层面讲,它是指由人识别和理解的,或在某些情况下由能够执行商业交易的计算机应用程序识别和处理的对象。对于图书馆、档案馆、数据中心或任何其他需要保存信息对象的机构来说,保存数字文献的最终目的就是,让保存活动的输出应该与保存活动的输入在所有本质方面是一致的。重点强调同一性,但是限定词“所有本质方面”也是很重要的。因此,保存数字对象的步骤与保存物理对象(比如说传统的书或文件)是根本不同的。例如,为了访问任一数字对象,我们必须找到保存的数据,必要的情况下还得通过萃取或综合物理文件的方式来重建其逻辑成分以及逻辑成分之间的关系,解释所有的句法或表达符号或编码,以一种适合个人或商业运用软件识别的格式输出对象。因此,不可能将数字文献作为物理对象来保存,人们应当保存其再造文件的能力。这个结论很好地说明了为了长期保存数字文献而必须随IT技术进步改变数字对象某些层面的正确性,改变数字对象的某些层面与真实保存历史并不矛盾。

4.2 什么是真实的文件

由于比特的可拷贝性以及数字对象是须随技术变更而改变自己的,在数字界如何定义真实的文件极为困难。Jeff Rothenberg指出:“真实性取决于使用,更具体地说,真实性的标准取决于对象的有意义的使用。”(46)按照Rothenberg的说法,在数字世界判断真实性应具有针对性,“只有针对某个标准、规范或模型时,你才能说某东西是真实的”(47)。因此,要一成不变地保存数字对象才算是真实地保存了文件,在数字世界是不可能的或是不现实的或是形而上学的。它或许在我们无休止地纯理论辩论时敲下重锤,使我们在辨别数字对象的真实性时,多了一个评价指标或思维模式。

4.3 厘清了问题

(1)明确了“数字资源保存”与“数字资源归档”之间的区别。

在“归档”和“长期保存”之间存在着重要的差别,只有认识到其区别才能正确地、有针对性地制定数字资源长期保存的策略。现今,已经建立的许多数字资源储存系统,只是完成了数字资源的归档工作,而并没有着眼于长期储存,离维护数字资源长期保存有相当距离。

“归档”是显而易见的,如对数字对象的选择、鉴别、描述、储存和管理等,很多机构都已经开展了这一工作。“归档”的目的是使目标对象具备可机读性和技术的健壮性,它关注的只是提供当前的访问能力。“长期保存”关注的是数字资源的长期获取问题,如何保障数字资源可随时被有效获取,才是我们面临的真正的挑战,它的目标是要解决数字对象在历史长河彼岸,永久地以被人们可理解的形式存在,这要求我们解决软件与硬件的长期支持问题(48)

澳大利亚国家图书馆较早地注意到归档与长期保存的差别,他们将数字资源管理工作的所有工作程序划分为两大块:归档和长期保存。对于澳大利亚国家图书馆,“归档”指的是将数字资源收集到数字档案馆,“长期保存”指的是保证归档的数字资源的真实性、完整性与长期有效性。他们认为,数字资源归档管理者与数字资源保存管理者共同工作并理解各自角色的细微差别是极为重要的(49)

(2)多重备份并不是长期保存数字资源的解决方案。

新近有欧盟国家科学基础工作组(European Union-National Science Foundation Working Group)认为,“多重备份维护安全”(Lots of Copies Keep Stuff Safe)的手段,曾经常被引用作为数字保存的解决方案,现在看来它不是一个解决方案,因为它不能回应技术淘汰带来的系列问题(50)

(3)数字资源长期保存必须在一个连续的统一体内进行。

OCLC与RLG提出,数字资源保存必须在一个连续的统一体内进行,这个统一体是基础设施、元数据和进程的整合,其连续性表现在该三要素必须能够从一个实体扩展到另一个实体,否则数字资源长期保存就不可能完成(51)

(4)电子出版物储存系统应当是稳定的系统。

电子出版物的特点是存储介质与获取格式都十分复杂且变化极快,如何建立具有长期保存功能的储存系统成为20世纪讨论最多的问题。进入21世纪以来,网络欧洲版本图书馆项目组认为,电子出版物储存系统应当是高度受控的,它不应随出版物种类的变化而改变。否则随着IT技术的发展,储存系统会永无止境地处于调节中,这是不利于电子出版物管理的。因而,作为数字储存对象的Web资源、CD-ROM与在线杂志都应当被同一地处置。今天的网络欧洲版本图书馆存储系统就是按照这一设计思想创建的,并已经成功运行(52)

4.4 如何挑选与评价长期保存数字资源的技术

保存数字信息的技术方法是多种多样的,仿真和迁移之间的争论曾在20世纪如火如荼地进行过,但没有任何一种方法可以提供一个充分、总括的答案来解决数字资源的长期保存问题,而且实践证明,抽象地争论这些方法是没有效果的。于是,近年来大家渐渐地达成了一个共识:长期保存用不同途径获取的不同类型的信息需要不同的条件支持(53),关键是如何根据数字对象的特点以及我们的需要去进行选择。有人指出(54),不管采用哪种途径都必须遵守四个标准:被选择的方法必须可行、经济、实用和合适。“可行”要求已有的硬件和软件可以执行此方法;“可信”意味着该方法适用于不确定的将来,或有充足理由断言未来会有其他方法为当前方法提供一种逻辑的延续;“实用”即要求将采用该方法可能遭遇的困难与费用限定在可承受的一定范围内;“合适”要求被选择的方法考虑到保存对象的类型和保存的特殊目的。

5 目前共同关注的问题与期盼

数字资源保存是一个崭新的领域,有许多问题都在探索与讨论中。鉴于笔者阅读范围与重要性权衡,认为以下问题是全球共同关注并有望近期攻克的问题。

5.1 保存元数据

元数据是数字资源管理领域共同关注的问题,从DC到GILS、PICS,从HTML、SGML到XML、RDF,从描述元数据到保存元数据,对元数据的研究越来越深入,应用范围也越来越广。在这些元数据中,惟有保存元数据是以促进资源的长期保存为宗旨的,保存元数据可用于存储、保存描述与保存活动相关的技术支持信息;用于证明曾经进行的保存活动,例如,迁移或仿真;用于记录保存策略的效果;用于随时提供数字资源的真实性的凭证;用于记录收藏管理与版权管理的有关信息。与描述元数据方案(如MARC、都柏林核心)不同的是,描述元数据方案被用于对数字对象进行开发与辨认,而保存元数据主要被用于支持数字对象的存取,有助于数字资源的长期保存。

尽管从20世纪末,人们就展开了保存元数据的研究,但进入21世纪以来人们加紧了对保存元数据的研究,特别是更加重视保存元数据的应用研究(55)(见3.3等部分),如2002年6月,RLG/ OCLC保存元数据工作组发布了支持数字对象保存的元数据框架的报告;2005年9月,OCLC发表了《技术观察报告:保存元数据》(56),对保存元数据以及元数据今后的发展进行了综合全面的论述,很值得一读。为了便于数据的长期可获取,英国国家档案馆开发的PRONOM能够帮助提供技术过时的监测与保存元数据采集,从2002年初开发至今已经从第一个版本(PRONOM 1)发展到第4个版本(PRONOM 4)(57)。在保存元数据的应用过程中,究竟是将其同内容捆绑还是分开管理的问题仍在讨论中,这个问题影响到互用性方法和系统的设计。

5.2 数字资源储存库模型

由于保存数字资源与数字信息的长期有效性相关,数字归档和长期保存问题提出了独特的挑战,其中“长期”也许意味着数十年或数个世纪。在这期间,数字信息需要不断和持续的维护,并且它们依赖于由硬件、软件、数据、信息模型和标准组成的系统,这些系统每隔几年就要更新或替换。对单个的机构来说,承担数字化保存是一种高成本的工作,降低成本与提高效率的方法和手段是共享工具和服务,共享已有的经验与知识,呼唤有机构能够为数字资源的保存提供技术和实际应用方面的指导与服务(58),以降低数字资源的保存成本与享受保障资源有效性的专业性服务。一个有说服力的例子是,位于美国旧金山、建于1996年的Internet档案馆,是一个收藏因特网网站信息和其他原生性数字资源的数字资源库。它是一个非盈利性组织,接受网络导航服务公司Alexa Internet、Kahle/ Austin基金会以及昆腾公司的资助,它已经拥有世界上最大的网页馆藏——大约100亿个网页。但作为一个公共的非营利性的机构,由于缺乏可预测的、稳定的资助,目前它正在寻找稳定的机构合作者来共同协作进行其长期保存的活动(59)

在这种背景下,数字库房成为第三方服务的热点与共享的蛋糕。建立数字库房的价值在于可以共享维护数据安全与有效的专业技术,可降低数据长期保存的费用。但其风险在于,谁为所储存的数据的真实、完整负责,谁能保证储存的信息不流失。为此,近年来国外一些有信托关系的组织已经就数字库房的问题展开了广泛的讨论与交流。2002年,RLG与OCLC(联机计算机图书馆中心)联合就数字库房的可行性与可信性展开讨论,认为可信赖的数字库房如果要可行至少必须解决三个方面的问题:信息持有者怎样赢得他们委托机构的信任,信息持有者怎样才能信任第三方服务提供者,用户怎样才能信任库房提供给他们的数字信息(60)。有人进一步对数字库房的质量保证提出思考,认为要保障被寄存数据的安全,数字库房必须优先实现管理数据的每一个步骤都必须满足已有的系列标准,其中包括质量保证标准ISO 9000系列(61)、信息安全标准(ISO 17799:2005)(62)、机构记录管理标准(ISO 15489:2001)(63)以及开放档案信息系统相关模式(OAIS,ISO 14721)等。

为了使数字库房走向现实,美国档案与记录管理局(NARA)成立了数字库房资格认证组(64)、研究图书馆中心(RLG)建立了数字档案馆的审核和认证项目(65),他们共同组建了RLG-NARA工作组对数字库房资格认证方法进行开发。该工作组调研了大量现有的信息技术标准,包括:CoBIT、ISO 9000系列标准、美国国家技术标准局(NIST)的政府机构的信息安全标准等。发现尽管有很多相关的标准和指导方针,但是仅仅只有一个是针对数字信息长期保存和结构需求的,即开放档案信息系统(OAIS)相关模式(ISO 14721:2002)。考虑到OAIS在数字保存机构得到了广泛的应用,同时作为一项ISO标准,它还提供了在审核和认证过程中所必需的标准基础,但它缺乏与数字储存室的组织环境相符的模块。为此,他们将OAIS与现有的信息技术标准中的相关信息进行整合并结合数字储存室的需求拟定了审核列表。2005年8月末,工作组发布了草拟的审核标准《可靠的数字存储室认证审核列表》(66)以征求意见,并将在2006年6月15日向公众发布并征求公共意见。

对于数字库房的设想也有相反观点,认为数字库房容易受到中断投资的伤害,这将威胁到已有的存储和数据管理,阻止吸纳新的数据和馆藏,并且会减少用户的访问。为了创建一个经济的、共享的数字保存库,需要能长期保持经济活力,为发展数字归档提供动力,能鼓励数字保存工具、技术和服务的研发,以及能鼓励数字内容拥有者缴存其数字内容的经济模型和资助机制,只有逐渐降低数字资源保存成本的商业模型才有助于鼓励保存活动。

5.3 AHDS(英国),一个成功的模式

AHDS(The Arts and Humanities Data Service)是由JISC和AHRB资助的数字资源归档系统,它是一个从松散的存储部门联盟走向一个更为集中的数字资源长期保存服务系统的管理模式(67)。它除可提供人文艺术类数字资源服务外,还可为人文艺术类数字资源的持有者(个人、机构或组织)储存这类资源或提供这类资源的备份管理服务。

AHDS具有5个专家中心可提供数字资源服务,包括管理、保存和传递,还可为存储的数字化资源(包括寄存的)免费编制目录并提供目录。由于具有雄厚的技术资源,它可以储存各种格式的数据,并提供更新、迁移、恢复等服务。按照寄存资源的不同,AHDS免收或收取一定的存储费用。如由AHRB资助的学术项目,或由JISC、ESRC、British Academy、Leverhume等基金以及其他支持高等教育的基金团体所资助的项目的研究成果的储存,不收取任何费用;仅为长期保存而来此储存的数字资源,AHDS保留收取费用的权力;AHDS也接受商业化数据的存储,但将收取费用。为保护知识产权,AHDS要求来此储存数据的客户签订知识产权协议和版权协议,以充分保护其知识产权和版权。同时,它还可为数字资源拥有者提供长期储存数字资源的专业化的建议和指导(68)

AHDS之所以能够得到信任是有一套严格管理措施与国家法律保障的,这种储存服务模式有可能在我国数字图书馆同盟范围内实现,但由谁牵头、由谁资助、哪些IT部门可以加入同盟都是需要从长计议与认真思量的,但AHDS毕竟为全球同行作出了表率。

6 国家图书馆承担了对数字资源保存的责任

信息技术和全球知识经济的发展为图书馆、档案馆提供了极大的舞台与拓展自己影响的空间,其中保存数字文化遗产就是一项意义深远的社会责任,我们有能力并且有义务这样做。尽管数字资源由谁承担保存责任,许多国家都没有明确的法律规定,但许多国家的国家图书馆事实上已成为保存本国数字资源的领航人与责任承担者。例如,自20世纪90年代中期以来,澳大利亚国家图书馆在Web资源归档方面取得全国领导权;在欧洲与美国,为保护学术资源,各国的国家图书馆都研究了系列的有关对策。此外至少在美国、加拿大和其他一些国家,研究图书馆团体也积极加入了这一研究(69)

在我国,国家图书馆在数字资源长期保存的相关研究上也是处于领导地位的,如Web资源归档采集与长期保存、相关数据标准制定等。

7 多领域、多途径合作成为主流

保护数字形态的文化遗产是项巨大的工程,已超出纯技术研究,必须建立恰当的合作机制。例如,2000年11月,美国国会向国会图书馆拨款支持数字信息保存的国家性策略研究时,在拨款说明中特别提出要求国会图书馆与联邦政府的、学术的和非营利组织共同讨论该问题并制定一个可行的计划方案。国会图书馆立即制定出一系列与各行业代表交流的计划,包括技术行业、商业、娱乐业、教育界、法律界、档案和图书馆界(70)。其实,自研究数字资源长期保存以来,各国都认为长期维护数字资源的挑战既来自技术上也来自社会和机构上,即使是最理想的技术方案也需要管理和来自机构的支持。只是进入21世纪以来,这种认识与合作别有特色,在数字资源保存领域,一些跨学科的与跨机构的研究机构与实体正在产生作用,通过他们的研究与创新成果为管理有价值的数字资源的人们提供了指导和协助,为他们提供了可承受的与可操作的程序与支持系统,使数字资源长期保存更具有可实现性。仅仅以下几例就足以说明这个问题。

7.1 OCLC

联机计算机图书馆中心(OCLC)与研究图书馆集团(RLG)合作,在数字资源长期保存方面展开了许多实质性工作,并在工作中推进了对数字资源长期保存的研究。

在保存数字信息的所有活动的每个阶段,OCLC都是从多个领域展开调研,包括选择标准和必须的保存服务等级、数字保存领域新的合作机会、数字信息寄存的有偿服务、数字信息获取权的管理、保存策略、元数据需求等,在这些活动中OCLC与数字保存界保持紧密联系与合作,互通信息并共享效益。此外,OCLC还建立基金支持其合作者以及在数字保存领域探测新机会的组织与个人(71)

7.2 网络欧洲版本图书馆(NEDLIB)

NEDLIB是一项欧洲国家的国家图书馆的合作项目,其目的是构建一个联网的欧洲存储图书馆的基础结构。参与该项目的8个国家图书馆在研究电子出版物工作流程的基础上,就如何建立全欧洲的电子出版物储存系统达到共识。为了使全欧洲共享统一的电子出版物储存系统,NEDLIB项目组制定了建立数字文献储存系统方面的指南,勾勒出国家图书馆如何在数字图书馆基础框架下设计一个数字架构作为独立的模块,及如何实现这些数字架构使其尽量与开放档案信息系统(OAIS)的标准保持一致。如今,该项目已经得到欧洲国家的国家图书馆的响应并走向了实际应用阶段。

7.3 保存数字遗产:国家数字基础结构与保存方案

2002年10月,美国国会图书馆、美国国家科学基金会共同立项研究数字资源长期保存(保存数字遗产:国家数字基础结构与保存方案),聚集了计算机科学、信息科学、档案学、数字图书馆专家和政府计划负责人,对数字资源长期保存展开研究,试图通过该项目达到解决数字资源长期保存的关键问题与促进计算机和信息技术的横向研究(72)。2003年8月,他们共同举办了“数字资源归档与长期保存研究”研究会,会议讨论了归档和数字资源长期保存研究的专题问题。通过广泛研讨,认为目前正是针对数字信息长期保存进行协作研究的大好时机,长期保存数字信息资源研究还将促进计算机科学、信息科学和档案学以及社会行为科学增加新的研究领域,通过该项研究将创建更多的、解决当前归档需求的、经济实用的保存模型,并可为新技术与服务创造新的商机。为此,他们认为数字资源长期保存研究代表了公共利益,其当前投资不仅授益给子孙后代,而且数字资源归档研究还会立刻产生社会效益(73)

7.4 英国网络归档联盟

2004年6月,英国6个机构联合共同组建“英国网络归档联盟”(UK Web Archiving Consortium),该联盟的口号是“将Web资源生命周期从44天左右延长到一个世纪以上”(74),以确保后代能获取可选择的有价值的资源。

7.5 DPC

DPC数字化保存联盟建立于2001年,是为了满足英国数字化资源保存安全的迫切需要,以及其他国际上的合作以确保全球数字化记忆和知识基地的安全建立的联盟(75)

7.6 数字资源合作管理国际研讨会(76)

我国在数字资源长期保存方面的合作研究很多都是跨国进行的,遗憾的是在国内脚踏实地进行横向合作的不多。尽管如此,充分地了解国际进展、学习国际先进经验、开拓国际合作,对于推动我国数字资源长期保存战略的研究和应用,具有重要意义。21世纪以来,我国展开的相关合作研究不完全统计有:

2003年,由图书馆数字信息基金会(eIFL)、中国科学院国家科学数字图书馆项目管理中心(CSDL)、国家科技图书文献中心(NSTL)联合举办的“数字资源合作管理国际研讨会”在北京召开。各国专家交流了数字资源选择与评估及数字资源长期保存等问题。

7.7 中欧数字资源长期战略保存国际研讨会(77)

2004年7月,国家科技图书文献中心、国家图书馆、中国高等教育文献保障系统、中国科学院国家科学数字图书馆项目管理中心和欧洲有关国家图书馆合作,邀请了11位欧盟国家直接从事数字资源长期战略保存国家战略设计、技术系统设计、应用项目组织的专家于北京举行“中欧数字资源长期战略保存国际研讨会”,就实际问题进行了系统介绍,并与中国代表进行讨论。

7.8 中德图书馆合作

2005年5月,第二届中德图书馆合作研讨会在德国汉诺威召开,经双方代表商议确定的合作意向中,包括在数字资源长期保存等方面开展专题合作研究(78)

7.9 EMANI项目(79)

清华大学图书馆受邀参加的EMANI(Electronic Mathematics Archiving Network Initiative)计划,这是一个针对“数学文献电子文档网络”研发的国际合作项目,由美、德、法、中的图书馆及联盟(美国Cornell大学图书馆、德国哥廷根大学图书馆、法国MathDoc联盟、中国清华大学图书馆)参加。EMANI于2002年2月正式启动,宗旨是逐步将世界范围内从古至今在数学领域的出版物数字化,在长期稳定保存的同时,以数字图书馆方式向全球的用户提供快捷的检索和全文浏览等服务。

8 新思维、新问题在不断涌现

数字资源长期保存的问题,不仅是个技术问题与管理问题,它还涉及人文思想领域与经济领域。例如,有人提出,被保存的数字资源今后的价值与可用性在当前是不明朗的,数字保存的经济模型就好像经济学中的公共产品,我们现在急需研究和开发能维持数字保存的经济和商业模型,数字保存的资助和商业模型与普通的商业模型有很大的不同,新的商业模型必须要使个人、政府机构、大学、文化机构和社会大众能负担得起数字保存的成本(80)

IT技术改变了我们的文化,在保存Web资源的研究还在令人头疼时,“博客”(blogs)资源是否该保存的问题已经提出。

由于当前的Web归档活动还处于初期阶段,大部分注意力都集中在与传统出版物有类似特点的网络出版物上,对blogs资源是否属于当前值得捕获和保存的在线资源,国内外都还没有达成共识。但国外有许多博客们呼吁Internet Archive将blogs资源归档保存(81)。有些承担采集Web资源的国家图书馆认为,之所以没有归档blogs资源,是由于缺乏相关法律依据而无法采集。然而,澳大利亚国家图书馆2003年更新的《澳大利亚在线出版物:归档和保存的选择标准》是个例外,其将blogs资源列入“除了那些支持学术出版物的目录,一般没有被收集的目录”之下(82);加拿大国家图书馆1998年10月制定的《网络电子出版物政策与指南》虽然没有提及blogs资源,但明确表示“公众通讯”应在非常有选择性的基础上加以捕获(83),因此blogs资源属于归档之列。

有学者认为blogs资源是应当归档的,其最简单也是切中要害的理由是:它们代表了21世纪初对人类有相当影响的、与众不同的一种通讯形式;它们是一种社会和文化现象,并且能帮助未来的史学家理解我们这个时代。有人还对blogs资源采集方案提出建议:最有影响的blogs应该得到优先归档,其影响性可以通过读者人数或者链接数来确定(84)

也许,采集blogs资源迟早会成为大多数国家的行动,但采集blogs资源谈何容易!归档blogs资源存在着另类挑战,如:第一,blogs的版权、动态的内容、密码保护、文件格式独特、编码不规范以及收割机被拒等,都使归档blogs比一般Web更为困难;第二,难以发现与识别blogs,特别是游离于那些受欢迎的blogs服务器以外的blogs;第三,blog包有多种特征和功能,也给采集造成困难,如它允许读者评论和回溯,而可能这才是这些blog里最有价值的东西,但它们被保留的时间却相当短;第四,Blog经常会链接其他Web内容并对其发表评论,而该链接常常由于过时而影响到其内容的完整导致人们无法理解归档的blog。

IT技术像个处在活跃期的活火山,它不断喷发着积聚的能量,改变着我们的社会,改变了我们的生活。我们只有适应它、驾驭它才能使这种创新的能量有利于人类的进步与发展。今天,只有多方位的合力、多元化的支持与脚踏实地的研究与创新性的实践,才可能因势利导地克服IT技术带来的阻碍,使数字文化遗产得以永世传存。鸟瞰近5年数字资源长期保存的成果,相信几个世纪之后的人们将发现我们今天在数字资源保存方面的努力是有价值的。

img46

【作者简介】刘家真,武汉大学信息管理学院教授/博士生导师,研究方向:信息化与数字信息资源管理,政府信息化与电子文件管理研究,主持多个国家基金课题,出版专著与教材10余本。

【注释】

(1)本文为国家自然科学基金课题“中国文化数字资源保存库的国家战略研究”(编号:70373048)的研究成果之一

(2)参考Dutch National Archives and the Dutch Ministry.Final recommendations of the Digital Preservation Testbed on the long term preservation of emails,June 2003.(访问时间:2005/06/05)http://www.bibliotheken.nl/hrd/dd/dd_ links_en_publicaties/publicaties/volatility-permanence-email-en.pdf(访问时间: 2006/02/01)

(3)Ruskin Avenue.e-Government Policy Framework for Electronic Records Management.www.pro.gov.uk/recordsmanagement/(访问时间:2006/02/05)

(4)CODATA News and Events.http://www.codata.org/(访问时间: 2005/06/18)

(5)PV-2004.Ensuring the Long-Term Preservation and Adding Value to the Scientific and Technical Data.http://www.congrex.nl/04a08/(访问时间: 2005/03/10)

(6)Digital Curation Centre.Ensuring Long-term Preservation and Adding Value to Scientific and Technical data(PV 2005).http://www.ukoln.ac.uk/ events/pv-2005/(访问时间:2005/06/04)

(7)FINAL REPORT.The Selection,Appraisal and Retention of Digital Scientific Data(Biblioteca Nacional,Lisbon December 15-17,2003).http:// www.erpanet.org(访问时间:2005/06/18)

(8)Schurer.Records Appraisal Tool.http://edc2.usgs.gov/government/ RAT/tool.asp(访问时间:2005/06/19)

(9)Welcome to the InterPARES 2 Project.http://www.interpares.org/ip2/ ip2_index.cfm(访问时间:2005/06/20)

(10)Portico Announces Archive Support Fees for Libraries.http:// www.portico.org/about/012206.html(访问时间:2005/06/15)

(11)About the ECHO DEPository Project.http://www.ndiipp.uiuc.edu/index.php?option=com_content&task=view&id=12&Itemid=28(访问时间: 2006/06/06)

(12)Incentives for Data Producers to Create Archive-Ready Data Sets.http:// www.si.umich.edu/incentives/FastLane-2.pdf(访问时间:2005/06/25)

(13)DAAT:Digital Asset Assessment Tool.http://ahds.ac.uk/about/projects/daat/(访问时间:2005/06/09)

(14)MGR.Metadata Generation Research.http://www.ils.unc.edu/mrc/ mgr.html(访问时间:2005/06/10)

(15)Digital Academic Repositories.http://www.surf.nl/en/themas/index2.php?oid=7(访问时间:2005/06/12)

(16)Australian Partnership for Sustainable Repositories.www.apsr.edu.au/(访问时间:2005/06/13)

(17)Digital Curation Centre.http://www.dcc.ac.uk/(访问时间:2005/ 06/15)

(18)Auditing and Certification of Digital Archives.http://www.crl.edu/content.asp?l1=13&l2=58&l3=142(访问时间:2005/06/18)

(19)Digital Preservation Cluster.http://www.dpc.delos.info/cluster/index.php(访问时间:2005/06/18)

(20)VAL.Virtual Archives Laboratory.http://www.archives.gov/era/research/virtual-archives-lab.html(访问时间:2005/06/15)

(21)刘家真等.拯救数字信息:数据安全存储与读出策略研究.北京:科学出版社,2004另请参考:颜哓栋.电子文件的长期保存研究[硕士学位论文].武汉大学,2004

(22)请查阅:
●杨道玲.Web资源采集策略评析与思考.图书情报知识,2004(5)
●杨道玲.Web资源保存现状与思考.图书馆杂志,2004(10)
●杨道玲.Web资源保存的热点问题管窥.图书情报工作,2005(1)
●王少辉.数字信息长期存取中的知识产权问题研究综述,2004年全国博士生论坛论文集
●杨道玲.归档网络文献的选择策略.图书馆杂志,2006(2)
●杨道玲.中文Web档案馆的建设构想.图书情报知识,2006(1)

(23)请参考:
●武汉大学.“第一届数字化信息资源建设研讨会”在我校召开.http://www.csir.whu.edu.cn/csir/PubZXDTDetail.do?ID=155(访问时间:2006/01/10)
●刘家真.我国图书馆信息系统灾备方案的建议.图书情报工作,2006(3)

(24)请参阅:
●杨道玲.电子出版物呈缴问题探讨.国家图书馆学刊,2006(1)
●冯杏吉.电子图书保存面临的问题与思考.图书馆杂志,2006(3)

(25)吉林省哲学社会科学规划基金会.http://www.jlpopss.gov.cn/new/ newscontent.asp?id=538(访问时间:2005/06/10)

(26)我国数字图书馆标准规范建设之数字资源惟一标识符应用规范. http://cdls.nstl.gov.cn/cdls2/w3c/2003/UI/(访问时间:2006/01/10)

(27)Margaret Hedstrom.Research Agendas Set Course for Digital Archiving and Long-Term Preservation.http://www.rlg.org/legacy/preserv/diginews/diginews7-6.html#feature2(访问时间:2005/06/19)

(28)Report on the BL/CURL DPC Forum held at the British Library Conference Centre.(Tuesday 19th October 2004).http://www.dpconline.org/graphics/ events/041019forum.html(访问时间:2005/06/20)

(29)Titia van der Werf.Experience of the National Library of the Netherlands. http://www.clir.org/pubs/reports/pub107/vanderwerf.html(访问时间:2005/ 12/28)

(30)Garrett,John.2002.ISO Archiving Standards—Reference Model Papers. http://ssdoo.gsfc.nasa.gov/nost/isoas/ref_model.html.(访问时间:2005/12/ 29)

(31)International Standards Organization(ISO).2002.Open Archival Information System—Reference Model.http://ssdoo.gsfc.nasa.gov/nost/isoas/overview.html.(访问时间:2005/06/10)

(32)InterPARES Project Preservation Task Force.In press.Report of the Preservation Task Force.http://www.interpares.org(访问时间:2005/06/10)

(33)Donald Waters.Good Archives Make Good Scholars:Reflections on Recent Steps Toward the Archiving of Digital Information.http://www.clir.org/pubs/ reports/pub107/waters.html(访问时间:2005/06/25)

(34)The Open Archival Information System(OAIS)Reference Model and its Usage.http://www.ccsds.org/documents/SO2002/SPACEOPS02_P_T5_39.PDF(访问时间:2005/06/10)

(35)国家图书馆.中文元数据方案.http://www.cdi.cn/download/ dmds.pdf(访问时间:2005/06/10)

(36)Digital Library Federation.2002.Benchmark for Digital Reproductions of Monographs and Serials as Endorsed by the DLF.http://www.diglib.org/standards/bmarkfin.htm(访问时间:2005/12/28)

(37)Donald M.Framework for Digital Archiving:OAIS Reference Model. http://www.press.umich.edu/jep/05-04/hodge.html(访问时间:2005/12/ 29)

(38)OCLC.April 2002.A Recommendation for Preservation Description Information:A Report by the OCLC/RLG Working Group on Preservation Metadata. http://www.oclc.org/research/pmwg/pres_desc_info.pdf.(访问时间:2006/ 01/01)

(39)Sawyer.Presentation delivered at the OCLC Steering by Standards Teleconference on the OAIS Imperative:Enduring Record or Digital Columbus2.http:// www.clir.org/PUBS/reports/pub107/bellinger.html(访问时间:2006/01/01)

(40)Electronic Information Resources Strategies and Action Plan 2001-2002. http://www.nla.gov.au/policy/electronic/resourcesplan2001report.html(访问时间:2005/06/22)

(41)国家图书馆数字图书馆管理处.国家数字图书馆工程标准规范(第一批).http://www.nlc.gov.cn/ndlc/xmjz_10.html(访问时间:2006/01/ 10)

(42)中国国家图书馆“网络信息资源保存”试验项目.http:// 202.96.31.34/index.htm(访问时间:2006/01/10)

(43)中国Web信息博物馆.http://www.infomall.cn(访问时间:2006/ 01/10)

(44)Kenney,Anne R.Moving Theory into Practice:Digital Imaging for Libraries and Archives.http://www.rlg.org/preserv/mtip2000.html(访问时间: 2005/06/01)

(45)Kenneth Thibodeau.Overview of Technological Approaches to Digital Preservation and Challenges in Coming Years.http://www.clir.org/pubs/reports/ pub107/thibodeau.html(访问时间:2006/02/01)

(46)Rothenberg,Jeff.2000.Preserving Authentic Digital Information.In Authenticity in a Digital Environment.http://www.clir.org/pubs/abstract/ pub92abst.html.(访问时间:2006/02/01)

(47)DAAT:Digital Asset Assessment Tool.http://ahds.ac.uk/about/projects/daat/(访问时间:2005/06/09)

(48)Titia van der Werf.Experience of the National Library of the Netherlands. http://www.clir.org/pubs/reports/pub107/vanderwerf.html(访问时间:2005/ 12/28)

(49)Colin Webb.Digital Preservation—A Many-Layered Thing:Experience at the National Library of Australia..http://www.clir.org/pubs/reports/pub107/ webb.html(访问时间:2005/06/19)

(50)Titia van der Werf.Experience of the National Library of the Netherlands. http://www.clir.org/pubs/reports/pub107/vanderwerf.html(访问时间:2005/ 12/28)

(51)Meg Bellinger.Understanding Digital Preservation:A Report from OCLC. http://www.clir.org/pubs/reports/pub107/bellinger.html(访问时间:2005/ 06/15)

(52)Titia van der Werf.Experience of the National Library of the Netherlands. http://www.clir.org/pubs/reports/pub107/vanderwerf.html(访问时间:2005/ 12/28)

(53)Granger,Stewart.Emulation as a Digital Preservation Strategy.D-Lib Magazine 6(10)(October)http://www.dlib.org/dlib/october00/granger/ 10granger.html(访问时间:2005/06/27)

(54)Moore,Reagan,et al.2000.Collection-Based Persistent Digital Archives-Part 1.D-Library,2000(6):3

(55)CASL Consortium.http://www.caslconsortium.org/(访问时间:2005/ 06/20)

(56)Brian Lavoie.Technology Watch Report:Preservation Metadata.(September 2005)http://www.dpconline.org/docs/reports/dpctw05-01.pdf(访问时间:2006/01/10)

(57)Thetechnicalregistry:PRONOM.http://www.nationalarchives.gov.uk/aboutapps/pronom/default.htm(访问时间:2006/01/01)

(58)BL/CURL/DPC Forum(19 October 2004).Planned Digital Preservation R&D.http://www.dpconline.org/docs/events/041019downing.pdf(访问时间: 2005/06/28)

(59)The Internet Archive website.http://www.rlg.org/preserv/diginews/ diginews6-3.html#interview(访问时间:2005/06/28)

(60)RLG/OCLC Working Group on Digital Archive Attributes.Trusted Digital Repositories:Attributes and Responsibilities:An RLG-OCLC Report.http:// www.rlg.org/en/pdfs/repositories.pdf(访问时间:2005/07/10)

(61)ISO Management Systems.http://www.iso.org/iso/en/iso9000-14000/ index.html(访问时间:2005/12/10)

(62)ISO/IEC 17799:2005:Information technology-Security techniques-Code of practice for information security management.http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=39612&ICS1=35&ICS2= 40&ICS3=(访问时间:2005/12/10)

(63)ISO 15489-1:2001 Information and documentation-Records management-Part 1:General,ISO/TR 15489-2:2001 Information and documentation-Records management-Part 2:Guidelines.http://www.iso.org/iso/en/CatalogueDetail-Page.CatalogueDetail?CSNUMBER=35845&ICS1=1&ICS2=140&ICS3=20(访问时间:2005/12/10)

(64)Digital Repository Certification Task Force.http://www.rlg.org/en/ page.php?Page_ID=367(访问时间:2005/12/20)

(65)Certification of Digital Archives.http://www.crl.edu/content.asp?l1= 13&l2=58&l3=142(访问时间:2005/12/01)

(66)RLG-NARA Task Force on Digital Repository Certification.Audit Checklist for the Certification of Digital Repositories:Draft for Public Comment(August 2005).http://www.rlg.org/en/pdfs/rlgnara-repositorieschecklist.pdf(访问时间:2005/12/05)

(67)Andrew Speakman,Hamish James.Storage Resource Broker(SRB)at the AHDS.http://www.dpconline.org/docs/events/041019james.pdf(访问时间:2005/12/13)

(68)About the Arts and Humanities Data Service.http://ahds.ac.uk/about/ index.htm(访问时间:2005/12/15)

(69)Clifford A.Lynch.CNI has long had an interest in digitization and digital preservation.(RLG DIGnews,Aug.15,2004)http://www.rlg.org/en/page.php?Page_ID=19481#article0(访问时间:2005/06/10)

(70)Library of Congress.Building a National Strategy for Preservation:Issues in Digital Media Archiving.http://www.clir.org/pubs/reports/pub106/contents.html(访问时间:2005/12/10)

(71)Digital Library Federation.2002.Benchmark for Digital Reproductions of Monographs and Serials as Endorsed by the DLF.http://www.diglib.org/ standards/bmarkfin.htm(访问时间:2005/12/28)

(72)Preserving Our Digital Heritace:Plan for the National Digital Information Infrastructure and Preservation Program.http://www.digitalpreservation.gov/repor/ndiipp_plan.pdf(访问时间:2005/12/10)

(73)It’s About Time.http://www.digitalpreservation.gov/repor/NSF_ LC_Final_Report.pdf(访问时间:2005/12/20)

(74)UK Web Archiving Consortium.http://www.webarchive.org.uk/index.html(访问时间:2005/12/22)

(75)DPC History.http://www.dpconline.org/graphics/about/history.html(访问时间:2005/12/23)

(76)数字资源合作管理国际研讨会.http://www.las.ac.cn/ISCMER/ISCMERBeijing/cn/index.html(访问时间:2006/01/10)

(77)中欧数字资源长期战略保存国际研讨会.http://www.csdl.ac.cn/ meeting/cedp/(访问时间:2006/01/10)

(78)2005年中德图书馆合作研讨会及欧洲图书馆考察.http:// www.csdl.ac.cn/archives/000980.html(访问时间:2006/01/10)

(79)关于中文数学数字图书馆.http://elib.lib.tsinghua.edu.cn:9080/ mathdl/htm/about/about.htm(访问时间:2006/01/10)

(80)TNA Recordkeeping Nov.04.http://www.nationalarchives.gov.uk/ services/pdf/summer2005.pdf(访问时间:2005/12/10)

(81)Invisible Adjunct(May 26,2004).http://www.invisibleadjunct.com/archives/000510.html(访问时间:2005/07/10)

(82)Online Australian Publications:Selection Guidelines for Archiving and Preservation.http://pandora.nla.gov.au/archived/selectionguidelines2003.html(访问时间:2005/08/12)

(83)Electronic Collections Coordinating Group,National Library of Canada. Networked Electronic Publications Policy and Guidelines(October 1998).http:// www.collectionscanada.ca/9/8/index-e.html(访问时间:2005/08/10)

(84)Richard Entlich.Blog Today,Gone Tomorrow?Preservation of Weblogs. http://blogs.law.harvard.edu/whatMakesAWeblogAWeblog(访问时间:2005/ 12/10)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈