二、特色文献数据库建设
特色数据库是指依托馆藏信息资源,针对用户的信息需求,对某一学科或某一专题有利用价值的信息进行收集、分析、评价、处理、存储,并按照一定标准和规范将其数字化,以满足用户个性化需求的信息资源库。
(一)建设现状
目前我国高校图书馆、公共图书馆和科学院图书馆都十分重视创建特色数据库。高校系统以高等学校文献保障系统(CALIS)特色专题数据库为例,全国高校专题特色数据库是CALIS“十五”建设的子项目之一,由CALIS华中地区中心武汉大学图书馆牵头组织实施。特色数据库子项目遵循“分散建设、统一检索、资源共享”的原则,采取重点支持和择优奖励相结合的资助方式,鼓励具有学科优势和文献资源特色的学校积极参加专题特色数据库的建设,建成一批具有中国特色、地方特色、高等教育特色和资源特色,服务于高校教学科研和国民经济建设,方便实用、技术先进的专题文献数据库。
项目采用集中组织管理、建库标准相对统一、参建学校分散建库、专家监督指导的建设方式,整个项目建设流程由公布建设内容和要求、项目申报、评审立项、项目实施、中期检查、试运行检查、成果验收七大环节组成。从2003年初启动以来,已完成项目启动、项目申报、评审立项等工作,目前正进入实施执行阶段。全国共有61所学校的75个项目获立项。目前已建成由CALIS项目资助的特色数据库共53个(详见表7-2)。另外,科学与专业图书馆也根据其资源与人才优势,开发特色数据库。同时,各省市公共图书馆在各自特色文献的基础上,发挥收藏优势和地域优势创建一批具有地方文献特色的数据库和专题文献数据库。
表7-2 CALIS全国高校专题特色库一览表
续表
注:本表根据《全国高校专题特色库子项目工作会议纪要》[18]整理而成。
(二)特色数据库的类型
建设特色数据库,要注意三点:第一,独特性。使建成的数据库具有其他数据库不具备或很少具备的特点。第二,全面性。要保证建立的数据库的数据完整、全面。第三,标准化。一般来说,特色数据库可以划分为以下类型:
①根据本校专业重点和馆藏特色建立的数据库,全面搜集各种类型、载体的信息资源,进行整理、加工而成,如“通信电子系统与信息科学数据库”等。
②为本地区经济、文化建设服务而建立的数据库,搜集全国各类资料。如“巴蜀文化数据库”、“长江资源数据库”、“东北亚研究文献数据库”、“上海作家作品资料”等。
③为抢救濒临湮灭的珍贵史料而建设的数据库,如清华大学图书馆搜集整理有关中国工程技术史文献资料建设的“中国科技史数字图书馆资料库”等。
(三)应注意的问题及相关措施
1.宏观调控方面
我国的特色数据库建设缺乏宏观调控,基本上是各自为政、分散发展,一方面图书馆的经费紧缺,同时又在重复建设,造成资源浪费。所以必须进行宏观调控、统筹规划。可以在相关主管部门的指导和协调下,成立数据库建设协调合作中心,及时对现有数据库进行调查、统计并通报,对新建设项目进行协调管理,避免重复建设,以免造成人、财、物的浪费。特色数据库关键就是要有“特色”,如要突出地方特色,就应具有一批与地域和历史人文特色、地方的政治、经济和文化发展密切相关的资源;要突出馆藏特色,就要具有他馆、他校所不具备或只有少数馆具备的特色馆藏,或散在各处、难以被利用的资源等。
2.标准化与规范化方面
标准化是特色数据库建设的质量保证。数据库运行的可靠性、系统性、连续性、完整性、兼容性有赖于标准化,而且标准化是实现网络信息资源共享的基础。因此,在数据库建设过程中,注意数据的规范化和标准化,采用《我国数字图书馆标准规范研究》项目所推荐的一系列相关标准、元数据标引格式规范、文献著录的有关国际标准和国家标准。主要包括通信标准(TCP/IP)、字符编码标准、标准通信置标语言/可扩展置标语言(SQML/ XML)、元数据(METADATA)标准、检索语言标准、安全标准等。对各类型特色库实现统一元数据检索与分布式的全文服务功能,将不同厂商、不同结构的数据库整合,统一检索,建立特色库元数据收集及对象数据访问机制。特色库建设的标准化与规范化有利于实现数据库之间的转换和互联、互访,同时又节约用户的检索时间和降低费用,提高检索效率,最终实现资源共建共享的目标。
3.检索功能方面
有些特色数据库提供了题名、著者、刊名、分类号、关键词等检索途径,但缺少高级检索功能。用户只能输入简单的检索词进行检索,而不能利用检索运算符构造检索式,进行复杂检索。要建立完善的多功能检索系统,就需要提供多种检索途径。具体包括:要根据文献信息的内容及形式,选取最能反映其特征及最有可能被利用的检索途径,设置丰富有效的检索点。既要提供信息资源的外部特征检索和全文检索,又要提供分类和语词检索。还要能实现各项之间的“与”、“或”、“非”的逻辑组配检索,而且可实现标引词的位置运算符检索,并在一次检索结果的基础上实现多次循环检索。除了完善的检索功能外,还需要设置方便的浏览功能,建立友好的网上检索界面,在网页上设置较详细的帮助或举例的链接。
4.知识产权方面
在创建特色数据库过程中,数据资源无论是取自对本馆馆藏文献的数字化、还是来自购买数据库资源以及通过共享或链接利用网络数据,都会涉及知识产权问题。我们应从著作权人的利益和图书馆公众利益两方面综合考虑知识产权问题,协调均衡两者利益。既要提倡保护著作权人利益,同时也要大力发展数字图书馆。著作权法赋予图书馆对受知识产权保护的信息资源合理使用的权利,为社会公众的利益而使用信息资源,不以赢利为目的,可以在著作权法允许的范围内合理使用信息资源。在进行特色库建设时可以采用以下方式来解决知识产权问题:第一,自由利用那些不涉及著作权、不受著作权法的限制的信息资源。第二,委托出版社联系取得授权,或者直接与其合作,让其负责解决受著作权保护的信息资源的知识产权问题。第三,争取作者大力支持,争取让其赠给图书馆使用或者适当给予报酬。另外在收集、购买、共享、链接新的信息资源时,也要考虑知识产权问题。[19]
CNKI系列数据库的文献著作权问题就是通过下面两种方式加以解决的:(1)合法规范解决已出版文献的数字出版著作权使用许可,对于期刊、图书文献,与期刊编辑出版单位签约取得期刊、图书等文献编辑版权的使用权;通过期刊编辑出版单位(或通过法定许可)取得文献作者的著作权使用许可,并按版税制支付稿酬。对于报纸文献,采用法定许可取得报纸文献的转载出版权,并公开直接向文献作者按版税制支付稿酬。(2)规范获得自主编辑出版作品中文献的数字出版发行权,由博硕士培养单位、会议主办单位组织或由博硕士学位论文和会议论文作者本人向中国学术期刊(光盘版)电子杂志社投稿,将文献的数字出版与发行权授予电子杂志社,杂志社在接收录用稿件的同时以约定稿费标准支付稿酬。[20]
5.资源的深加工方面
特色数据库类型较为单一,专业特色不突出,根据学科建设、专业特色和地区特色进行文献深加工的专题数据库不多。多以馆藏常规文献为依托、以书目、学位论文为主攻方向,全文、图形图像及事实信息数据库很少,信息服务基本停留在“copy”的水平上。要把特色馆藏开发与个性化服务结合起来,个性化服务包括个性化定制服务、个性化推荐服务、个性化知识决策服务,这三种服务都要通过相应的软件系统来实现。[21]
当今数据库本身的发展趋势为:一是数据库主题由科技型向经济型、商业型倾斜;二是全文数据库在各种类型数据库中异军突起;三是数据库的多媒体化与网络化。全文数据库的发展已形成主流,我们要在坚持建设好图书馆书目、题录、文摘等二次文献数据库的同时,有重点地逐步建立起全文、数值、事实、图文、多媒体数据库,注重数据库的附加值,对数据进行组织、整理和深加工,创建易用、友好及检索途径众多的用户界面。
另外,我们还应重视特色数据库的管理与维护。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。