5.2 数字科学信息服务
从科学信息交流发展历史来看,科学信息服务的模式与内容也是与信息载体技术的发展和进步密切关联的,在信息载体发展的不同阶段,科学信息服务的模式和内容也不尽相同。例如,就服务模式而言,在零载体阶段,科学信息几乎是以科学研究人员“自助”的方式来获得服务或利用科学信息的;进入纸型载体阶段,图书馆、情报中心等各种类型的科学信息机构承担起了科学信息服务的职能,研究人员可以从专门的科学信息机构获得全方位的科学信息服务,此时的科学信息服务模式是典型的科学信息“机构-用户”模式。与这些服务模式相适应,不同的载体时期,信息服务的内容也不尽相同。那么,在网络载体条件下,科学信息服务的内容又有哪些变化呢?科学信息服务的模式将会是一个什么样子呢?
5.2.1 基于网络的科学信息服务概述
毕强在《网络信息服务现状分析》一文中断定,网络信息服务将成为“21世纪信息服务的主流”。[7]那么,什么是网络信息服务呢?毕先生认为,网络信息服务是“针对用户的信息需求,以现代信息技术为手段,依托计算机通信网络,向用户提供原始信息以及经加工整理的有效信息、知识与智能的活动,分为传统信息服务在网络环境下的应用和新型的网络信息服务。”“网络信息服务的立足点为网络信息资源。”
与基于纸型载体的传统信息服务相比,网络信息服务的特征不仅仅表现为技术手段上的差异。事实上,网络信息服务并不仅仅是传统信息服务的网络化改造,而是一种具有全新特征的信息服务活动。无论是服务内容、服务方式,还是服务规范、服务理念,两者都有很大差异。下面,我们将对网络信息服务的主体与内容等两个主要问题进行简要分析。
(1)网络信息服务的主体
信息服务主体是信息服务的执行者,信息服务主体的变更对信息服务活动的影响无疑是十分深远的。众所周知,在传统的纸型载体环境下,由于学术资源占有方面的绝对优势,图书馆、情报中心等专业科学信息服务机构得以成为科学信息服务的主体,它们是全社会科学信息服务体系的基石。
然而,进入网络载体时期,随着信息资源占有独占性的逐步丧失,专业科学信息服务机构在科学信息服务体系中的主导地位开始动摇。科学信息服务职能将从由单一的图书馆、信息中心等专业科学信息服务机构主导过渡到由科学信息服务机构(图书馆、信息中心等)、网络信息发布机构(网络出版单位)和综合信息服务商等多元化的信息主体共同主导。与此同时,专业图书情报机构在科学信息服务活动中的地位将逐步弱化,一些新兴网络信息服务机构,如网络出版商,在科学信息服务活动中的地位将迅速提升,科学信息服务主体多元化的体系将逐步形成。
那么,在网络载体条件下,科学信息服务主体到底由哪些方面构成呢?
南开大学王知津教授等认为[8],“一馆一舍的传统信息服务机构必然演变为全开放的、社会的、多样的信息服务机构。”王教授强调,“在网络环境下,信息服务机构呈现出多元化趋势。”王教授进而归纳出了目前存在的4种类型的网络信息服务机构,即:一是以新闻媒体为主的服务系统,如中国经济电讯网、中国经济信息化网络等;二是由政府部门统一部署的以国家经济信息中心为主体的各部委信息中心,这些机构已开展全国科技信息联机服务、银行电子化联机服务、中国专利文献数据库服务等;三是以传统文献信息服务机构(如各种类型图书馆、档案馆、情报部门)为主体,以利用各种馆藏局域网服务为特征的信息服务;四是各类商业协会及公司创办的服务机构,如联得网络、纪元万用信息网络、网络在线服务、易卖系信息网络等。这些机构的信息服务遍及贸易、能源、商业、电子等众多领域。当然,王教授的研究虽然并不是针对单纯的科学信息服务而言的,但却是包括科学信息服务在内的广义的信息服务。显然,这对我们研究科学信息服务主体的变革也是有一定积极意义的。
张晓林教授在其有关“学术信息交流体系重组”的一系列论文[9][10]中对网络环境下学术信息交流主体的演变进行了深入系统的研究。张教授的研究表明,网络环境下学术信息交流主体的演变必将导致学术信息交流体系的重组。张教授指出,“数字化网络化技术,不仅给我们带来了丰富的数字化信息资源和更加有效便利的信息检索与利用技术,而且作为一种全新的技术基因,必然要求与之适应的运行体系和管理机制。目前,以数字化出版发行为手段的,以出版商为主导的学术信息资源体系和以二次文献商、检索商、发行商、新型的信息资源与服务集成商等驱动的‘全面信息服务’机制正在使传统的严格有序分工的学术信息交流体系出现根本性重组。”张教授进一步认为,在网络环境下,新兴的学术信息服务主体主要有:数字化出版、数字化发行商、传统文摘索引商与检索服务商、新兴数字化集成化信息服务商等几个大类。
基于相关研究成果,我们将仅对数字化出版发行商这一典型的网络科学信息服务主体作一个简要介绍。
出版发行商是以商业运作方式从事信息发布的企业、组织或个人。在传统纸型载体时期,出版发行商定位于信息交流的第一个环节,专司信息的发布活动,一般都不涉及信息交流的其他环节。进入网络载体时期,数字化出版方式的普及导致了信息交流不同环节职能的重新界定,为传统出版发行商单一信息发布职能的拓展与延伸提供了可能。由于原生科技文献出版发行商拥有控制着科学信息交流产业链上游资源的先天优势,在网络载体兴起与普及的信息载体演进过程中,一些大型原生科技文献出版发行商利用这一优势轻易打破了传统载体条件下信息交流不同环节的职能划分格局,从科学信息交流的第一个环节跨入信息交流的最后一个环节——科学信息服务环节,进而迅速成为网络科学信息服务的主要市场主体。
早在20世纪中后期,世界上的一些知名科技出版企业,如Springer、Elsevier等就开始涉及电子与网络出版业务。进入21世纪以来,网络科技出版得以成为国际上大型科技出版集团进行市场扩张的基本策略。一些大型科技出版集团开发的科技信息服务系统在当今的科技信息服务市场中深受广大科技工作者的广泛欢迎。例如,世界著名科技出版集团Springer开发的LINK系统就是一例。该系统集中了集团所有的400种期刊及部分电子版图书,同时还连接了其他出版商的电子期刊。该系统覆盖了生命科学、化学、地球科学,计算机科学、数学、医学、物理与天文学、环境科学、经济学等广泛学科领城。LINK系统向读者提供免费的全文检索和目次浏览,订购者则可联网索取全文。Springer还与文摘索引商(例如ISI、STN、Silver-Platter)合作,将文摘索引数据库的检索结果与LINK全文数据连接起来,以便在更广泛的范围提供服务。再如,Academic Press开发的IDEAL系统(International Digital Electronic Access Library),存储了Academic Press出版的30多个学科的176种全文期刊和Harcourt Health Science的60种全文期刊,包含了从1993年到现在的15万篇论文。该系统现已被1 300所大学和研究机构联机订购,共覆盖800万读者。此外,Elsevier Science开发的ScienceDirect系统、Johns Hopkins University press的MUSE系统等也都是受国际科技界广泛欢迎的网络信息服务系统。
除了传统的科技出版机构广泛涉足网络科技出版成为新兴的科学信息服务主体外,一些传统的二次科技文献(索引、文摘)出版发行商也纷纷介入网络科技出版活动,成为颇具影响的科学信息服务主体。正如张晓林教授在《学术信息交流体系的重组与大学信息服务模式的再造》一文中所指出的,“文摘索引商和检索服务商在新的信息环境中不甘于传统角色,正积极将文摘索引检索服务与出版商的数字化资源、图书馆馆藏目录、万维网资源目录、甚至文献传递服务商相连,从而提供包括文献检索、传递以及相应的管理功能等的“全面信息服务。”[11]应该说,与原生科技文献出版机构相比,索引、文摘等二次科技文献出版机构具有其掌握的科技信息资源检索工具、检索系统的优势是其进入网络科学信息服务领域、成为网络科学信息服务强有力的竞争对手的“刹手锏”。正因为有自己得天独厚的条件,国际上的一些著名二次科技文献出版机构,如ISI、STN、Silver-Platter等都在设法进入科学信息服务市场。
(2)网络信息服务的内容
信息载体的演进不仅改变着科学信息服务的主体与服务方式,而且还促进了科学信息服务内容的日趋丰富。在网络载体条件下,一些传统的科学信息服务内容,如外借、阅览、信息检索、参考咨询、专题情报服务等无疑还将继续存在。其中的一些服务形式还将与网络结缘,以新的形式、新的面孔出现。与此同时,伴随着网络载体的兴起,还出现了一些全新的信息服务项目和服务内容,如电子邮件服务、FTP文件传输服务、电子公告板服务、搜索引擎服务、数据库服务、网络信息资源导航、数字图书馆、信息推送服务等。这些新的服务项目和内容正逐步发展成为网络科学信息服务的主体内容。不仅各种信息机构越来越多地开发和提供这些新的信息服务,而且广大信息用户也越来越倾向于首选这些新兴服务项目。毫无疑问,这对于充分满足用户个性化的信息需求,提升科学信息服务水平等都有不可低估的意义。下面,我们将对其中几种主要的服务作一个简要介绍。
①网络化的传统信息服务
从本质上讲,信息服务就是信息机构运用一定的手段满足用户信息需求的一项信息活动。在不同的技术条件下,信息服务的方式方法虽然不尽相同,但是,信息服务的本质是不会变的。在纸型载体环境下形成的许多传统信息服务内容和服务项目并不会因为网络载体的兴起而消失,他们将会借助网络载体技术以新的形式继续服务于广大信息用户。这些借助网络技术而存续的传统信息服务,我们把它们称为“网络化的传统信息服务”,也就是毕强先生等称之为“传统信息服务在网络环境下的应用”的那部分信息服务内容。[12]
网络化的传统信息服务包括很多方面的内容。例如,基于OPAC(OPAC即在线公共查询目录检索)的流通服务就是一例。众所周知,传统的文献流通是基于纸型载体的“实物送达”服务,需要耗费用户和信息服务机构大量的时间和精力。然而,在网络环境下,“信息资源从印刷型向电子型过渡,网外信息资源向网上信息资源过渡”。信息服务机构一般都有自己的网站,并向用户提供OPAC服务。用户通过WWW和TELNET等方式,可在任何地方对提供OPAC服务的信息机构的信息资源进行远程检索。如果所需信息资源业已数字化,用户通过网络就可以直接获取,而无需登门造访。即使所需信息资源没有网络版。用户在馆藏检索的基础上,也可以通过联机的方式办理预约、借阅、续借等手续,实现馆藏的流通服务。可见,基于OPAC的流通服务就是传统图书情报机构的文献流通服务的网络化。再如,网上参考咨询服务也是传统信息服务的网络化。网络的双向交互性使传统参考咨询服务向网络空间扩展成为可能。在网络环境下,用户可通过信息服务机构网站主页上的“用户使用指南”或“读者指南”获得帮助,还可通过电子邮件或视频会议系统进行网上参考咨询。
②基础网络信息服务
所谓基础网络信息服务,是伴随着Internet同时出现的最初级的网络信息服务项目,它大致包括WWW服务、电子邮件服务、FTP文件传输服务、电子公告板服务、USENET新闻组服务等内容。
③网络信息产品服务
所谓网络信息产品服务,即信息服务机构根据自己的判断或用户提出的要求开发或向用户提供诸如数据库、导航库等信息产品以满足用户信息需求的一种信息服务活动。
数据库是深受广大信息用户广泛欢迎的一种科学信息产品。各种大型科学信息服务机构,如高校图书馆、科技出版商、网络化集成化信息服务商等都普遍向用户提供各种类型的商用科技数据库,供用户免费或有偿使用。同时,还有不少信息服务机构有针对性地自行开发一些专题数据库,如某学科文献数据库、学位论文数据库、科研成果数据库、专家学者数据库等等,供本单位用户使用,也收到很好的服务效果。
专业信息资源导航库,或称为指引库,是由专门机构利用网上现有搜索引擎,集中与某一主题或学科相关的站点资料,指引用户高效快速检索该领域信息资源的一种信息产品。简单地讲,也就是有关某一学科或领域的网络信息资源的集中和序化产品。例如,我国高校图书馆的重点学科导航库就是这种信息产品。一般地,专业信息资源导航库应该包括3个方面的内容:一是有一批原始信息,包括访问频率高的原始信息资源的镜像、自建的信息资源等;二是有一批反映该主题的国内外信息资源的网址;三是有一套方便用户查询和信息组织的支持技术。由于网络信息资源变化频繁,因此,对导航库可采用自动跟踪技术进行及时更新,以确保信息的时效性。
④网络用户教育服务
尽管在传统信息服务业中同样也有一个用户教育的问题,但是,进入网络载体环境下用户教育服务的地位又有了明显的提升。我们甚至认为,网络用户教育可能成为信息机构网络信息服务的核心内容之一。这一方面是因为网络信息服务比传统信息服务的技术色彩更突出所致;另一方面则是因为网络信息服务中具有更多的“自助”成分使然。
网络信息服务包括的内容很多,如关于信息机构网络信息资源状况与信息服务内容的教育;关于网络信息资源检索与使用方法与策略方面的教育等。网络用户教育可采用集中讲课的形式,也可开设网上课堂,开展网络化的培训服务,还可以开发各种各样的帮助软件并嵌入网站的帮助系统中,向用户提供适时的在线辅导。
5.2.2 基于网络的科学信息服务类型
网络载体环境下,科学信息服务主体、服务内容的变化必将导致传统科学信息服务模式的彻底变革。首先,在虚拟的网络社区中,信息用户与信息服务提供者之间将建立起良好的双向互动关系,传统的“信息服务机构——用户”式的服务模式将为“社区”式服务所取代,“社区”式服务将成为网络载体条件下科学信息服务的重要模式。其次,有效满足用户个性化需求的定制服务将在网络载体形态下得以实现,“定制”服务将成为科学信息服务的重要模式。然后,伴随着网络载体发展起来的新兴信息服务技术的进步将催生新一轮的“自助”式信息服务。
下面,我们将对“社区”服务、“自助”式服务和“定制”服务等网络环境下科学信息服务的主要方式分别进行简要分析。
(1)社区服务
在传统的纸型载体环境下,科学信息用户处于由出版社、图书情报机构与用户构成的信息产业链的末端,出版社、图书情报机构与用户之间是一种类似如消费者与企业之间的供求关系,彼此之间虽然存在着一定的互动,但是,上下游之间的界限依然泾渭分明。
进入网络载体时期,出版社、图书情报机构与用户之间的关系将会发生微妙的变化。众所周知,网络载体主流地位的确不仅改变了科学信息的发布与组织方式,而且淡化和模糊了科学信息发布、组织与利用者之间的界限。由出版社、图书情报机构与用户所构成的科学信息产业链将会逐步演变为一种成员间具有高度双向互动性的信息社区。信息用户不仅仅只是信息的使用者,同时还在相当程度上参与科学信息的发布与组织。出版社、图书情报机构与用户之间是一种典型的社区成员间的关系。信息用户将在这种更加和谐的网络社区中享受有出版社和图书情报机构提供的信息服务,同时通过高度的互动参与科学信息的发布与组织。下面,我们就简要介绍一下美国麻省理工学院出版社网络出版社区的基本情况。
2000年10月1日,麻省理工学院出版社在数字项目实验室(DPL,该出版社一个主要的研究发展机构)于1998年开始的一个实验的基础上,启动了为认知学科和脑科学研究领域的学者设立的网上收费社区MIT CogNetTM,并注册了商标。出版社用商业方式运营MIT CogNetTM并开始尝试一系列基于社区的出版服务活动(见图5-1)。
此前20多年,麻省理工学院出版社一直致力于在某些专业领域出版具有一定理论深度的著作。这些学科领域包括建筑、计算机科学、人工智能、经济学、政治学以及一些新兴的交叉学科如认知科学等。这种策略在印刷出版领域被证明是成功的。到2000年6月,麻省理工学院收到了第6 000本书稿的档案。但是在印刷出版物之外还有深不可测的电子数字空间。20世纪90年代中期万维网的出现无疑给传统出版带来了复杂的挑战。一方面在出版商眼中的早期互联网具有信息传播混乱、侵权严重、缺乏书目控制以及在迅速膨胀的资料面前版本控制失灵等严重问题;同时对于网络迅捷、强大的传播功能以及数字化所蕴涵的巨大的规模经济效应又不能视若无睹。
幸运的是麻省理工学院出版社很早就开始了一系列有关电子图书和期刊的成功实验。比尔·米歇尔的《比特之城》是最早的一次实验。这是一本有关建筑与城市的书,印刷版和网络版同步发行。作为最早由出版商发布的网络图书之一,它获得了广泛的关注。但是这一举动也冒着免费的网络版本蚕食印刷版销量从而影响出版社收入的风险。但事实证明,数字版本非但没有削减纸质图书的销量,而且使该书的实际销量比预计的翻了一番。更令人惊讶的是网站不仅促进了销售,而且光顾者的行为给出版商带来了全新的经验:读者们聚在一起互相交流心得,并且多次回到站点,寻找相关内容兼享受与其他读者的互动。读者似乎自然而然地将数字版当成印刷版的补充,并把它看成是新内容生成的基础。其中《比特之城》给人最大的启发,是网络读者会清楚地告诉出版商下一步该做些什么。
图5-1 美国麻省理工学院出版社MIT CogNetTM社区主页[13]
《比特之城》的成功以及数字资源管理等新技术、新工具的爆炸式发展,促使该出版社更加专注于扩展相关技巧和服务范围。为了适应新业务的需要,出版社于1996年秋季建立了数字项目实验室(以下简称DPL)以积累网络出版经验。DPL从1997年6月份开始第一个主要项目,即设计和开发数据库支持的万维网目录服务器。同时,网络图书方面继《比特之城》成功之后还有罗琳的《飞蛾扑火》,斯托克·黑尔的《遗产》、巴斯基的《诺姆·乔姆斯基:不信国教者的生活》和金融专著《住房合伙》。随着各学科电子全文的增加,读者显示了对于不同学科领域、不同形式(专著、文集、自传)数字文本的持久兴趣;而出版社也开始将数字化视为其出版使命的一部分。最后,DPL决定以一个万维网项目为基础开发一部重要的参考工具书:《麻省理工学院认知科学和脑科学百科全书(MITECS)》。
①E社区:一种出版模式出现
在MITECS在线版的开发和使用过程中,读者经常与网站管理者通信,建议应该设置哪些链接、指出排印错误,并与词条作者讨论有关内容。越来越多的证据显示网络环境下电子出版的最终使命并不是仅仅提供电子文本,而是应同时提供各种支持性服务以丰富出版物的功能和提高读者对它的利用率。也就是说数字化仅仅是第一步,接下来也许该为专门领域的读者建立一个网上社区。
由于出版社在认知科学出版领域的世界声誉,加上在MITECS出版过程中积累的大量经验以及从中显示出来的这个领域的读者习惯于上网并乐于接受数字化内容的倾向,出版社决定把认知学科领域的读者作为建立电子社区的实验对象。一开始没有人知道要把MITECS项目发展成一个新颖的、有品牌的社区应该做些什么。因此,最实际的做法是巩固MITECS站点并创立一个微型的MIT CogNetTM社区。具体就是用权威内容组织网上参考工具书以吸引相关读者。网络化工作从MITECS开始很快扩展到社内所有关于认知科学和脑科学的参考书、工作底稿、教材、社内相关期刊以及一个有关灰色文献与工作集市(job mart)的数据档案。
早期的尝试从理论上来看是行得通的,但是除了订阅服务之外,它没有能够清楚地交代任何其他可预见的收入来源;而这种服务的规模和市场情况也没有人知道。出版社只是直觉地认为经济模式会在发展过程中自己冒出来;而在互联网发展的这一时期(1997年底),的确也没有可靠的方法来确认可能的经济形态。
开发小组所做的另一项工作是与图书馆员和其他活跃在信息科学领域的专业人员合作。图书馆员处于提供电子信息服务的最前沿,对于公共终端上信息服务的获取和使用情况最清楚;而且他们直接与电子出版引起的棘手问题打交道,包括混乱的文摘标准、电子编目和电子档案等,因此其意见对于想开发有用、可用并能够出售的网络化学术研究工具的出版社来说是很重要的。
为此,出版社利用自有资金建立了社区数据库的基本原型,其中有关编程等技术工作全部外包,站点的日常运营则依靠内部的力量。这个1998年10月启动MIT CogNetTM测试站点的核心是一个数字图书馆,包括MITECS在线,出版社的150本放在netLibraryTM主机上的认知心理学方面的图书。此外,测试站点还有许多服务模块,包括:热点科学(HotScience,是一个双月社论,包括专业领域的一些连续性讨论),工作列表,讨论小组,成员档案,研讨会经理,论文发布、个人工作区以及管理人员联系信息等。在这样的框架范围之内,社区成员被允许接触站点内的所有内容以便开发小组观察、记录其在社区的各种行为以备将来决策参考。实际上,也就是说将由用户自己决定什么样的服务是有用的和值得保留的。
②如果你建了,他们就会来
通过MITECS站点和麻省理工学院出版社主页上的链接,以及家人、朋友的口口相传,MIT CogNetTM开始接纳注册会员。早期的社区成员往往是数字图书馆内容的被动消费者——他们在网站的主要活动是查找资料并阅读;但是随着人数的增加以及工具的多样化,成员的行为也日趋多样。许多人在论坛张贴各种帖子,发布求职和招聘广告,在论文区发表论文,建立个人的档案资料和技术书目,并且开始在自己单位的主页上建立指向社区中个人档案的链接。
其中,个人化的快速回应从一开始就是社区服务的重要组成部分。会员经常向网站管理员发电子邮件询问问题、指出程序错误、要求额外的材料,就网站特色和所提供内容提出建议或加以评论。CogNet标准的处理原则是保持迅速的反馈。为此每个页面上都有联系信息,保证当问题发生时管理人员能够获得足够多的关于出事地点的信息。另外当服务器记录显示用户搜索到零个文档时就会发出一封电子邮件建议他尝试另一个搜索引擎以便找到合适的资料,让人感到服务的人性化特点。这些措施无疑有助于建立更好的站点。从一开始,站点并不鼓励游客到访。这一做法背后的逻辑是:学术界有自己严格的标准和行为规范,如果社区被众多与专业无关的人占据,因而无法形成一定水准之上的学术交流的话,结果甚至会危及出版社的印刷版图书。社区的宗旨是支持严肃的学术研究,闲杂人等往往对社区内高水平的智力激荡无益而有害。因此MIT CogNetTM尽量避免有偶尔的访客、匿名者和黑客占用服务器空间。网站登记过程本身的设计就有助于阻止不太严肃的访问者。另外管理人员每天都会检查服务器的记录,一些显然不符合条件的登记将被删除;一些有问题的户头(如名字、地址和其他事实性信息不一致)将收到电子邮件以进一步确认。这样的政策使社区规模保持在一个较为平均的增长水平。早期会员数量平均每个月都比前一月翻番,1998年10月到12月间大约注册了550名会员。一年以后增加到5 000多。2000年以后引入收费注册机制又稍稍平抑了注册人数。但是社区的质量得到了较好的保证。
社区的另一个收获是使出版社有机会更深入地了解其读者。人口统计学数据显示2/3的社区成员年龄在30岁以上。刚刚开始学术生涯的年轻成员对于各种快速更新的信息更感兴趣,包括:研究生院及指导老师的信息、招生信息、工作信息、论文要求、各种专业项目的起讫日期与相关情况,研讨会成员以及资助信息等。至于年长的学者,则更乐于搜索各种图书、期刊和灰色文献的全文信息。不同年龄的成员在其他方面的行为与习惯上也存在差异。社区允许成员对其他会员屏蔽其个人信息。一次调查显示40岁以上的成员70%以上的人屏蔽了其个人信息;这一比率在30岁以下的人群中只有20%。还没有详细的研究显示这一行为模式背后的成因。社区实验使出版商比以往更容易观察并记录成员们的社区行为,了解他们对不同内容的偏爱、使用文献和研究材料的方法以及对社区出版模式的期望,从而有助于下一阶段的服务。
③电子社区和学术出版使命
在整个开发过程中,站点的内容、尤其是灰色文献部分稳步增长。当会员数量和服务质量提高以后,越来越多的专业协会和研究小组愿意分享专业会议论文的电子文摘。MIT CogNetTM也通过会前与个人作者谈判预先得到其论文的电子版。这样社区就可以与会议同步地提供会议论文,对于读者和出版商来说都节省了时间和费用。另外出版社也与图书馆等机构合作加强这一方面的搜集。众多数字化的参考工具、术语表、学术评级项目的年鉴、机构档案、新闻服务等一起构成了一个兼具广度与深度的文本系统。
在丰富内容站点的过程中,出版社时刻关注某一项特殊建议何时以及如何才有助于大学出版社实现目标和完成使命。有时候利用有限的资源从头开始建立一种服务是不可行的,出版社就和其他人合作加快内容的出版和传递周期。为此一方面必须主动地在社区内邀请其他出版社加盟以共享内容(图书简介、期刊文摘的链接等);同时它也寻求外部合作以增加搜索引擎等门户服务项目。总的来说,如果是关于文本内容的处理,出版社在尽可能地控制、处理和传播内容方面具有无可替代的重要作用;但是,如果涉及周边的服务项目,那么与技术供应商合作就非常必要。但是选择合作企业对学术研究的稳定性和可预测性将造成一定威胁;因为合作伙伴的商业利益有时候与出版社低成本地分销高质量的定制内容的非赢利学术使命相抵触。当然,尽管在学术领域非赢利学术使命将继续和商业目标之间存在长期冲突,但合作仍然是十分必要的。
实际上,大学出版社以较低成本及时传播学术研究成果的使命并没有改变;而参与技术革新无疑将使出版社获得利用新技术的有利战略地位。由于通过网络可以及时、互动地交流各种信息、文献和思想;这些更加积极主动地发送和接收内容的方式将产生新的思想、观念或者新形式的学术原型。可以说像MIT CogNetTM这样的社区,智能活动的数字交换本身就是一种独特的内容。从这个意义上来说,社区即内容。当然,在目前以及可见的将来,印刷出版物仍然是学术界标准的传播媒体;但是MIT CogNetTM这样的网络出版实践为学术界提供了一种新工具,从长远来看必将影响到研究者工作和思维的方式。
1999年10月MIT CogNetTM获得了学术出版与学术资源联盟(SPARC,The Scholarly Publishing and Academic Resources Coalition)颁发的科学社区原创奖。SPARC一直致力于在图书和情报专业人员中普及电子社区意识,并一直帮助社区获得有关专业人员的支持。该社区获奖以后,要求有偿获得站点许可使用权的机构激增,这更增进了出版社原有的信念:图书馆员将在电子学术工具的演进过程中扮演一个重要的角色。而站点许可这种形式也成了目前采用的社区商业模式的基石,并带来可预见的收入。1999年日内瓦的阿加罕文化信托机构(Aga Khan Trust for Culture)、麻省理工学院建筑与规划院以及麻省理工学院出版社共同开发了ArchNet(http://archnet.org),这是一个伊斯兰世界的建筑规划者、城市设计师、园林设计师和建筑学学者的在线建筑学专业社区。
④存在的问题
未来电子出版的使命不仅仅是提供获得丰富数据的机会,而且要方便人与内容之间更复杂的互动。门户类服务(内部链接,动态的交叉参见,强大的检索服务)因为可以提供更丰富的内容而越来越成为出版工作的一部分。但是如果说为学者创建电子社区是非赢利出版部门的新业务,企业化运作的确会带来某些问题。例如:
如何选择合作伙伴和购买何种技术来建设专业社区?
电子社区应该采用何种方式支付版税?
在定价结构中是否应该反映出版社的努力以弥补其部分开发费用?
何种技术手段能够进行有效的数字权利管理?
如果出版商坚持原来传播内容的使命,那么在多媒体互动的出版时代如何才能避免成为一个单纯的软件开发商?
在与外部商业机构进行战略合作的过程中如何控制成本以避免将巨额开发费用转嫁到读者头上?
在网上内容社区中,读者不再是被动的消费者而成为内容生产过程的一部分。将读者带入电子环境的长远的文化和商业上的影响是什么?
不过,虽然目前还存在各种不明朗因素,网上电子社区似乎仍然是一条值得一试的新途径:因为出版商能够发挥在内容组织方面的专业经验,并有机会在网络世界继续履行它的信息与文化使命。因此,开始行动、并积累经验和吸取教训也许比辗转反侧地权衡由此而来的种种利弊更可取。
(2)自助服务
在基于纸型载体的传统信息交流环境下,由于图书情报机构拥有丰富的馆藏科学文献资源,掌握着科学信息服务的专业知识,并集中了大量的专业图书情报业务人员,因此,科学信息交流中信息服务职能主要由专门的图书情报机构来承担自然就是情理中的事了。然而,进入网络载体环境下,科学信息的获得并不依赖于对大量科学信息或科学文献的“拥有”,只要掌握了一定的网络信息资源利用方法,任何人都可以方便快捷地从互联网上获得自己所需要的信息,从这个意义上讲,不仅传统的图书情报机构可以“拥有”大量科学信息或文献,而且任何人通过互联网同样也可以方便快捷地“获取”各种各样的科学信息。也就是说,在网络环境下,图书情报机构对科学信息资源的“拥有”优势并不能成为其继续“垄断”科学信息服务职能的资本。而与此同时,随着网络的迅速普及、网络信息资源检索和利用软件功能的不断改善,从而“导致传统图书情报工作中的技术内涵和智力内涵的相对下降。”[14]这就使得传统载体条件下仅仅由图书情报机构所掌握的专门的信息服务技术得以为广大信息用户所掌握,进而成为用户“自助”式信息服务的重要基础。正是在这样一种条件下,传统科学信息交流中的信息服务职能将不再由图书情报机构所“垄断”,用户的“自助”式信息服务将成为科学信息服务的一个重要组成部分。
我们相信,在网络载体条件下,科学信息的网上发布及科学信息检索工具的数字化将对纸型载体形态下传统的科学信息服务方式产生革命性的影响,用户的信息查询将主要在网上采用“自助”的方式来完成,更少依赖于信息机构和专门的信息人员的直接帮助,而信息机构和专门的信息人员对于用户信息查询的帮助将完全被智能化的信息检索系统所取代,信息机构和信息人员的职能将被充分融合到智能化的信息检索工具和检索系统之中去。
科学信息的这种“自助”式查询利用模式将建立在以下两个条件的基础之上:
一是原生科学信息的网上发布。尽管借助数字化信息检索工具所进行的信息检索并不一定要以全部科学信息的完全数字化为前提,也就是说,无论原生科学信息是以何种载体发布的,只要这些信息被数字化的信息检索工具所涵盖,用户都可以通过这种数字化的信息检索工具实现查询。但是,我们认为,对这种基于纸型载体的原生科学信息而言,即使实现了检索工具的数字化,其所能够提供的检索途径也是十分有限的,尤其是它仍然无法提供全文检索,其检索效果除速度外与传统的基于纸型检索工具的手工检索并没有太大的改进。只有当原生科学信息基本实现了数字化并在网上进行发布,包括全文检索在内的多途径检索才能得以真正实现。此外,科学信息的网上发布对于科学信息的这种“自助”式查询利用模式还有一个重要的意义,即用户在查询到相关信息后具有及时获得原生科学信息的便利,这一点更是基于纸型载体的信息检索所无法比拟的。
二是科学信息检索工具的数字化和科学信息检索系统的智能化。关于信息检索的机械化、自动化问题,早在20世纪四五十年代就已经引起了科学界的广泛关注。1957年,计算机编制索引的实验取得成功,从而使得检索工具的数字化和检索系统的智能化成为现实。这又促使许多文摘索引机构,如美国国家医学图书馆、化学文摘社、工程索引公司等纷纷采用计算机编制各种文摘索引检索工具。到了20世纪60年代末70年代初,随着分时计算机的出现和通讯网的发展,又出现了功能更为强大的联机检索系统,如MEDLINE、DIALOG、ORBIT等。随着Internet的发展和迅速普及,上述基于单机和局域网的信息检索工具也开始向面向网络的方向发展。目前,Internet上的信息检索工具至少也有数十种之多,它们各有各的数据库、语言、检索功能和显示方式。在这些检索工具中,最常用的主要有Gopher和WWW两种,它们都具有极好的交互功能和智能化。例如,网络检索中常用的搜索工具Excite就是这样一种。它可以提供所谓的“例子查询”(Query by Example),当用户一旦查找到一个与自己的需求高度吻合的Web页时,用户就可以使用它作为另一个查询的样本,这样就可以让Excite查找到更多与其相似的Web页。此外Excite的智能化还表现在它的概念检索模式中,即它可以在词频统计的基础上自动搜索检索词的同义词、近义词或其他相关的词,如输入的检索词是youth,它同时能够检索出teenager。无疑Excite的这种智能化将在相当大的程度上提高信息检索的查全率。由于这些基于Internet检索工具的发展和迅速普及,就使得科学信息的“自助”式查询方式得以迅速发展起来。
与传统的信息查询方式相比,网络环境下的这种“自助”式科学信息查询方式具有以下几个突出的优点:
①检索过程的交互性。基于纸型载体检索工具的传统信息检索是一种单向的信息摄取过程,信息用户或检索人员只能根据检索工具的编排体例和提供的检索途径进行信息查询,即使对检索的结果不满意,往往也难以通过调整检索策略从同一检索工具中获得更为满意的信息。而在网络环境下“自助”式信息检索过程中检索工具和信息用户是完全互动的,即使一次检索得不到理想的结果,也可以随时调整检索策略进行重新检索直到获得满意的结果为止。一般说来,在网络信息检索过程中,即使信息用户对检索工具不熟悉,或者在检索过程中遇到什么问题,通常也可以及时获得相应的在线帮助,应该说,这也是网络信息检索交互性的重要体现。
②检索对象的广泛性。在网络技术条件下,网络信息检索工具与传统的信息检索工具已不完全是同一个概念了。传统的信息检索工具几乎都是针对某一特定范围的文献而言的,在这个范围之外的文献就不可能通过该检索工具进行检索,而网络环境下的信息检索工具就完全不同,它并不一定是针对某一特定范围的信息而言的,而是一种可以自动搜寻网上信息的软件工具,是以搜索网络信息为目的的专门网络站点,借助该工具可以检索到几乎任何网站上的信息。目前的一些流行网络信息检索工具大多可以检索到数十万个主机上的数以千万计的Web网页,这是传统的检索系统所无法比拟的。例如,Digital Equipment公司的Alta Vista搜索引擎就收集了大约275 600个服务主机,可以搜寻包含全球超过3 000万个以上的Web网页;Infoseek Corporation的Infoseek搜索引擎则可以索及5 500多万Web页的全文本内容;诸如Yahoo、Sohoo、Net Search等更为知名的网络信息检索工具所能够检索到的信息则更是多得惊人。由此不难看出,网络信息检索可以索及的信息范围较传统的信息检索要广泛得多。
③检索途径的可选择性。关于这一点,只要将“中国期刊网”的检索途径和《全国报刊索引》作一个比较就可以得到证明。《全国报刊索引》按分类编排,仅提供“作者”、“题中人名”两种检索途径。要利用该索引,用户只能从分类、作者和题中人名这三个途径进行信息检索,费时费事。除此之外再没有任何其他的途径可供选择。“中国期刊网”则不同,它所提供的检索途径则多达8种之多,要查找“中国期刊网”所涵盖的科学论文,用户可以从篇名、作者、机构、关键词、中文摘要、中文刊名、引文和基金等8种角度进行任意检索。显然,从提供的检索途径来看,网络信息检索也远远优于传统的信息检索。
④检索结果的立即可得性。科学信息的检索通常有两个目的,要么是将检索所直接获得的数据用于科学计量分析,要么就是以检索所得到的数据作为中介来获得原生科学信息。其中,第二个目的是要获得原生的科学信息,而这往往又是科学信息检索的主要目的所在。众所周知,传统的基于纸型载体的科学信息检索往往只能提供关于原生信息的二手资料,而不能直接提供原生的科学信息,用户只能根据这些二手资料再去索取原生信息。在网络信息检索中,信息检索的步骤得以大大简化,通过网络信息检索工具用户不仅可以了解到有关某一主题(或学科专业)信息的二次信息,而且可以通过这些信息直接获取原生信息资料,而无须进行原生科学信息再次查询。使用过“中国期刊网”的用户应该都能够充分体会到网络信息检索的这种便捷性。由此可见,在网络信息检索中,检索结果的立即可得的确是大大地方便了信息用户。
(3)定制服务
20世纪60年代以来,企业经营理念逐渐由“产品导向”向“顾客导向”转变,市场和顾客成为企业运转的核心。在此过程中,企业经营者和营销人员意识到消费者的需求通常会受到其“生活方式、情趣、哲学和社会条件的影响”。比如美国20世纪60年代末、70年代初“返回自然”的风潮促进了双肩包、牛仔裤等产品的消费;20世纪末“怀旧病”在中国的流行导致出版界“老照片”一类出版物的畅销……若论近一二十年来持久不衰的生活风尚则非追求“个性化”莫属,各种DIY层出不穷,其影响所及各行各业——从房地产业到电脑软件行业都有所反映。于是“定制”成了许多企业迎合这种社会风尚的重要手段。有些企业因此获得明显的竞争优势,如美国DELL计算机公司就依靠定制化产品设计与生产模式在短短13年中积累了120亿元财富。
显然,在科学信息服务领域也存在着这样一种个性化需求。网络载体的发展和普及也为科学信息服务机构,尤其是科学出版机构,引进这一流行的“定制”模式向用户提供个性化的信息服务提供了可能。张晓林教授在《基于Web的个性化信息服务机制》一文中指出,“网络化信息服务在跨越时空组织资源和服务的同时,也应充分支持个性化信息服务。”并进而对个性化定制服务进行了深入的论述。[15]
①定制的动因
出版企业的定制与网络尤其是互联网的兴起有很大关系。具体而言互联网对读者在两个方面的影响直接导致了对于定制的需要。首先互联网提供了即时互动的可能性。在虚拟市场上,读者不再是信息与内容的被动接受者,他可以既迅速又廉价地通过网络向出版商传达自己的特殊意愿和要求。出版业与其他行业一样对顾客的需求趋势一直保持着高度的敏感,比如早前人们对于主动、独立和个人化生活方式的追求就曾改变其生产观念,促使他们通过出版针对专门兴趣的报纸和期刊来适应变化。所不同的是,由于出版商的产品能够以比特流的形式传播,所以出版企业可以根据每个顾客不同的信息需求为其定制网络出版物及服务,而且将成本控制在可以接受的范围内。
其次是互联网使读者在网上面临信息过载(overload)的困境。有人形象地把信息从网上流向读者的过程比拟为海水倒灌[16],毫无疑问,如果不能对这一过程加以干预,使海水按河流、小溪和沟渠的承载量流入,后者就将面临决堤的危险。为此人类尝试了各种数字信息处理技术、手段和技巧来获取、储存、传递、分配和代理信息,但是问题依然没有得到根本解决。在这样的情况之下,人们认为在上述种种方法之外再辅以定制这种从具体读者出发、高度互动的信息服务手段才能缓解压力。
至于网络出版采用定制的另一个主要动力来源于广告商。从受众数量衡量网络迄今为止它还不是一个大众媒体(mass medium),因而无法与传统媒体的影响力竞争。但网络出版商能够根据点击路线确定访客大致的行为类型,并将用户的详细信息出售给广告商,这对于广告商来说具有不可比拟的吸引力。网络上的口号之一是“每次点击都暴露了你的身份”。为了能向潜在的广告客户提供比传统媒体更为同质化的受众的有关信息,网络出版商通常有意识地组织各类社区并有针对性地开展各种营销活动。
②定制及其特点
在网络出版中,定制(customization)即网络出版企业针对高度专门化的目标市场生产和提供互动网络出版物和服务,它是一种供应方的产品策略。反过来,消费者出于个人需要对产品和服务加以交互式地修正则被称为个人化(personalization),它是一种需求方的活动[17]。定制与个人化恰如硬币的一体两面,共同对内容产业的产品和服务开发产生重大影响。
网络出版中的定制有一些独特之处。①网络出版中的定制一般是可选定制[18],即在所提供的内容框架中进行选择的一种定制。比如网络期刊的出版商通常给出若干个主题范围而由读者自己选择其中的若干个加以订阅。美国的个人公司(Individual INC.)就要求顾客在2 500个主题中选择10个题目,此后他们将每天得到相关的新闻信息。②网络出版中的定制通常借助软件的力量。比如个人公司的网络出版定制服务就是依靠一种名为NewsPage Direct的新闻扫描软件实现的。该软件每天在网上浏览文章、报告、社论和其他各种新闻内容,随后根据相应的用户档案每天早上从20 000篇文章中找出最相关的发到读者信箱。③某些种类的网络出版物,如事实性信息和新闻较其他类型的内容更易于定制。由于属性特殊,某些出版物几乎不可能定制,比如几乎没有读者能让作者为他创作一部量身定做的小说(编辑约稿似乎是一种有意思的例外)。④在网络出版中实现定制需要一个长期的互动过程。相比较而言,读者确定自己想阅读或者观看什么要比决定要用什么颜色的自行车难一些;而且也更多变,因为通常一个人在一天的不同时间想看的东西往往不同。这就要求网络出版商与读者保持经常性的互动关系以掌握顾客的要求。
③定制步骤
一般来说,在现有的技术条件之下提供定制的网络出版服务包括一些基本的步骤,如通过观察、整理注册表等手段获得读者信息,通过建立读者数据库来储存和分析顾客信息,通过专门的应用软件或者其他手段提供有针对性的网络出版物和服务,等等。下面将对此作进一步探讨。
通过观察了解读者。要了解读者首先应该做的就是监视点击流(click stream),即记录读者访问网站的一系列行动。网站运行记录包含了许多有关顾客行为的有用信息但是较难分析。首先是数据太多,对这些数据加以分析费时费力。其次,作为网络基础的HTTP协议本身具有局限性。因为这种协议是“非连续”的,把每名用户的每次要求(点击超链接)处理为分开,通过它无法了解某一位顾客在网站上的全部浏览或交易行为。因此,网络开发者必须自己建立能识别某位用户一系列交易的支持系统。比如由Netscape发明的“饼干(cookies)”程序就能够让网页服务器辨识访客的每一步网上足迹,包括其登记资料、浏览哪些网页、点击了哪些横幅、进行哪些搜寻动作,在每个条目上停留的时间等资料。这些对于掌握读者的喜好与浏览习性是相当有用的。
通过注册表和账单了解读者。许多网站往往免费提供内容,但交换条件是读者填写一个简单的注册表,其中包含读者一些基本的人口统计学数据和阅读习惯等资料。像《纽约时报》网站从1996年5月开始成功地向2 000个欧洲用户收取每月C=30的订阅费,但是对于美国本土和其他地区的用户仍然保留“注册-免费”的模式,以获取读者的有关资料。要求付费的站点如《华尔街日报》网络版(www.wsj.com)会询问读者的邮政编码作为开账单的程序之一,这个数据可以根据信用卡记录核查,颇为可靠。美国在线因为要向用户收费并在他们登录时进行身份确认,因此拥有关于用户的关键信息。还有一些网络出版商向读者发出优惠券,用户只有返还要求填写的个人信息表格才能兑现。另外,像Hotmail这样的公司要求用户对其问卷调查进行回馈,以换取免费的电子邮件邮箱。显然,互联网媒体双向传播的功能为网络出版企业增加了研究读者的机会。
建立读者数据库。读者数据库是网络出版企业最基本、最直接的信息来源。对企业而言,建立顾客数据库最初的目的是为实施直接营销而收集顾客和潜在顾客的姓名和地址,后来逐渐把它发展成为市场研究的工具,如收集市场资料、人口统计资料、销售趋势资料以及竞争资料等。出版商可以把通过上述途径收集到的读者资料,包括其浏览记录、阅读偏好、订阅情况、特殊需要、业余爱好、家庭成员等信息输入数据库,建立起详细的读者档案。这项细致而繁琐的工作在计算机的帮助下已经简单可行。因此,出版企业可以借助掌握的读者情况确定网络出版的产品和服务、重新设计营销过程、与读者保持沟通和联系、根据形势变化及时调整经营活动等,使企业变被动为主动。
提供个人化的内容与服务。在内容方面,出版商可以在社区范围内进行批量定制,比如由编辑组织一些专门的内容,或者从电子资料中间商和稿件辛迪加处获取相关材料。具体到个人的可选定制往往借助于软件的帮助来完成。比如亚马逊通过与各搜索引擎合作把智能横幅广告(Intelligent Banner)放到互联网上。这种广告整合了各种功能。如果用户在雅虎上寻找歌手Neil Young的信息,网页上的亚马逊旗标广告会弹出有关这个歌手的图书。CDNOW也有此类广告。用户一般不会为此烦恼,因为广告使他们更容易找到感兴趣的信息、产品和服务。事实上为了收到定位准确的信息,《纽约时报》网络版有250万读者愿意将自己的兴趣和人口统计学数字交给广告主。另外也可以由读者预先或者在交互过程中逐渐明确他们的兴趣爱好及其感兴趣的程度,以便自主地决定接受哪些个人化的内容和服务。网络出版企业也可以直接利用读者数据库中的档案资料或者在进一步对数据做出相应分析以后,利用定制的邮件通讯等手段及时地向每个读者发布信息。例如在《英国医学期刊》网络版的主页上有一栏为“定制提示(Customised Alerts)”,该栏目链接了申请表,读者经申请就能每周通过电子邮件收到每期目录及自己感兴趣内容的网址,通过点击鼠标即可阅读。到1998年底有1万人通过这一途径阅读《英国医学期刊》电子版。[19]
显然对网络出版物或服务进行个人化定制能够快速响应顾客个性化的需求,从而为他们提供最大价值,但是把定制绝对化并无意义。首先就像前面所讨论的并非所有出版物都适合定制;其次也并不是所有的读者都对定制的内容感兴趣,有些人在某些时刻或某些场合更偏爱在信息海洋中随意漫游的乐趣,还有些人则由于时间的限制和个人习惯等原因宁愿被动地接受预先组织好的高质量内容;还有,如果只能提供“一堆烂水果”,那么给读者再多挑选的权利也无助于增加其吸引力。
【注释】
[1]赵永超.浅论数字保存[J].科技情报开发与经济,2007,1(31):198-199.
[2]Delivery.Management and Access Model for Eprints and OA Journal:78-81.
[3]S.Chapman.Counting the costs of digital preservation:is repository storage affordable?[J/OL].Journal of Digital Information,2003 Vol.4 No.2.http://jodi.ecs.soton.ac.uk/Articles/v04/i02/Chapman/chapman-final.pdf(访问日期: 2007-1-6)
[4]NSF and LOC.It's About Time:Research Challenges in Digital Archiving and Long-termPreservation,Final Report,Workshop on Research Challenges in Digital Archiving and Long-TermPreservation,April 12-13,2002[R/OL].http://www.digitalpreservation.gov/repor/NSF_LC_Final_Report.pdf(访问日期:2007-1-6)
[5]T.Shepard.Universal Preservation Format(UPF):Conceptual Framework[J/OL].RGL DigiNews,1998,Vol.2,No.6.http://www.rlg.org/preserv/diginews/diginews2-6.html#upf(访问日期:2007-1-6)
[6]K.Lee.The State of the Art and Practice in Digital Preservation"[J].Journal of Research of the National Institute of Standards and Technology,2002,Vol.107,No.1:93-106.
[7]毕强,史海燕.网络信息服务现状分析[J].情报科学,2003:5.
[8]王知津,肖洪.网络信息服务与传统信息服务比较研究[J].图书馆杂志,2002:10.
[9]张晓林等.网络化数字化基础上的新型学术信息交流体系及其影响[J].图书馆,2000:3.
[10]张晓林等.学术信息交流体系的重组与大学信息服务模式的再造[J].大学图书馆学报,2000:1.
[11]张晓林.网络化数字化基础上的新型学术信息交流体系及其影响[J].图书馆,2000:3.
[12]毕强,史海燕.网络信息服务现状分析[J].情报科学,2003:5.
[13]参见:Marney Smyth.The Community is the Content[J].Publishing Research Quarterly,2001(1):3-14.
[14]张晓林.走向知识服务:寻找新世纪图书情报工作的生长点[J].中国图书馆学报,2000(5).
[15]张晓林.基于Web的个性化信息服务机制[J].现代图书情报技术,2001(1).
[16]Hal Berghel.Cyberbrowsing:Information Customization on the Web[OL].http://www.acm.org/~hlb/publications/cb5/cb5.html(访问时间:2007-11-5)
[17]参见欧盟DGⅧ/E项目报告The Content Challenge:Electronic Publishing and the NewContent Industries:p.21
[18]吴锋等.关于产品批量化定制的思考[J].工业工程与管理,2001(2):18-22.
[19]包雅琳,钱寿初.从《英国医学杂志》电子版看电子期刊的现状与发展[J].编辑学报,1999(1):29-31.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。