首页 理论教育 国内外网络信息计量学研究进展及比较分析

国内外网络信息计量学研究进展及比较分析

时间:2023-03-04 理论教育 版权反馈
【摘要】:在学术界,网络信息计量学自1997年提出后,很快得到了国内外学者的响应和广泛使用,迅速掀起了有关网络信息计量学的研究热潮。但是,无论国内还是国外,网络信息计量学研究目前都缺乏整体性和系统性。网络信息计量学是情报学定量化、网络化发展的必然产物。

国内外网络信息计量学研究进展及比较分析

邱均平 张 洋 马瑞敏

(武汉大学中国科学评价研究中心,武汉,430072)

(中山大学资讯管理系,广州,51000)

【摘 要】本文首先对网络信息计量学的产生发展、学科定义、学科性质、研究对象等基本问题进行论述,然后从理论、方法、应用三个方面对目前网络信息计量学的研究进展情况进行系统的总结和评述,并在此基础上,对国内外的研究情况进行比较分析。

【关键词】网络信息计量学 研究进展 比较分析

The Advances and Comparative

Analysis of Domestic and Overseas

Studies onWebometrics

Qiu Junping Zhang Yang Ma Ruimin

(Research Center for China Science Evaluation,Wuhan Univ.,Wuhan,430072)

(Department of Information Management,Sun Yat-Sen Univ.,Guangzhou,510000)

【Abstract】This paper firstly discusses some fundamental issues of Webometrics,including its developing course,definition,attribution,and research object.And then,this paper summarizes and reviews the advances in the research of Webometrics systemically and roundly in three aspects including theory,methodology,and application.At last,this paper analyzes the current situation of domestic and overseas studies onWebometrics comparatively.

【Keywords】Webometrics Advances in research Comparative analysis

1 引 言

自20世纪90年代以来,迅速发展的互联网(Internet)对人类社会产生了越来越大的影响。时至今日,网络化已成为经济、社会和科技发展的重要因素和显著特征,并呈现出不断加强的趋势。人们在享受“网络化生活”所带来的种种便利的同时,对日益庞杂的网络信息的管理也提出了日益紧迫的要求。在这种需求的推动下,“网络信息计量学”(Webometrics)应运而生。这一新兴学科主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,也是信息计量学的一个新的发展方向和重要的研究领域。

网络信息计量学的研究始于20世纪90年代后期,以1997年丹麦学者T.C.Almind和Peter Ingwersen提出“Webometrics”这一概念为其诞生的标志。从那以后,这一名词使用频率越来越高,迅速引起了政府、企业、传媒、教育等社会各界的广泛关注。该学科的发展正在为人类社会、经济、科技和文化等各个领域带来了越来越大的影响和变革。在学术界,网络信息计量学自1997年提出后,很快得到了国内外学者的响应和广泛使用,迅速掀起了有关网络信息计量学的研究热潮。经过近10年的积累,网络信息计量学在理论、方法和应用等各个方面的研究工作都取得了长足的进步,取得了丰富的研究成果。但是,无论国内还是国外,网络信息计量学研究目前都缺乏整体性和系统性。此外,国内外的相关研究也表现出一定的差异性。

本文的研究工作正是在这种特定的科学背景和技术条件下提出来的,目的是对目前网络信息计量学的研究进展情况进行系统地总结和评述,并在此基础上,对国内外的研究情况进行比较分析,从而梳理出比较清晰的发展脉络和将来进一步的发展趋势,为我国的网络信息计量学研究者们提供可资借鉴的参考。

2 网络信息计量学概述

2.1 网络信息计量学的产生与发展

20世纪60年代以来,在图书馆学、文献学、情报学和科学学领域相继出现了3个十分相似的定量性质的分支学科,即“文献计量学(Bibliometrics)”、“科学计量学(Scientometrics)”和“信息计量学(Informetrics)”(简称“三计学”)。经过几十年的努力研究与推动,“三计学”都不同程度地取得了一定的进展,得到了国际学术界的广泛承认。网络信息计量学的诞生,从本质上说,乃是科学计量学、文献计量学、情报计量学和技术计量学在新的信息网络时代经过革命改造的结果。

2.1.1 网络信息计量学的产生背景

(1)社会实践需要是网络信息计量学产生和发展的根本动力。依据历史唯物主义的基本原理,科学的产生一开始就是生产决定的,生产的发展和技术的需求推动着古代和近代科学的前进。现代科学不仅在历史上渊源于社会生产,就现实情况来说,生产仍然是科学的基础,“生产—技术—科学”的关系仍然起着重要作用。正如科学史告诉我们的,任何科学的产生和发展都是由一定的科学背景和特定条件所决定的,社会实践需要是学科产生的根本动力,换言之,一门科学的产生和进化必须符合社会发展的需要,必须受其他学科解决不了的问题和任务所驱动。随着现代社会经济的发展和网络化的日益普及,加强网络信息资源的开发利用和网络管理已成为当务之急,而实施定量化管理则是其主要的途径之一。网络信息计量学的研究成果必然会为网络管理的定量化和科学化提供理论指导和定量依据,而网络管理定量化的实践需求又会促进网络信息计量学的全面发展。这种人类社会的客观实践需要,正是网络信息计量学迅速兴起的根本动力[1]

(2)网络信息计量学是情报学定量化、网络化发展的必然产物。从学科发展的一般规律来看,只有加强定量研究,才能不断提高它在整个学科体系中的学科地位。因此,定量研究一直是情报学发展的重要方向和必然趋势,“三计学”的产生和发展正是这种发展趋势的直接反映。随着网络时代的到来,信息资源由早期的实物化、纸质化阶段进入到电子化、数字化和网络化阶段,网络逐步成为重要的信息交流渠道和信息载体,以网络为媒介的信息交流活动迅速激增。在这种日益明显的网络化趋势之下,原有的信息计量指标和定量研究方法已不再适用于测度评估网络信息资源了,其结果就是导致了信息计量学进一步发展成为网络信息计量学。用Leo Egghe的话说,是“新的因特网虚拟世界对信息计量学分析提出了挑战”,并且开辟出了一个全新的时代,而迫使原先人们熟知的科学计量学和信息计量学的定律被称为“经典定律”[2]

(3)“三计学”是网络信息计量学的学科基础。从某种意义上来说,网络信息计量学就是文献计量学、科学计量学和信息计量学在网络上应用的一门学科。首先,“三计学”中的很多理论、原理都可延伸到网络信息计量领域,成为网络信息计量学的理论基础,这其中既包括相似原理、耗散结构原理、马太效应、最小努力原则、随机过程原理等普遍原理,也包括信息组织理论、信息系统理论等信息科学理论,还包括信息增长与老化规律、集中与分散规律、引文分布规律等经典规律。其次,在“三计学”中得到广泛应用的文献信息统计分析法、数学模型分析法、引文分析法、书目分析法、系统分析法、关键词统计分析法、关联数据分析法(包括聚类分析、共词分析、同域分析等)、计算机辅助文献信息计量分析法等定量方法同样成为网络信息计量研究的重要方法[3]。最后,“三计学”在诸多应用领域,尤其是电子文献信息资料的统计分析等方面的研究成果,为网络信息计量学的形成奠定了基础,积累了经验。因此,近几年网络信息计量学的诞生,本质上说,乃是科学计量学、文献计量学、情报计量学和技术计量学在新的信息网络时代经过革命改造的结果,“三计学”构成了网络信息计量学的学科基础。但与此同时,我们还应该看到,“三计学”并不是网络信息计量学的全部,作为网络技术、统计学、文献计量学理论三合一的产物,网络信息计量学必将不断汲取其他学科的成果,扩大自己的学科基础。

(4)信息技术是网络信息计量学发展的推进器。马克思主义哲学认为,科学与技术的发展是二者相互依赖、相互渗透的辩证统一过程。科学依赖于技术,科学只有依靠和运用先进的技术设备和技术手段才能进行。正如恩格斯所言,技术在很大程度上依赖于科学状况,那么科学却在更大得多的程度上依赖于技术的状况和需要,社会一旦有技术上的需要,则这种需要就会比十所大学更能把科学推向前进。20世纪中叶以来,科学、技术、生产的相互关系发生革命性变革,科学成为“生产—技术—科学”这一系统中的主导环节,科学和技术之间的相互作用日益加强,科学和技术趋于一体化,形成了“科学技术”的新范畴。近年来,计算机技术、通信技术、网络技术等信息技术的发展,在很大程度上改变了情报工作的模式,使情报学的研究内容、研究对象及基础理论在网络环境下得以丰富和发展,并由此产生了包括网络信息计量学在内的诸多新兴分支学科,可以说,技术是建立网络信息计量学理论的基础和工具,是学科产生和发展的推进器。

2.1.2 网络信息计量学名称的由来

自Internet诞生以来,围绕网络信息所进行的定量研究就从没有停止过,但真正意义上的网络信息计量研究始于20世纪90年代后期。1996年5月,在巴黎召开的第五届国际万维网会议(Fifth InternationalWorld Wide Web Conference)上,Allison Woodruff等人[4]和TimBray[5]分别发表了针对Web页面和Web网站的数量特征进行研究的论文,这是目前所知的最早的网络信息计量研究。1996年6月,Ray R.Larson首次将文献计量学中的共引(Cocitation)分析方法应用到Web页面的计量分析中,来探讨网络空间中的智力结构(Intellectual Structure)[6]

1997年,T.C.Almind和Peter Ingwersen在所作的研究中描述了一系列进行Web信息分析的方法和参数,主张将传统的信息分析方法“移植”到WWW网上的信息分析当中,并首次提出了“Webometrics”一词,用以描述将文献计量学方法应用于网络信息的定量研究[7],被认为是网络信息计量学诞生的标志。在这之后,许多学者在其有关网络空间的信息计量研究中使用了“Webometrics”一词,例如,Almind的文章发表后,立即被Ronald Rousseau引用[8]。在1999年于罗马召开的欧洲信息学会自组织会议上,Moses ABoudourides在所发表的报告[9]中,正式认可了这一概念。另一个意思与此相近的词是“Cybermetrics”,目前因特网上部分电子期刊和网上学术论坛是以“Cybermetrics”命名的,例如由西班牙科学信息与文献中心(Centro de Information and Documentation Cientifica,CINDOC)主办的电子刊物Cybermetrics:International Journal of Scientometrics,Informetrics and Bibliometrics[10],以及ISSI主办的一个论坛。

有些学者从造词法的角度出发,认为“Webometrics”以“Web”作为词根,应该专指与“万维网(World Wide Web)”有关的信息计量研究,而“Cybermetrics”所涵盖的内容要更为广泛,可代表与“整个互联网(Whole Internet)”有关的信息计量研究[11]。但是,互联网发展到今天,WWW已成为网络信息事实上的组织和流通标准,即Ray R.Larson所说的“the de facto standard for internet based information systems”[12],从将来的发展看,Web“一统江湖”的趋势更是势不可挡。而且,迄今为止的网络信息计量研究,也几乎全是在Web上进行的。因此,我们认为,以“Webometrics”来描述针对网络信息的定量研究更有代表性和科学性。事实也证明,目前“Webometrics”比“Cybermetrics”更为大家所接受,使用范围要广泛得多。此外,其他一些新的类似的词汇也不断出现在该领域的文献中,如Cybrarian、Webometry、Webliography、Netometrics、Webometry、Internetometrics、Bibliometry等等,这些概念与“Webometrics”都有所区别,应用范围也不广。

总之,“Webometrics”已成为国内外学术界代表“网络信息计量学”这一科学学科的事实上的英语标准术语。

从我国情况来看,据笔者查阅的资料,“Webometrics”一词最早于1999年由徐久龄等人引入我国,在其论文中,“Webometrics”被译做“网络计量学”[13]。2000年,我们在论文中首次将“Webometrics”译做“网络信息计量学”[14]。从此以后,虽然还出现了其他一些中译名,但“网络计量学”和“网络信息计量学”逐步成为国内学术界使用最多的术语,用以代表“Webometrics”,使用者都不乏其人,出现了较为混乱的局面。

我们认为,应该以“网络信息计量学”作为“Webometrics”这一科学学科的标准译名。这是因为:(1)从包括“三计学”在内的各种计量科学的名称来看,“计量学”前的限定词都是该学科研究的客体,“Webometrics”的实际研究内容并不涉及网络与电脑的物理结构的计量,而主要是对网络与电脑上的电子信息资源的计量,即该学科的研究客体是“网络信息”,“网络”只是该学科研究客体“网络信息”的载体,因此,以“网络信息”作为限定词更符合计量学科的命名规律。(2)“Webometrics”以“三计学”为学科基础,在学科体系中属于“信息计量学”的下位学科,延续使用“Informetrics”的中文译名“信息计量学”将使这种继承关系更加明确。

2.2 网络信息计量学的定义、性质与研究对象

2.2.1 网络信息计量学的定义

与其他新兴科学学科一样,学术界一直对“网络信息计量学(Webometrics)”一词存在着各种各样的解释,而且,这些解释随着学科的不断发展而不断变化着。

最早提出“Webometrics”的T.C.Almind等人将其定义为“信息计量学方法在WWW上的应用(the application of Informetrics methods to theWorld Wide Web)”[15],从中可以看出,他们是将其视为一种全新的研究方法而提出的。因此,在最初的几年里,Webometrics一直被定义为一种新兴的研究方法或研究工具,例如,Moses ABoudourides等人就明确指出,Webomerics是“一种应用于WWW上的方法(a methodology for theWorld WideWeb)”[16]。李长忠曾将网络信息计量学定义为“应用文献计量学、科学计量学以及信息技术来分析各种信息媒介、信息交流的一种方法”[17]。赵启民则认为,网络信息计量学是随着网络的发展和网络信息资源的激增而产生的一种网络计量工具,它综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析[18]。此外,还有人将其定义为“基于Web的软件计量分析工具”,“是集计算机技术、网络技术、计量学方法、统计学方法于一体(的方法),其应用范围覆盖了所有基于网络通信技术的信息测度”[19]

随着研究的深入,网络信息计量学(Webometrics)逐步发展成为一门独立的科学学科,成为信息科学的新兴分支,这一术语的含义也相应地趋向于作为一门科学学科来描述。例如,李长忠等人后来就认为:“网络信息计量学是指在电子网络环境中,运用文献计量学、科学计量学、情报计量学的方法,对各种信息、信息媒介及其功能进行定量研究和分析(的一门学科)。”[20]夏旭等人认为:“网络信息计量学是综合采用文献计量、信息计量、统计学方法、计算机技术和网络技术对网络文献规律进行统计分析的一门科学。”[21]Peter Ingwersen及其学生Lennart Bj9rneborn则在近期的论文中将“Webometrics”定义为“运用文献计量学、信息计量学的方法对Web上信息资源、结构和技术的构成与应用进行定量研究的一门学科”[22],这一定义被Mike Thewall等人称之为“从情报科学的角度所下的定义(An information science-related defini-tion)”[23]。此外,其他的定义还有:网络信息计量学是一门关于计算机软件设计的科学;是一门对网络文献规律进行分析的科学;是一门研究因特网上数据之间相互引用的科学。

笔者曾在2000年的论文中作过如下定义:“从研究对象、方法、内容和目标等方面来看,网络信息计量学是采用数学、统计学等各种定量方法,对网上信息的组织、存贮、分布、传递、相互引证和开发利用等进行定量描述和统计分析,以便揭示其数量特征和内在规律的一门新兴分支学科。它主要是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,也是信息计量学的一个新的发展方向和重要的研究领域。”[24]这一定义自提出后就被学术界广泛引用,从网络信息计量学的研究现状及其发展趋势来看,可以说是目前最为准确、全面的定义。

需要说明的是,“网络信息计量学”作为一门发展中的新兴学科,其产生还不到10年,其定义还远没有定论。“网络信息计量学(Webometrics)”这一术语所表示的含义的变化,实际上从一个角度反映出了该学科由一种经验性的研究方法向一门严谨的科学学科发展转化的过程。可以预见,随着网络信息计量学研究的不断发展,这一学科的定义还将继续演化,直至发展成为一门成熟的为学术界所公认的科学学科。

2.2.2 网络信息计量学的学科性质

一门学科的学科性质是其最根本的属性特征,在很大程度上决定了它所具有的各种特性。据笔者调查,很多研究者都曾对网络信息计量学的特点进行过分析,例如,徐久龄等人将其总结为:学科新颖、内容广泛;概率与统计的大量使用;应用更广泛、检索更方便[25]。赵启明则认为,“网络信息计量学是以网络计量工具为手段,以文献计量方法为基础,以网页分析和引文分析为重点,探讨网络发展的一般规律”,具有全面统计、方便计量、结果准确的特点[26]。但与此同时,我们还注意到,有关网络信息计量学学科性质的分析研究却很少。这表明,大多数研究者都只把注意力集中在网络信息计量学的表象特征的归纳上,而缺乏更深层次的剖析。

我们认为,为了对网络信息计量学有更加清楚的认识,必须对其学科性质作深入的分析。主要从以下几个方面来理解:

首先,网络信息计量学是信息计量学的分支学科。我们曾在前文中论述过,一方面“三计学”是网络信息计量学的理论原理、研究方法的主要来源,是网络信息计量学的学科基础,从某种意义上来说,网络信息计量学就是文献计量学、科学计量学和信息计量学在网络上的应用的一门学科。另一方面,“三计学”最终将融合到“信息计量学”这统一的学科体系之下。因此,网络信息计量学最终将定位为信息计量学的下位学科。

其次,网络信息计量学是一门交叉性的边缘学科。与传统信息资源相比,网络信息在数量、结构、分布、传播范围、类型、载体形态、内涵、控制机制、传递手段等方面,都与传统的信息资源有着很大的差异,呈现出许多新的特点,决定了网络信息计量学的研究过程具有许多区别于“三计学”的特征。例如,网络信息的丰富性、多样性和分散性使统计数据很难做到准确而全面;网络信息的引用缺少统一的规范,给网络资源的引用情况统计带来了一定的困难;网络信息的更新十分迅速,难以保存,统计工作难以保证真实性和准确性;网络信息自由度很大,使信息质量不稳定等。因此,“三计学”虽然构成了网络信息计量学的基础,但并不是网络信息计量学的全部,网络信息计量学必须不断汲取其他学科的成果,扩大自己的学科基础。网络信息计量学的这种“交叉”性质,一方面表现在信息科学内部分支学科之间的交叉、融合,包括信息技术、人工智能、计算机科学、信息资源管理、情报学、信息计量学等诸多分支学科;另一方面表现在与信息科学之外的其他学科交叉,例如数学、统计学、管理科学、社会学等更为广泛的科学领域。

最后,网络信息计量学是一门应用性学科。我们在分析其产生背景时曾讲过,“社会实践需要是网络信息计量学产生和发展的根本动力”。网络信息计量学研究的根本目的主要是通过网上信息的计量研究,为网上信息的有序化组织和合理分布、为网络信息资源的优化配置和有效利用、为网络管理的规范化和科学化提供必要的定量依据,从而改善网络的组织管理和信息管理,提高其管理水平,促进其经济效益和社会效益的充分发挥,推动社会信息化、网络化的健康发展。“应用”一直都是网络信息计量学的重要研究内容,虽然理论问题的研究是不可或缺的,但更多的研究是结合实际需要,为解决网络管理等工作中的具体问题而展开的,具有明显的“应用性”特征。这一特征既符合所有计量科学的共性,也在一定程度上解释了目前网络信息计量学“应用”领先于“理论”的研究现状。

2.2.3 网络信息计量学的研究对象

研究对象是一门学科区别于其他学科的根本特点之一,也是一门学科之所以能够成为一门独立学科的最根本的前提。对于网络信息计量学的研究对象,不同的学者从不同的角度作出了各自的总结和归纳。

徐久龄等人认为,网络信息计量学的研究对象包括:(1)对网络信息计量学文献著者规律的研究;(2)对网络文献分散规律的研究;(3)对网络文献增长规律的研究;(4)对网络文献老化规律的研究;(5)对网络信息计量学文献引文的分析;(6)对网络上声音、图形、文字规律的研究。其研究范围涉及网络信息计量学中的文献检索研究、引文分析、传统引文分析指标的改进(包括网络文献的引文数、平均引用数、自引数与自引率、被引用数、影响因数、快指标等)、老化规律的研究、累积优势原理与核心期刊效应等[27]。金岩认为,网络信息计量学的研究内容包括:(1)网站的主题分析、类型分析、链接深度分析、域名分析、点击率分析、信息传递以及各个站点之间的相互引证分析;(2)网上信息资源的词频分析、信息的增长和老化、信息的半衰期以及用户网上行为分析等[28]。李长忠认为,网络信息计量学的研究对象为网络技术、网页中的文献计量学方法、万维网的电子数据库分析及网络结构、电子数据库资源的产出量。其研究重点包括:网页上的新闻组、科学交流、网上研发指标分析;引文分析应用(包括超文本链接)、信息计量学法则与分布、数学模型推导以及关于科学文献老化、分散和引用研究;网络对科学组织、信息情报流的内在规律及科学技术合作的影响;国家、地区科学技术系统的指标、科学政策和研发管理的研究;电子科学期刊的评估;网络间连接关系的研究;互联网的规模,包括主机数、域名数、用户数等;互联网活动指标信息流、交换信息量、访问数等;网络空间与网页,包括网页空间规模、网页按国家地区的分布、网页按语言的分布、国家域名分布、学术研究网页空间、超文本链接等[29]。后来,李长忠等人又将网络信息计量学的研究对象进一步归纳为:(1)万维网上的站点、主页、电子邮件、讨论新闻组等媒介和内容;(2)万维网的研究测度与计量;(3)有关电子图书、期刊、图书馆和参考资源等电子网络信息资源[30]。牟华等人认为,网络信息计量学的研究对象包括网络技术、网页中文献计量学方法、万维网的电子数据库分析及网络结构、电子数据库资源的产出量、主页、电子引文分析、电子媒介和资源研究、数字图书馆、虚拟图书馆、电子信息系统、域名分布等[31]。蔡明月等人认为,网络信息计量学主要探讨的内容包括:(1)网络连结;(2)网络内容;(3)网络勘探(Web Mining);(4)网络影响因素(Web Impact Factor)[32]

我们认为,网络信息计量学的研究对象主要涉及三个层次或组成部分:(1)网上信息本身的直接计量问题,包括数字信息或文字信息,集文字、图像和声音为一体的多媒体信息,以字节为单位的信息量和流量的计量等;(2)网上文献、文献信息及其相关特征信息的计量问题,如网上电子期刊、论文、图书、报告等各种类型的文献,以及文献的分布结构、学科主题、关键词、著者信息、出版信息等的计量,既涉及网上一次文献,又包括二次、三次文献的计量问题;(3)网络结构单元的信息计量问题,网络结构单元包括站点、布告栏、聊天室、讨论组、电子邮件等,对以上网络结构单元中的信息增长、信息老化、学科分布、信息传递,以及各单元之间的相互引证和联系等的计量研究,将是网络信息计量学研究的重要组成部分。

以上众多的观点表明,目前学术界对网络信息计量学的研究对象还没有一个统一的、清晰的认识。

3 网络信息计量学的主要研究内容及其进展

网络信息计量学的内容体系由它的理论、方法和应用研究三个部分构成,其中理论是基础,方法是手段,应用是目的,三者相辅相成,不可偏废。与之相对应,我们可以将网络信息计量学分为“理论网络信息计量学”、“技术网络信息计量学”、“应用网络信息计量学”三个有机组成部分。其中,“理论网络信息计量学”主要研究网络信息计量学赖以形成和发展的各种理论问题;“技术网络信息计量学”主要研究网络信息计量研究过程中的各种技术、方法和实现手段等问题;“应用网络信息计量学”主要研究网络信息计量学理论和技术在不同领域的应用和发展。这三者既各有不同,又相互依赖和制约,每个部分也都有着丰富的内容。需要说明的是,“理论网络信息计量学”、“技术网络信息计量学”、“应用网络信息计量学”只是逻辑上的划分,三者之间并不是相互独立的,而是相辅相成、相互促进的关系。而在实际的网络信息计量学研究工作中,研究内容一般都是综合性的,往往同时涉及理论、技术、应用等多个方面。

3.1 网络信息计量学的理论研究

辩证唯物主义认为:“理论是理性认识的最高形式,是主体在感性认识的基础上,运用理性思维对感性材料系统地进行加工改造、抽象概括的结果,其任务是要全面地反映事物的本质和规律。理论的形成和建立,标志着主体对客体的理性认识达到了系统化的水平。”[33]具体到网络信息计量学来说,其理论集合表现为该学科中各种概念、原理、推论联系起来所形成的理论体系。由于不同的科学家共同体的学术观点不同,网络信息计量学的理论研究会形成不同的学派,从而构成不同的理论体系。但无论学派有什么不同,都必然包括两个不可或缺的逻辑部分:①网络信息计量学学科体系构建中的基本理论问题,包括学科定义、学科性质、研究对象、研究内容、学科体系、研究目的、研究意义、与相关学科的关系、专用术语、相关概念等问题,这部分的研究内容对于明确网络信息计量学的学科概念和研究内容,指导网络信息计量学的发展方向具有十分重要的意义,是网络信息计量学作为一门学科存在而必须解决的基本问题。②网络信息计量学的基础理论问题,包括理论基础、哲学基础、方法论以及各种基本原理和推论,作为研究者思维高度抽象的结晶,基础理论是客观物质最本质的规律性的反映,是科学研究工作的基石。我们在以上的内容中对网络信息计量学的学科定义、学科性质、研究对象、研究目的和意义等基本理论问题进行了总结和分析,下面,我们将对网络信息计量学在基础理论方面的研究进展情况进行评述。

对于网络信息计量学的学科发展来说,当务之急是逐步形成和发展该学科的基础理论,并用以指导新形式下的网络信息计量工作。从网络信息计量学的学科性质来看,其基础理论主要来源于两个方面:首先,网络信息计量学是情报科学、信息管理科学和信息计量学的新兴分支学科,因此,其基础理论首先源自它的上位学科,信息管理学和情报学中的很多理论、原理都可延伸到网络信息计量领域,成为网络信息计量学的基础理论,正如前文所提到的,这其中既包括相似原理、耗散结构原理、马太效应、最小努力原则、随机过程原理等普遍原理,也包括信息交流理论、信息组织理论、信息系统理论等信息科学理论,还包括信息增长与老化规律、集中与分散规律、著者规律、词频规律、引证规律、引文分布规律等经典规律。需要注意的是,研究者们在“借鉴”传统理论的同时,必须充分考虑到网络环境的复杂性和网络信息的特殊性,对原有理论进行“改造”,进行严密的验证,才能真正为网络信息计量学研究所用。其次,网络信息计量学是由网络技术、网络管理、信息资源管理与信息计量学等相互结合、交叉渗透而形成的一门交叉性边缘学科,这种多学科的交叉渗透使学科向更广阔的领域发展成为可能,将极大地扩展网络信息计量学的理论体系。

从目前网络信息计量学理论研究的参与者来看,丹麦皇家图书情报学院[34](Royal School of Library and Information Science)的研究团队所作的贡献最有代表性。1997年,该学院的T.C.Almind和Peter Ingwersen[35]首先提出了“Webometrics”的概念,被公认为网络信息计量学诞生的标志。1998年,IreneWormell[36]从信息计量学在网络上的应用的角度,论述了网络时代图书情报科学所面临的挑战,指出网络信息计量研究蕴含着巨大的潜力。1998年,Peter Ingwersen[37]受文献计量学中的期刊“影响因子”(Impact Factor)的概念启发提出了网络影响因子(Web Impact Factor,WIF)的概念,用来分析一定时期内相对关注的网站或网页平均被引情况,以此来评价网站在网上的影响力。这篇论文在网络信息计量学的发展历史上具有十分重要的意义,首先,他开创了一个全新的研究领域,此后众多学者从概念定义、测度方法、实证分析、应用实践等众多方面对网络影响因子进行了广泛深入的研究,使其成为网络信息计量学的前沿热点和重要内容。更为重要的是,他开创了一种新的研究思路,证明了文献计量学的经典概念和研究方法可以被成功地应用到网络信息的研究中,此后,研究者们纷纷效仿,引入了更多的概念和方法,既丰富了网络信息计量学的理论内容和研究手段,更明确了网络信息计量学作为情报学分支学科的性质。2001年,Lennart Bj9rneborn和Peter Ingwersen[38]对网络信息计量学的研究热点和发展趋势做了全面的论述,介绍了知识发现(Knowledge Discovery)、问题追踪(Issue Tracking)、图论方法(Graph Theoretic Approaches)等新的研究方向,拓展了网络信息计量学的研究领域。2004年,Lennart Bj9rneborn和Peter Ingwersen[39]在信息计量学和文献计量学的框架范围内,构建了一个较为全面的网络信息计量学的基础概念体系,包括一系列专用术语和符号,标志着网络信息计量学的发展经过多年的积累,已进入了成熟的发展阶段,一个全新的学科终于要“瓜熟蒂落”了。

从目前网络信息计量学理论研究的内容来看,有关网络信息的变化特点和分布规律的研究是学者们关注的焦点,许多学者对此进行了探讨。例如,1999年,Bernardo A.Huberman和LadaA.Adamic[40]在《自然》(Nature)杂志上发表论文探讨了万维网的动态增长规律。他们指出,从总体上看,网络上的页面在网站上的分布符合乘幂分布规律(Power Law),即:大多数网站只拥用少量的页面,而少数网站则拥有大量的页面。这一现象是由以下三个因素决定的:(1)一般而言网站上页面数量的变化量是与网站规模成正比的,即在相同时间内,规模越大的网站上的页面数量变化越大。(2)网络上的站点数量是呈指数增长的,因此,“年轻”的网站数量要远远多于“年老”的网站。(3)网站规模虽然都处于乘数扩张过程(Multiplicative Growth Process),但其增长率是各不相同的。他们进一步指出,乘幂分布规律可以使我们不必检索整个网络,就能估算出处于某个特定规模的网站数量。随后在2000年,他们[41]又在《科学》(Science)杂志上进一步撰文指出,网络站点的入链数同样符合乘幂分布规律。此外,Jakob Nielsen[42]、Ronald Rousseau[43]、Réka Albert[44]、D.Pennock[45]、Mike Thelwall[46]等人在针对不同对象的研究中,都得到相关网络信息的乘幂分布规律。在国内,有关网络信息增长、老化以及分布规律的研究近年来也逐渐增多。例如,候经川等人[47]在对网络信息增长机制的研究中,以“信息转发假设”和“信息创新假设”为基础,导出了网络信息增长的乘数扩张机制,并运用这一理论模型对现有各种信息增长模型给出了统一的解释,提出了“禁止信息转发、以控制网络重复信息泛滥”和“建立中央信息存储发布系统、以促进网络信息的充分利用”等政策主张。笔者[48]曾以“PC显卡”主题内容为研究对象,利用Google检索并统计分析网络主题内容数量分布和变化情况,得出了内容呈指数增长的基本判断。他们还利用SPSS工具对数据进行拟合分析,求出了拟合曲线的指数方程。王宏鑫等人[49]对网络信息老化研究的现状与发展趋势、意义、内容、思路与方法等问题进行了研究。段宇峰[50]在分析网络信息资源老化的原因及其特征的基础上,指出衡量网络信息资源的老化状况应该从网络信息资源自身的生命周期和被利用情况两个方面考虑。提出以静态半衰期、动态半衰期和生存期作为衡量网络信息资源自身生命周期的指标,以宏观网络信息资源半衰期和微观网络信息资源半衰期作为衡量网络信息资源被利用情况的指标。蔡明月[51]采用文献计量学的研究方法,就网络上有关数字图书馆且由我国台湾地区自建的网站和网页进行计量分析,以文献计量学的经典定律分别界定核心网站和检验网站生产力分布,进而观察数字图书馆网页的发展变化。马费成等人[52]对网络信息资源的集中分散规律、生产规律和增长、老化规律进行了研究。

从目前网络信息计量学理论研究的思路来看,主要以借鉴“三计学”中的经典定律为主。正如前文所言,网络信息计量学的基础理论首先源自它的上位学科,尤其是“三计学”的基础理论为构建网络信息计量学的理论体系提供了依据。文献的增长规律、老化规律、布拉德福定律、齐普夫定律、洛特卡定律、文献引用规律是文献计量学理论的精华和主体[53],它们和情报学中的其他理论、原理一同构成了传统“三计学”的理论基石。我们在探索网络信息的规律时,可以依据上述经典定律的科学原理,借鉴其研究方法,仿照其数学表达,来考察网络信息流的动态特性,揭示网络信息的分布规律,研究网络系统各因素之间的数量关系,建立准确的数学描述,分析其成因和发展趋势,从而得出有意义的结论。因此,考察“三计学”中的经典定律在网络环境下是否仍然适用,就成为网络信息计量学理论研究的主要思路和重点内容。我们在上文中所介绍的研究大多数正是基于这一思路来开展的。这些研究的结果不仅证明了网络作为整体来说具有许多规律性,而且表明了网络信息在许多方面都具有类似于传统文献信息的规律性。例如,网页和网络链接都表现出乘幂分布规律,而这种集中与分散规律正是文献分布的最普遍的基本规律。

与此同时,我们还应该意识到,网络环境的复杂性和网络信息的新特点决定了网络信息在各个方面都与传统文献信息具有本质的不同,因而表现出完全不同的规律性。例如,文献计量学中的普赖斯定律(Price Law)表明,“全部科学家总人数开平方,所得到的人数撰写了全部科学论文的一半”[54]。但马费成等人[55]在研究网络信息资源的生产力分布时,发现核心区(总数开根号所得的数目)的信息生产者所生产的信息远远不足网络信息总量的一半,表明著者的集中程度比传统文献低,著者分布更加广泛而且相对均衡。而蔡明月[56]的研究结果则表明,核心区的网页制作单位生产的网页数量远远大于网页数量的一半。两者的结论不仅都不符合普赖斯定律,而且是完全相反的。这充分说明,不同条件下的网络信息生产力表现出不同的规律性。因此,我们在借鉴一切经典定律时,决不能盲目仿制或者生搬硬套,必须通过严密的验证对其进行“改造”,只有这样才能真正为网络信息计量研究所用。此外,网络信息计量学具有交叉学科的性质,决定了来自传统“三计学”领域的研究者们必需不断汲取其他学科的成果,而来自其他领域的学者开始涉及网络信息计量的研究,则引入了其他学科领域的理论和研究方法,这都对研究者提出了更高的要求。

总之,尽管网络信息计量学已经被广泛接受,并且发展迅速,但支撑其作为一门学科得以成立的核心规律和理论模型还远远没有建立起来,研究者们依然任重而道远。

3.2 网络信息计量学的方法研究

从网络信息计量研究的具体过程来看,其研究方法和技术主要包括“数据收集方法”和“数据分析方法”两个方面。

3.2.1 数据收集方法

对于任何计量科学的研究来说,所要研究数据的收集整理工作无疑是其开展各项研究工作的基本前提,网络信息计量学自然也不例外。由于数据的查全率和查准率直接影响到研究结果的可靠性和合理性,因此,对数据收集方法本身所作的研究也成为网络信息计量学研究的重要内容。一般而言,数据收集可分为人工方式、计算机辅助方式两种方式,在网络环境下,纯粹的人工收集方式既不经济也不可行,因此,充分利用计算机技术和工具就成为研究者收集数据的必然选择,“人机结合”的数据收集方法是目前网络信息计量研究中收集数据的主要方法。对目前使用的计算机辅助工具来说,无论种类多么繁多,都可大致分为“专用工具”和“通用工具”两种。“专用工具”是针对特定的研究对象和研究目的而开发专门的数据收集工具,以实现数据的自动收集和筛选工作,例如Alastair GSmith和Mike Thewall[57]在研究中就使用了自己设计的爬行器。“专用工具”虽然具有“量身定做”的优势,但开发周期过长、投入过多、技术门槛过高使这种方式具有很大的局限性。“通用工具”则是指已有的广泛应用于多个领域的计算机软件或系统,目前研究者们广泛使用的商业搜索引擎就是典型的例子。“通用工具”具有成本较低、使用容易的优点使其成为目前研究者的主要选择,但是,这些工具在很大程度上仍然依赖于人工的参与,效率低下,功能有限,信度和效度不高,难以满足网络信息计量研究的需要。从将来的发展来看,结合“通用工具”和“专用工具”两者的优势,在通用性的基础上加强专用性,将是未来数据收集工具发展的主要趋势。例如,开发应用于某一领域的“专业搜索引擎”已受到许多搜索引擎厂商的重视。

从最早的T.C.Almind和Peter Ingwersen所作的研究开始,一直到今天,研究者们主要依靠商业搜索引擎来收集数据。所用到的搜索引擎也是种类繁多,特点各异,包括AltaVista、AllTheWeb、Northernlight、Google、Excite、Lycos、HotBot、Infoseek等在内的众多搜索引擎都曾被应用于网络信息计量研究的数据搜集工作中。相应地,出现了许多以搜索引擎为研究对象的,以评价、应用和改进为目标的研究工作,例如Judit Bar-Ilan[58]、Ronald rousseau[59]、Clarke和Willett[60]、Paul Wouters,Diana Gerbec[61]、Herbert Snyder和Howard Rosenbaum[62]等人所作的研究。虽然搜索引擎已成为事实上的主要数据搜集渠道,成为网络信息计量研究不可或缺的工具,但其查全率和查准率一直深受质疑,其搜索结果不稳定、技术机制不透明已成为公认的缺陷。为了解决这一难题,许多学者进行了许多有益的尝试。例如,Lawrence和Giles[63]指出,为了克服单一引擎的局限性,从而获得全面的检索结果,一方面可将几个主要引擎结合起来使用,也可通过利用一些具有自动抓取功能的研究型搜索引擎来获得信息。Alastair GSmith和Mike Thewall则采用了自己设计的爬行器和搜索引擎进行了比较研究[64]。MikeThewall[65]提出了“替代文献模型(Alternative document models,ADMs)”,以目录、域名以及整个网站为单位来合计,链接数量,而不以网页为单位,来避免单一链接动机所带来的数据异常现象。

与国外相比,国内网络信息计量学领域有关搜索引擎的研究并不多见,专题研究就更少,大多是在对其他问题的研究过程中,对搜索引擎的使用问题作相对粗浅的探讨,研究方法也大多仿照国外学者的思路。而且,研究对象主要是国外的英文搜索引擎,这是由中文搜索引擎功能单一、性能不高、不适合于研究数据收集的现实情况决定的。以下是近年来国内本领域主要的搜索引擎研究。1998年,章琳等人[66]选取Yahoo,Altavista,Excite,HotBot,Infoseek,Metacrawler等搜索引擎对5个提问的结果总数、结果的相关性、结果的可连续性等进行评测,发现不同搜索引擎的检索结果重复不多。1999年,任瑞娟等人[67]选取了10种中文搜索引擎进行评测,发现中文搜索引擎在数据更新、记录去重、相关性排序等方面存在问题。2001年,夏旭等人[68]对性能较好的10种医学搜索引擎进行检索和比较分析,并对10个搜索引擎两两之间索引相同站点情况进行分析,发现不同搜索引擎索引相同站点的频次较低,网页重复率不高,说明不同医学搜索引擎的覆盖范围有限,同时还发现医学搜索引擎检索结果的相关性不如通用引擎。叶中行等人[69]仿照Steve Lawrence和C.Lee Giles的研究方法,计算了中文网页的数量和主要中文搜索引擎的覆盖率、查准率等性能指标,并对中文搜索引擎的发展情况作了评述。2003年,笔者[70]在对中国主要大学网站作链接分析时,发现利用Alta Vista和All-TheWeb的数据分析得到的结果基本相同,说明利用搜索引擎的数据得出的结果具有较好的稳定性和可靠性。从两个搜索引擎的检索情况来看,AllTheWeb返回的数据比Alta Vista要多,说明All-TheWeb数据库规模确实比较大。但从返回数据的稳定性看,Alta Vista的检索结果比AllTheWeb更稳定,没有异常数据的出现,在样本量相同或者相近的情况下,利用Alta Vista的数据分析得到的结果相关性也更为显著。2005年,吕俊生等人[71]对用于网络链接关系检索的搜索引擎,从检索功能、检索表达式、基本性能等方面进行了系统的调研分析,并对几个搜索引擎进行了比较研究,提出了用于链接分析的搜索引擎的选择方案。

3.2.2 数据分析方法

对所收集的原始数据进行分析是网络信息计量研究的主要环节,其目的是对收集到的原始数据进行整理、解析、运算,发现网络信息的数量特征和内在规律,得出科学的结论。近年来,有关网络数据分析的研究已经发展成为一个崭新的专业领域,包括了网络数据流量分析、网络数据的定性分析、网络数据的多维分析、网络数据的挖掘分析以及网络数据仓库、网络数据分析系统的开发等丰富的内容。它是网络信息计量学的主要研究方法和重要研究内容。另一方面,网络信息计量学研究对网络数据分析方法和手段的要求越来越高,则是其得以不断发展的动力。

与理论基础一样,网络信息计量学的数据分析方法同样有两个主要来源:首先,从某种意义上来说,网络信息计量学就是文献计量学、科学计量学在网络上的应用的一门学科,因而在文献计量学、科学计量学中得到广泛应用的文献信息统计分析法、数学模型分析法、引文分析法、书目分析法、系统分析法、关键词统计分析法、关联数据分析法(包括聚类分析、共词分析、同域分析等)、计算机辅助文献信息计量分析法等定量方法在网络信息计量研究中都得到了广泛的应用。例如,目前得到广泛应用的“网络链接分析法(Hyperlink Analysis)”就源自于文献计量学中的“引文分析法(Citation Analysis)”。由于网络环境的特殊性,我们在应用过程中必须对上述方法进行了不断的调整和变化,使其成为适用于网络信息计量学研究的方法,这是“技术网络信息计量学”的主要研究内容之一。其次,网络信息计量学作为“网络技术、统计学、文献计量学理论三合一的产物”,涉及计算机、人工智能、拓扑学、社会学、图论等众多学科和研究领域,来自这些学科领域的研究方法和技术手段丰富了网络信息计量学方法体系,促进了网络信息计量研究工作的发展。例如,新闻传播领域的“内容分析法(Content Analysis)”、数据库技术领域的“数据挖掘(Data Mining)方法”、理论物理学领域的“复杂网络理论(Complex Network Theory)”、计算机科学领域的“Web信息检索算法(Web Information Retrieval Algorithms)”、社会学中的“社会网络分析方法(Social Network Analysis)”、数学中的“图论方法(Graph Theoretic Approaches)”和“拓扑学方法(Topology Approaches)”等都已经应用到网络信息计量研究中。如何将这些来自不同领域的方法与网络信息计量研究实践相结合,将其转化为网络信息计量学的特征研究方法,最终将其纳入本学科的方法论体系,同样是“技术网络信息计量学”的重要研究内容。无论采取哪种分析方法,数学、统计学等定量研究方法都是网络信息计量学的基本研究方法,因此,功能强大的统计分析工具就成为网络数据分析必不可少的利器。目前比较权威可靠的通用统计分析软件包括统计分析系统软件包SAS(Statistical Analysis System)、社会科学统计软件包SPSS(Statistical Programfor Social Science)、数据处理组合软件包IMPS、关系式数据分析系统软件包RDAS(Relational Data Analysis System)等。

在目前已开展的研究中,应用最广泛的是“链接分析方法”(Hyperlink Analysis),它是一种以网络链接为研究对象,依据传统文献计量学引文分析法的基本原理和研究方法,对网络链接的分布规律和网络信息单元相互之间的链接规律进行分析研究的网络信息计量学的特征研究方法。网络链接分析源自于“网络链接”与“科学文献的引文”之间天然的相似性,这使国外的一些文献计量学家找到了文献计量和网络的契合点,创造性地将Web网页链接(Hyperlink)与传统文献中的“参考”(reference)和“引用”(citation)联系起来。1996年,美国爱荷华州立大学图书馆的理论馆员Gerry McKiernan[72]根据文献计量学中引文的含义,首次提出了“Sitation”的概念,来描述网站(site)之间相互链接的行为,他指出:Cited Sites=Sitation,即所谓Sitation就是被引用的站点。此后Isidro F.Aguillo在1996年比勒菲尔德召开的4S/EASST会议上引用了这一概念。1997年Ronald Rousseau[73]发表的论文首次将“Sitation”一词正式应用到学术论文题名当中,标志着“网络链接分析方法”的确立。此后,“网络影响因子”(Web Impact Factor,WIF)、“网站双引聚类分析”(Co-Sitation)等一系列“移植”的新概念和新方法不断被提出来。从目前来看,在有关网络信息计量学的学术论文中,关于网络链接分析的论文占了绝大多数,这充分说明,Web网页链接分析是目前网络信息计量学的研究热点和重点,对Web网页链接进行分析是网络信息计量学一项重要的研究内容,链接分析法已成为网络信息计量学研究的重要方法。有的学者更进一步认为,网络链接研究是促进网络信息计量学产生和发展的重要动力。

目前有关网络链接分析的研究工作大体上可分为以下几个主要部分:

(1)网络链接分布规律研究。例如,1997年,Ronald Rousseau[74]通过对网址的分布模式和进入网页的链接作了分析,发现在他所研究的343个网址中最高层域名服从洛特卡分布,而且对这些网址的引用也符合洛特卡分布,自引比例约为30%。他认为,对网页链接关系的研究与对发表文章的引文研究具有相似性,但也有很大的不同。他还指出,网络内容具有很强的易变性(Volaile),导致研究过程无法重复,研究者应该谨慎。1997年,Jakob Nielsen[75][76]通过研究发现,网页点击率和网页链接率都符合Zipf定律,并认为可以通过齐普夫曲线来分析网页的受欢迎程度。在随后的日子里,他始终坚持对这一现象进行研究,一直持续到2005年仍未间断,而每年的研究结果都能得到相似的结论。

(2)同链聚类分析研究。例如,1996年,美国伯克利加州大学信息管理与系统学院的Ray R.Larson教授[77]就指出,网络链接可以清清楚楚地观察网站内容之间的联结,这种相当实体化的引用联结,配合同引分析一组高度被链接(Highly-Sited)的网站,可以探讨网络空间(Cyberspaces)的知识结构。他利用Alta Vista搜索引擎收集到有关地球科学文献的同链情况数据,对有关地理信息系统、地球科学和卫星遥感方面的网站进行了同链分析,使用同引频率矩阵识别相关站点群落,并以此分析了地球科学、地理信息系统、卫星遥感等学科相互关系以及发展趋势。到目前为止,基于“同链关系”的聚类分析还不太多见,主要障碍在于有效的海量网络数据难以获得,相信随着数据收集方法的发展,这一领域的研究将成为网络信息计量研究的热点。

(3)网络影响因子研究。有关网络影响因子的研究是网络链接分析的重点内容。1998年,Peter Ingwersen[78]受文献计量学中的期刊“影响因子”(Impact Factor)的概念启发提出了网络影响因子(Web Impact Factor,WIF)的概念,用来分析一定时期内相对关注的网站或网页平均被引情况。此后,众多学者围绕这一主题开展了各种各样的研究工作,取得了丰富的研究成果。其中最为引人注目的是Alastair GSmith和Mike Thelwall,两人在此领域的著作颇丰,为网络影响因子的发展作出了突出的贡献。例如,1999年,在网络影响因子的概念提出不久,Alastair GSmith[79]就对应用网络影响因子进行网站比较的有关问题进行了探讨。同年,他[80]对澳洲的大学、国家图书馆等机构和电子期刊的站点进行了网络影响因子实证研究,并把研究结果与传统的研究方法得出的结果进行了对比,得出结论认为,大学和研究机构的网络影响因子是评价其网络影响力的一个有用指标,通过影响因子比较,可以确定这些机构在某一特定领域的地位,但对电子期刊则不然。他还通过对东南亚国家的站点进行网络影响因子研究,确定了三大群域,并认为其研究结果接近反映了国家的整体发展,明显可由GDP反映。2002年,Mike Thelwall[81]在对英国大学网站作链接分析时,考虑到大学网站与学术期刊网站的不同之处,对Ingwersen提出的WIF的计算公式作了改进,并发现英国大学网站特定网络空间中的WIF与各大学的科研排名存在显著的相关性。2003年,Alastair G Smith[82]根据Web链接来源页面(source pages)和目标页面(target pages)的特点以及链接动机(reason for linking)对一组面向研究的网站(包括大学、专业机构、研究机构、电子期刊、独立研究人员等网站)的样本进行了分类,得出了一些尝试性的结论。他还以分类研究的结果为基础,提出了实质链接(substantive links)以及实质网络影响因子(substantiveWeb Impact Factors)的概念,并认为研究中所涉及的链接中20%是实质链接。

(4)网络链接分析工具研究。在传统文献计量领域中,SCI、SSCI、EI等权威检索工具和引文数据库作为的重要信息源和研究工具,大大促进了引文分析法乃至整个文献计量学的全面发展。因此,网络链接分析工具的研究一直受到研究者们的高度重视,开发了许多专用的网络链接分析工具。例如,Jeromy Carrière和Rick Kazman[83]开发的“Webquery”系统可通过网页的链接关系和内容进行检索,然后再把结果用三维图像可视化手段表现出来,使相关节点之间的关系一目了然。Ying Ding[84]等人设计的“BIRS(Bibliometric Information Retrieval System)”就是一个基于网络的文献计量信息检索系统,可通过文献的引文链找到相关的在线资料。近年来,有关工具的开发工作由理论研究转向实践阶段,许多系统走出了实验室,越来越多的可用于网络链接分析的网站不断涌现出来。例如,美国宾州信息科学技术学院开发的Citeseer[85],可以用来查找和了解网页的引用和被引用情况,评价网页、网络杂志、有关作者研究课题的情况。Alexa[86]互联网公司(Alexa Internet,Inc.)开发的Alexa网站提供了网站统计(Site Stats)、联系方式(Contact Info)、流量细节(Traffic Details)、相关链接(Related Links)等数据信息,可用于网络链接分析中。英国南安普敦大学的“开放期刊计划(Open Journal Project)”[87]开发了一个网页自动链接工具,根据语义的相似性定量分析,可将电子期刊有关的内容和有关的网页进行自动链接,并可以对有关文章的引证关系进行定量研究。2005年,SCI的所有者——美国汤姆森公司[88]下属的汤姆森科技信息集团[89]联合NEC美国实验室[90]以及其他七所著名的学术机构开发了“网络引用索引(Web Citation Index,WCI),WCI是一个基于院校机构和专科图书馆的多学科引用索引系统。为用户提供了功能强大的基于引用的搜索工具,可搜索预印本、技术报告、学位论文、演讲记录、会议文献汇编以及其他目录难以考证的文献。

与国外相比,国内有关网络链接分析的研究起步稍晚,但很快就引起了人们的浓厚兴趣,迅速成为学术界关注的热点。在2003年以前,国内的研究主要以介绍国外研究成果和进展为主,研究者们通过对国外网络链接分析研究理论、方法、应用情况的总结和分析归纳,取得了一系列有意义的结论,为进一步的研究奠定了基础。例如,2002年,吴华香等人[91]从网络信息计量学的定义、研究对象出发,论述了链接分析法是网络信息计量学的研究方法之一,并对链接分析法的数据源的选择、实践、及注意事项等问题进行了探讨。笔者[92]探讨了Web网页链接的结构、类型、功能、作用、缺陷以及Web网页链接分析的主要内容和意义,是对Web网页链接分析所作的一个比较全面、系统的论述。2003年,俞培果等人[93]对“网页链接”和文献计量学中的“文献引用”进行了可比性分析,通过分析网页链接的原因和动机,把网页链接分为网站内部链接(包括网站结构链接、信息关联链接)和网站间链接(包括信息推介链接、信息来源链接、网络结构链接),然后逐一探讨了各类链接的测度意义,最后分析了网页链接测度的应用及其存在的问题。

近两年来,国内的研究者开始将研究重点转向实证研究上,他们通过与国外研究情况的对比,将国外的研究方法应用到国内的具体研究对象上,取得了一定的实证研究成果。例如,2004年,沙勇忠和牛春华[94]运用链接分析方法和网络影响因子测度方法,对我国信息化优秀企业网站的影响力进行了评价;同时将链接分析和网络影响因子测度的结果与中国企业信息化排名作了比较。试图对我国企业信息化的排名、链接分析和网络影响因子测度方法在企业网站评价方面的效能及其应用边界予以验证和探讨。2005年,王宏鑫[95]运用链接分析方法来评价公共图书馆的网站建设质量,他通过Google搜索各省级以上公共图书馆网址,然后使用“高级搜索”功能进行搜索,获得计量指标并进行分析,给出各馆网站建设质量按不同指标的排序和综合排序,以及各指标的优选排序。尤其值得一提的是,笔者等人[96][97][98][99][100][101][102][103][104]在《情报学报》、《中国图书馆学报》、《情报理论与实践》等权威期刊上发表了一系列的文章,不仅对网络链接研究的意义、现状、存在的问题、发展趋势和方法领域的问题进行了探讨,还通过大量的实证研究,深入分析了网络链接分析的研究步骤和研究方法,以及在网站评价和大学评价中应用的有关问题。

3.3 网络信息计量学的应用研究

应用研究和相关的实证研究是目前网络信息计量学研究工作最为集中的领域,对网络信息计量学的应用问题进行了探索,取得了丰富的研究成果,可以说是“百花齐放”、“硕果累累”。究其原因,首先是因为社会实践需要是学科产生的根本动力,网络信息计量学就是顺应网络社会发展需要而产生的,在应用领域对其展开研究自然就是学科发展的第一步,这也符合辩证唯物主义的科学按照“实践—方法—理论”的方向发展的“科学的实践观”。其次,这与网络信息计量学所具有的“应用性学科”的学科性质密不可分。网络信息计量学应用研究的根本目的是探讨网络信息计量学的基本原理、研究数据、指标和结论在不同领域的应用,通过对相关网络信息资源的分布、结构、质量、利用率和影响力等情况进行分析,发现问题,分析原因,作出结论,提出相应的改进建议和管理对策,从而提高网络管理水平,实现网络信息资源的有效配置,深化网络信息资源的开发利用,促进其经济效益和社会效益的充分发挥,推动社会信息化、网络化的健康发展。网络信息计量学作为一门交叉性的边缘学科,有着广泛的应用领域。它既可在图书情报领域内应用,又可以应用于科学学、社会学、人才学、历史学、未来学等许多相关学科的研究,还可以用于图书情报工作、网络管理、信息资源管理、科学评价、科技管理与预测、电子商务等具体社会生产实践活动中。因此,“应用网络信息计量学”的研究内容非常丰富,既要探讨理论研究成果在不同领域中应用的方法和技术,又要解决社会实践中具体的实际问题,还要不断开拓新的应用领域,涉及多角度、多层次的研究内容。而应用研究以及相关的实证研究反过来又可以验证基础理论和技术方法的正确性、适用性和有效性,促进理论和方法技术研究的不断进步。

在国外,网络信息计量学的应用研究起步较早,参与者遍布各个国家和地区,涉及广泛的研究对象和多层次的研究内容,采用了各种各样研究方法和工具,所取得的成果极为丰富。下面,我们以科学评价为例,探讨目前国外主要的研究进展情况。

从研究者来看,近年来,在网络信息计量学与科学评价的交叉领域涌现出了一批重要的专家学者,包括Peter Ingwersen、Lennart Bj9rneborn、Mike Thewall、Ronald Rousseau、Liwen Vaughan、Alastair G.Smith、Leot Leydesdorff等一大批知名学者在内的研究者都曾进行过有关科学评价的应用研究。在国外众多的“实践者”中,最为突出的是英国伍尔弗汉普顿大学计算机与信息技术学院[105](School of Computing and information Technoly,University of Wolverhampton)的Mike Thewall。他在实证研究领域的研究成果可以用“汗牛充栋”来形容,据笔者的统计,仅2002年一年,他就发表了学术论文近20篇,且大多是独著并发表在各种权威期刊上,可以说,他已成为国际网络信息计量学应用与实证研究的权威科学家之一。上述这些研究者们从不同的角度、在不同方面对网络信息计量学在科学评价中的应用进行了研究,取得了许多重要的研究成果,不仅满足了科学评价实践的需要,也为网络信息计量学的普遍原理和通用方法的研究奠定了基础,为推动网络信息计量学的发展,作出了巨大的贡献。

从研究对象来看,网络信息计量研究所涉及的评价对象主要包括以下几个方面:(1)对“期刊文献”(Journal articles)的研究,例如A.A.Goodrum等人[106];(2)对“期刊网站”(Journal Web sites)的研究,例如Alastair G.Smith[107];(3)对“国家”(Countries)的研究,例如Mike Thewall[108];(4)对“国家集合”(sectors within collections of countries)的研究,例如Leot Leydesdorff和Michael Curran[109];(5)对“国家内大学集合”(National Collections of universities)的研究,例如Mike Thelwall.和G.Harries[110];(6)对“国际大学集合”(International Collections of universities)的研究,例如Alastair G.Smith和Mike Thelwall[111];(7)对“学术型专业网站”(Academic departmental Web sites)的研究,例如O.Thomas和P.Willett[112];(8)对“其他学术相关网站和网页集合”(Other academic-related collectionsof sites or pages)的研究,例如L.F.Soualmia等人[113];(9)对“商业网站”(Commercial Web sites)的研究,例如Mike Thewall[114]

从研究内容来看,网络信息计量学在科学评价中的应用主要表现为三个层次:(1)直接以评价“客体”作为计量研究的对象,研究结果直接作为评价的结果。例如,Lei Cui[115]通过对美国19所顶尖医学院的图书馆网站进行链接分析,从成千上万与医学有关的网站中确定出了78个“核心”医学网站。(2)通过研究论证评价指标的有效性,研究结果作为评价指标。例如,Liwen Vaughan与Kathy Hysen[116]所作的研究都表明,期刊的影响因子(Journal Impact Factor,JIF)与该期刊网站的外部链接数和网络影响因子(Web Impact Factor,WIF)之间均存在着明显的相关关系,因此,网站的外部链接数和网络影响因子等网络计量数据均可作为网站评价的重要指标。(3)利用网络信息计量的研究成果、产品来进行评价工作。与SCI等引文数据库在传统科学评价中所起到的重要作用一样,网络信息计量研究的相关成果和产品也是网络时代的科学评价工作不可或缺的工具。例如,利用前文提到的Citeseer数据库,提供了网页的引用和被引用情况,可用于网页、网站和网络杂志的评价。再如,利用WCI这样的多学科引用索引系统,能得到预印本、技术报告、学位论文、演讲记录、会议文献汇编等各种网络文献的引用情况,可用于针对各种对象的科学评价中。

近年来,国内的网络信息计量学应用研究也逐渐增多。其中,相当一部分是结合具体的应用背景,探讨网络信息计量学在某一领域的应用问题。例如,夏旭等人[117]对网络信息计量学在医学图书馆、医学网站和医学搜索引擎等方面的初步应用进行了探讨,并就其可能的应用范围进行了分析。邹菲[118]就网络信息计量学在数字图书馆馆藏资源建设与管理中的应用问题作了探讨。牟华和周秀霞[119]探讨了网络信息计量学在图书情报领域中的应用。吴华香和钟少丹[120]分析了网络信息计量学在数字图书馆建设、情报科学、网络搜索引擎、网站建设与评价、社会科学研究、科技发展与科技决策、社会生活中的应用。刘远翔等人[121]探讨了网络信息计量学在数字图书馆建设和图书情报信息资源建设中的应用。吴华香和钟少丹[122]以中国期刊网评价结果为相对标准,利用网络信息计量学对我国图书馆学专家进行了网络测评与分析。张玢和许培扬[123]探讨了网络信息计量学在评价互联网医学信息资源方面的应用。张敏勤[124]讨论了核心论文学术评定制度提出的背景,从信息计量学的角度分析了其理论基础、在网络环境下的可行性并简单说明了网络信息计量学的研究对核心论文评定工作的影响。刘雷鸣和王艳[125]从应用的角度总结了包括网络计量学方法在内的几种常见网站评估模式,并从网站评估中的评估执行方被评估对象、采用的方法、评估的指标、影响结果的因素几方面出发,比较分析了各种评估模式的评估过程及其优缺点,认为这几种方法各有所长,在实际操作过程中需要根据评估目的选择不同的方法或几种方法的集成。

还有一些学者从不同角度对网络信息计量学的主要应用作了总结和归纳。例如,笔者[126]曾将网络信息计量学的主要应用归纳为以下五个方面:(1)从信息组织的角度研究因特网的知识结构,探索网络信息的特点与组织方法,指导网络信息资源的组织建设。(2)研究网络环境下的科学信息交流,探讨各学科发展趋势,分析建立新的科学发展指标,为有关科技决策提供参考。(3)从应用角度出发,研究网络信息资源的评价指标,为信息资源的开发利用提供指导。(4)研究网络信息资源的挖掘、分类、过滤与排序等,从而指导网络搜索引擎的研究开发工作,推动网络信息检索技术的发展。(5)研究网络终端用户的信息需求和上网习惯,指导网络建设和网站管理。此外,邓湘琳[127]对网络信息计量学在分析和优化搜索引擎的检索性能,通过引用分析,测定核心网站、数字图书馆、网络信息资源的老化研究等方面的应用作了探讨。徐久龄和许莲莲[128]认为网络信息计量学的应用主要表现在指导信息资源的合理组织与管理、指导网站建设与完善搜索引擎功能、指导网络信息检索等方面。金岩[129]认为对网络信息计量学的研究有利于网络信息资源的建设管理,对网络信息检索也有一定的指导意义。姜春林和鞠树成[130]认为网络信息计量学主要应用于网络信息资源的有效管理、网络和网页资源的评价、网络信息的预测等方面。郑家杰[131]将网络信息计量学的主要应用归纳为数字图书馆与情报科学、网络搜索引擎与网站建设管理、社会科学研究与科技发展决策、社会生活、指导核心期刊评定等五个领域。赵蓉英等人[132]将网络链接分析的主要应用领域归纳为核心网站的确定、网络结构挖掘和知识发现、搜索引擎检索质量的改进和在机构研究能力评价中的应用等四个方面。

从目前国内外的总体研究情况来看,网络信息计量学的应用研究大多还停留于理论探讨阶段,与真正应用到社会生产实践中还有相当的差距,但相关的实证研究已经蓬勃地开展起来。我们相信,随着网络信息计量学的应用研究在“深度”和“广度”上的不断发展,将有越来越多的研究成果由实证研究转入实际运用,为促进人类社会科技和经济的发展作出越来越大的贡献,网络信息计量学也将因此焕发出更强大的生命力。

3.4 目前网络信息计量学研究存在的主要问题

国内外网络信息计量学的研究经过近十年的积累,可以说已经度过了起步阶段,逐步进入高速发展的时期。但从总体上来说,它还是一个崭新的研究领域,在理论、方法、应用等方面的研究都尚未成熟,还存在许多问题有待解决。具体而言,目前网络信息计量学的研究主要存在着以下问题:

(1)缺乏明确的学科体系。网络信息计量学是一门交叉性边缘学科,这一学科性质决定了该学科的“宽度”和“深度”在起步阶段难以清晰地界定。目前学术界在网络信息计量学的学科发展方向上呈现出两个相反的趋势:“窄化趋势”和“泛化趋势”。前者将网络信息计量学定义为“文献计量学、信息计量学在网络上的应用”,后者则把一切“网络信息的定量研究”都归为网络信息计量学的研究范围。从眼前来看,没有明确的学科体系将网络信息计量研究纳入一个统一的研究空间中,导致学科界限模糊不清,最突出的表现就是概念术语混乱,目前仅与学科名称有关的中、英文词汇就有十几个,其他的概念术语更是多种多样,令人难以分辨。从长远来看,学科范围过于“窄化”,限制了学科的发展潜力,而过于“泛化”,则使学科有被架空的危险,这些都极大地阻碍了网络信息计量学的发展。

(2)缺乏完善的基础理论。网络信息计量学要成为一门真正意义上的科学学科,必须有贯穿其全领域的、自成体系的、严密的基本理论。这些理论不仅要能指导该领域的工作实践,并说明和解释其过程中出现的各种现象,而且还能引导学科的不断发展。但从目前网络信息计量学研究情况看,实证研究多于基础理论的研究,实践方法探讨多于普遍原理的研究,某一领域的具体应用多于网络信息普遍规律的研究。虽然研究者们借鉴了许多信息管理科学、情报科学的理论,但网络信息在形式、数量、内容等各方面都与非网络信息存在着极大差异,而传统理论的“改进”力度还远达不到要求。理论研究严重滞后,缺乏整体上的系统研究,研究成果更多地表现为经验性的总结,难以推广应用。这一现状导致网络信息计量学缺少具有普遍意义的理论成果,更谈不上形成比较完整的理论体系。

(3)缺乏可靠的研究方法。由于网络信息的动态性和时效性,网络信息计量研究往往难以重复,即使研究对象、研究步骤全都一样,也难以得到一样的研究结果。而网络数据收集方法和工具的匮乏,又使研究结果的可靠性备受质疑。可以说,缺乏有效的研究方法既影响了网络信息计量学理论体系的建立,又严重阻碍了其在应用领域的扩展,已成为目前阻碍网络信息计量学发展的重大障碍。究其原因,一方面在于缺乏对网络信息计量学研究方法的系统研究,虽然已经有许多方法应用到这一领域的研究当中,但没有坚实的方法论基础,没有完整清晰的方法论体系,结果导致方法长期停留于经验层次上,不能上升到理论的高度;另一方面,研究者们虽然不停地开展各自的研究工作和合作研究活动,但大多未能自觉地认真总结研究方法,几乎所有的文献对其研究工作所采用的方法都是轻轻带过,很少进行系统的描述和深入的讨论,其他研究者很难借鉴,更谈不上反复验证和改进完善。此外,随着网络技术的进步和时代的发展,网络信息计量学研究必须借鉴其他学科领域的研究方法,这就要求研究者的知识范围必须更加广泛,使方法论体系的建设难度增加。

(4)缺乏深入的应用研究。从目前网络信息计量学的应用研究情况来看,虽然有不少面向应用的实证研究,但大多停留于理论探讨阶段,既没有形成成熟的应用方法,也没有取得经过实践检验的应用成果,与真正应用到社会生产实践中还有相当的差距。而且,目前的应用研究大多局限于科学研究领域,诸如商业、教育、文化、社会等更为广泛的领域很少涉及,网络信息计量学的应用潜力还远未挖掘出来。此外,研究的深度还十分有限,没有对不同领域的特点和规律进行深入的了解和细致科学的分析,也就谈不上在因地制宜地制定应用方案。网络信息计量学的应用研究只有面向实践,不断向更广泛的领域和更深入的层次发展,才具有能充分发挥其重要的作用,为人类社会各方面的发展作贡献,这一学科也才会更有生命力。

总之,目前网络信息计量学缺乏整体上的系统研究,缺少具有普遍意义的研究成果,无论是理论研究、方法研究还是应用研究都很不完善,许多方面至今仍然是空白,这决定了网络信息计量学成长为一门成熟的学科尚需时日,而这也正是该研究领域具有巨大吸引力的原因所在。

4 国内外网络信息计量学研究的比较分析

自网络信息计量学诞生以来,日益受到国内外学术界的关注,来自各个国家和不同领域的研究者越来越多地参与到这一新兴领域的研究中来,共同推动了网络信息计量学的迅速发展。但与此同时,我们还注意到,国内和国外的有关研究表现出了一些不同的特点。下面,我们通过比较,对这些特点进行分析,既可以使我们在下一步的研究工作中少走弯路,也可以为我们提供新的研究思路。

(1)从总体上看,国外的网络信息计量学研究要领先于国内,这突出表现在:国外的研究工作多是开创性的,而国内的研究则大多带有模仿的痕迹。首先,无论是“Webometrics”这一学科本身,还是“Sitation”、“WIF”、“Inlink”等重要的基本概念都是国外的研究者率先提出来的。其次,从“三计学”方法的扩展应用,到“链接分析法”的发展成熟,乃至“数据挖掘”等跨学科方法的引入,都是国外研究者首先进行的。最后,应用研究以及相关的实证研究,也基本上是国外的研究者首先进行,然后被国内的研究者模仿、借鉴。例如,杨涛在其《中国50所大学网站的网络影响因子比较分析》[133]一文中所作的研究工作,基本上就是模仿Mike Thewall[134]的研究思路开展的,研究结果的讨论也是围绕Mike Thewall的观点进行的。这样的例子比比皆是。当然,模仿并不意味着抄袭,国内的研究者在研究对象上一般以国内的客体为主,通过比较研究,得出了很多有意义的结论。其中,在借鉴的基础上,进行开创性研究工作的也不乏其人。例如,我们在《中国大学网站链接分析及网络影响因子探讨》[135]一文中,就首次提出了以“大学二级教学单位数量”为分母来计算网络影响因子的新思路。

(2)从研究内容来看,国外的研究多以实证和方法研究为主,而国内的研究则以理论研究为主。我国网络信息计量学研究的发展历程大体上经过了“介绍引进—理论探讨—实证研究”的基本过程。这决定了在研究初期,国内的研究必定以理论性的介绍和总结为主。例如,根据笔者在“中国期刊网”上的调查,截止到2005年5月7日,“题名/关键词/摘要”中包含“网络(信息)计量学”的论文,共59篇,其中综述类的就占到了一半以上。而在国外,有关网络信息计量学的研究大体上是“实证研究—理论探讨”的模式。尽管在1997年,T.C.Almind和Peter Ingwersen就提出了“Webometrics”的概念,但在那时只是用以描述“将文献计量学方法应用于网络信息的定量研究”,其论文的主要内容是围绕实证来进行论述的。在理论方面的研究,尤其是在网络信息计量学的基本理论问题方面,有关的研究还很少。直到近年,才开始将网络信息计量学作为一门学科来看待,例如,2004年,Lennart Bj9rneborn和Peter Ingwersen[136]才发表了较为全面的论述网络信息计量学概念和体系的论文。而在国内,早在2001年,笔者[137]就从一门学科的角度对网络信息计量学的定义、研究目的、研究对象、研究内容等基本问题进行了系统的论述。

(3)从涉及的学科范围来看,国外要比国内广泛得多。首先,国外的研究者“出身”复杂,既包括Peter Ingwersen、Ronald Rousseau、Mike Thewall这样的来自传统图书情报领域的学者,还包括Steve Lawrence、C.Lee Giles、Bernardo A.Huberman、Lada A.Adamic这样的来自数学、计算机、社会学等更广泛领域的专家学者。其次,即使是来自图书情报学领域的研究者,他们在进行网络信息计量研究时,也积极地引入其他领域的理论、方法来为自己的研究目的服务。例如,1997年,L.Egghe[138]就引进分形理论来研究超文本系统的分形特征,并建立了其与信息计量参数的联系,进一步提出了超文本系统每页的超链接的分形计算公式。再如,2004年,Lennart Bj9rneborn在其博士论文[139]中,就以复杂网络理论为基础对网络链接结构进行了深入的研究,并以“学术网域空间的小世界链接结构”为其研究的主题。相比较而言,目前国内从事网络信息计量学的研究者大多数来自图书情报领域,其他领域的学者(尤其是计算机领域)虽然也在从事相关的研究,但并不处于同一个学科空间中。不同专业交流不够,基本上处于各自为战的局面。而且,囿于知识结构的限制,国内的研究者所采用的理论方法基本上是以传统的图书情报理论为基础,对其他领域涉及很少。这种状况在很大程度上限制了我国网络信息计量学的发展,如果不加以改善,将很难打破“落后”于国外的局面。

(4)从研究工具来看,国外研究者所使用的工具、手段要更为有效。由于国外的IT行业要比国内发达,国外的研究者在进行网络信息计量研究时,具有更好的支撑环境,不仅数据来源丰富,可利用的计算机辅助软件也更为优秀。以网络数据的收集为例,不仅SCI等传统数据库来自国外,而且主流的搜索引擎也是国外开发的。此外,由于计算机水平较好、经费充足,很多国外学者在研究中可以采用自己编制的软件。例如,2001年,Alastair GSmith和Mike Thewall[140]在研究中就采用了自己设计的爬行器来收集数据。与国外相比,国内研究者“条件”就简陋得多。以搜索引擎为例,目前基本上采用的都是国外的英文搜索引擎,这是由中文搜索引擎功能单一、性能不高、不适合于研究数据收集的现实情况决定的。此外,由于知识产权、交流语言等不利因素的限制,国外的联网数据库很难为国内的研究者使用。虽然近年来引进了不少数据库产品,但数据质量不高、检索不便、引进周期过长、成本过大等问题都对国内的研究造成了很大的障碍。事实上,这些问题并不仅仅限于网络信息计量学研究领域,而是广泛存在于在我国的科学研究工作中。因此,开发出自主知识产权的数据库和软件工具已成为迫切的需求。

总之,国外与国内的网络信息计量研究有很多不同之处,与国外相比,国内的研究工作面临着更多的困难。这要求我们在开展研究时,一方面要借鉴国外先进的研究成果,但必须从国内的实际情况出发,因地制宜地制定研究方案,而不能生搬硬套。另一方面,要扩展自己的视野,不断补充知识营养,加强学科之间的交流,从而将网络信息计量学研究推向更广阔的领域和更深入的层次。

最后需要说明的是,随着近年来国际学术交流的日益频繁,国内外的研究者通过学术会议、期刊、网络等多种渠道不断进行交流,两者之间的差异性正在缩小。例如,近几年国内的实证研究明显增多,而国外的学者也开始重视学科理论的研究工作。我们相信,只要国内外研究者不断互通有无、取长补短,网络信息计量学将得到更快更好的发展。

【参考文献】

[1]张洋,邱均平.网络信息计量学的兴起及其哲学思考.情报杂志,2005 24(1):2~5

[2]Egghe L.Discussion on Informetrics of The Internet.The Second International Symposium on Quantitative Evaluation of Research performance,Shanghai,China,Oct23,2000

[3]邱均平,张洋.网络信息计量学综述.高校图书馆工作,2005(1):1~12

[4]Woodruff A,Aoki PM,Brewer E,Hauthier P,Rowe LA.An investigation of documents fromtheWorld Wide Web.Fifth International World Wide Web Conference,Paris,France,May 6-10,1996

[5]Bray T.Measuring the Web.Fifth InternationalWorld Wide Web Conference,Paris,France,May 6-10,1996

[6]Larson RR.Bibliometrics of theWorld WideWeb:an Exploratory Analysis of the IntellectualStructure of Cyberspace.In:Steve Hardin eds.,Proceedings of the American Society for Information Science(ASIS)59th Annual Meeting,Oct21-24,1996,Baltimore,MD,Medford,NJ:Information Today Inc.for ASIS,pp.71-78,1996

[7]Almind T C,Ingwersen P.Informetrics Analyses on the World WideWeb:Methodological Approaches to“Webometrics”.Journal of Documentation,1997 53(4):404-426

[8]Rousseau R.Sitations:an exploratory study.Cybermetrics:International Journal of Scientometrics,Informetrics and Bibliometrics,1997(1)

[9]Boundaries AM,Sigrist B,Alevizos P D.Webometrics and the Self-Organization of the European Information Society.Draft report on task 2.1 of the SOEIS project,Rome meeting,June 17-19,1999

[10]网址:http://www.cindoc.csic.es/cybermetrics/.

[11]Bj9rneborn L,Ingwersen P.Toward a Basic Framework forWebometrics.Journal of the American Society for Information Science and Technology,2004 55(14):1216-1227

[12]同[6]

[13]徐久龄,刘春茂,刘亚轩.网络计量学的研究.见:张力治主编.情报学进展(第三卷).北京:航空工业出版社,1999

[14]邱均平.信息计量学(一).信息计量学的兴起和发展.情

报理论与实践,2000(1):75~80

[15]同[7]

[16]同[9]

[17]李长忠.网络计量学理论与实证研究.图书情报工作,2001(10):21~23

[18]赵启民.网络计量学研究的构建和发展方向.吉林师范大学学报(自然科学版),2003(2):52~54

[19]同[13]

[20]李长忠,李东洋,齐源.网络计量学的研究对象与方法.情报科学,2002(1):66~67,73

[21]夏旭,李健康,葛驰.网络计量学研究:现状、问题与发展.图书馆论坛,2001(12):44~47

[22]Bj9rneborn L.Small-World Link Structures across an Academic Web Space:ALibrary and Information Science Approach.Ph.D. thesis fromthe Department of Information Studies,RoyalSchool of Library and Information Science,Denmark,2004

[23]ThelwallM,Vaughan L,Bj9rneborn L.Webometrics.Annual Review of Information Science and Technology,2005 39:81-135.by the American Society for Information Science and Technology.Information Today Inc.p.82

[24]同[14]

[25]徐久龄,许莲莲.网络计量学.情报科学,2002(1):62~65

[26]同[18]

[27]同[13]

[28]金岩.网络信息计量学方法研究.图书情报工作,2001(2):29~31

[29]同[17]

[30]同[20]

[31]牟华,周秀霞.网络信息计量学概论及应用探讨.情报资料工作,2002(6):22~24

[32]蔡明月.资讯计量学与网路计量学.新世纪图书馆,2003(2)

[33]陶德麟,黎德扬主编.马克思主义哲学原理(修订版).武汉:武汉大学出版社,1999:138

[34]网址:http://www.db.dk/

[35]同[7]

[36]Wormell I.Informetrics:an emerging subdiscipline in information science.Asian Libraries,1998 7(10):257-268

[37]Ingwersen P.The Calculation ofWeb Impact Factors.Journal of Documentation,1998,54(2):236-243

[38]Bj9rneborn L,Ingwersen P.Perspective of webometrics.Scientometrics,2001,50(1):78-79

[39]同[11]

[40]Huberman B A,Adamic L A.Growth dynamics of the World-WideWeb.Nature,Vol.401,Sep.9,1999,131

[41]Adamic L A,Huberman BA.Power-Law distribution of theWorld WideWeb.Science,Vol.287,Mar.24,2000,2115a

[42]Nielsen J.Zipf curves and website popularity.Jakob Nielsen’s Website,April 15,1997.available at:http://www.useit.com/alertbox/zipf.html. (accessed 19 Jan 2006)

[43]同[8]

[44]Albert R,Jeong H,Barab︶si A L.Diameter of the World Wide Web.Nature,Vol.401,Sep.9,1999,130-131

[45]Pennock D,Flake GW,Lawrence S,Glover E J,Giles C L. Winners don'ttake all:characterizing the competition for links on the Web.Proceedings of the National Academy of Sciences,Vol.99,No.8,2002,5207-5211

[46]ThelwallM,Wilkinson D.Three target document rangemetrics for universityWeb sites.Journal of the American Society for Information Science and Technology,Vol.54,No.6,2003,489-496

[47]候经川,赵蓉英.网络信息的增长机制研究.情报学报,

2003(3):267~272

[48]邱均平,殷之明.网络文献内容增长规律的实证研究.中国图书馆学报,2005(1):15~20

[49]王宏鑫,邱均平.关于网络信息老化研究的若干问题.情报理论与实践,2004 27(4):433~435

[50]段宇峰.网络信息资源老化规律研究.图书情报知识,2005(4):28~31

[51]同[32]

[52]马费成,裴雷.网络信息资源的分布规律.情报科学,2003 21(11):1121~1123,1169

[53]邱均平.文献计量学.北京:科学技术文献出版社,1988: 19

[54]邱均平.文献计量学.北京:科学技术文献出版社,1988: 188

[55]同[52]

[56]同[32]

[57]Smith A G,Thelwall M.Web impact factors and university research links.In:Proceedings of the 8th International Conference on Scientometrics and Informetrics,Sydney,Australia,Jul16-21,2001,657-664

[58]Bar-Ilan J..Search engine results over time-A case study on Search Engine Stability.Cybermetrics:International Journal of Scientometrics,Informetrics and Bibliometrics,1998 2/3(1)

[59]Rousseau R.Daily time series of common single word searches in AltaVista and NorthernLight.Cybermetrics:International Journal of Scientometrics,Informetrics and Bibliometrics,1998 2(1)

[60]Clark S.J.,Willett P..Estimate the Recall Performance ofWeb Search Engines.Aslib Proceedings,1997,149:184-189

[61]Wouters P,Gerbec D.Interactive internet?Studying mediated interaction with publicly available search engines.Journal of Computer-Mediated Communication,2003 8(4)

[62]Snyder H.,RosenbaumH.Can search engines be used as tools for web-link analysis?A critical view.Journal of Documentation,1999 55(4):375-384

[63]Lawrence S,Giles CL.Searching theWorldWideWeb.Science,1998,280:98-100

[64]同[57]

[65]ThelwallM.Conceptualizing documentation on theWeb:An evaluation of different heuristic-based models for counting links between universityWeb sites.Journal of the American Society for Information Science and Technology,2002 53(12):995-1005

[66]章琳,张保明.WWW检索工具的比较研究.情报学报,1998(4)

[67]任瑞娟,李洪建.中文WWW搜索引擎比较研究.大学图书馆学报,1999(5)

[68]夏旭,方平.WWW网络生物医学信息资源搜索引擎的比较研究.医学信息,2001(1)

[69]叶中行,葛勇,叶蕾.因特网上的中文搜索引擎的评述.科学,2001(3).available at:http://www.kexuemag.com/artdetail.asp?name=236. (accessed 11 Dec.2005)

[70]Qiu J P,Chen J Q.An analysis of backlink counts and Web impact factors for Chinese university Websites.In:Proceedings of the 9th International Conference on Scientometrics and Informetrics,Beijing,China,Sep28-Oct02,2003,221-229

[71]吕俊生,杨金凤.用于链接关系检索的搜索引擎的比较研究.情报杂志,2005(2):98~100

[72]McKiernan G.CitedSites(sm):Citation indexing of web resources.available at:http://www.public.iastate.edu/~CYBERSTACKS/Cited.htm. (accessed 9 April 2005)

[73]同[8]

[74]同[8]

[75]同[42]

[76]Nielsen J.Do Websites Have Increasing Returns?.Jakob Nielsen's Website.available at:http://www.useit.com/alertbox/9704b.html. (accessed 11 Jan 2006)

[77]同[6]

[78]同[37]

[79]Smith AG.A tale of two web spaces:Comparing sites using web impact factors.Journal of Documentation,1999,55(5):577-592

[80]Smith A G.ANZACWebometrics:Exploring Australasian Web Structures.In:Proceedings of the Ninth Australasian Information Online&On Disc Conference and Exhibition,Sydney,Australia,Jan19-21,1999

[81]Thelwall M.A comparison of sources of links for academic Web Impact Factor calculations.Journal of Documentation,2002 58(1),60-72

[82]Smith AG.Classifying links for substantiveWeb Impact Factors. In:Proceedings of the 9th InternationalConference on Scientometrics and Informetrics,Beijing,China,Sep28-Oct02,2003,305-311

[83]Carrière J,Kazman R.WebQuery:Searching and Visualizing the Web through Connectivity.available at:http://www.cgl.uwaterloo.ca/Projects/Vanish/wEbquery-1.html. (accessed 4 April 2005)

[84]Ding Y,Chowdhury GG,Foo S,Qian W,Bibliometric Information Retrieval System(BIRS):AWeb Search Interface Utilizing Bibliometric Research Results.Journal of the American society for information science,2000 51(13):1190-1204

[85]网址:http://citeseer.ist.psu.edu

[86]网址:http://www.alexa.com

[87]网址:http://journals.ecs.soton.ac.uk/

[88]网址:http://www.thomson.com

[89]网址:http://www.scientific.thomson.com

[90]网址:http://www.nec-labs.com/

[91]吴华香,钟少丹.链接分析法——网络计量学方法初探.情报科学,2002(1):71~73

[92]邱均平,黄晓斌.WWW网页的链接分析及其意义.中国图书馆学报,2002(6):44~47

[93]俞培果,邱均平.Web页面链接动机分析及链接测度研究.情报科学,2003(3):320~323

[94]沙勇忠,牛春华.中国信息化优秀企业网站链接分析与网络影响因子测度.兰州大学学报(社会科学版),2004 32(5):99~107

[95]王宏鑫.我国省级以上公共图书馆网站的链接分析.中国图书馆学报,2005(3):86~89,97

[96]段宇峰,邱均平.基于链接分析的网站评价研究.中国图书馆学报,2005(4):19~23,41

[97]段宇峰,邱均平.中美大学网站评价的比较研究.中国图书馆学报,2005(5):22~28

[98]赵蓉英,段宇峰,邱均平.网络信息计量学研究(I)——网络链接研究的现状及趋势.情报学报,2005 24(2):181~192

[99]邱均平,段宇峰,赵蓉英.网络信息计量学研究(II)——网络链接分析方法的探讨.情报学报,2005 24(3):286~293

[100]邱均平,段宇峰.网络信息计量学研究(III)——大学网站链接特征指标的计量分布规律.情报学报,2005 24(4): 408~413

[101]段宇峰,赵蓉英,邱均平.网络信息计量学研究(IV)——网络链接特征的分层研究.情报学报,2005 24(5):573~584

[102]段宇峰,邱均平.网络信息计量学研究(V)——链接分析在大学评价中的应用研究.情报学报,2005 24(6):735~741

[103]段宇峰.网站特征的定量研究(一)——对大学网站链接特征的探讨.情报理论与实践,2005 28(1):82~81

[104]段宇峰.网站特征的定量研究(II)——大学网站影响力探讨.情报理论与实践,2005 28(2):191~194,175

[105]网址:http://www.scit.wlv.ac.uk/

[106]GoodrumAA,McCain KW,Lawrence S,Giles C L.Scholarly publishing in the Internet age:A citation analysis of computer science literature.Information Processing&Management,2001 37(5),661-676

[107]同[79]

[108]Thelwall M.Exploring the link structure of theWeb with network diagrams.Journal of Information Science,2001 27(6)393-402

[109]Leydesdorff L,Curran M.Mapping university-industry-government relations on the Internet:The construction of indicators for a knowledge-based economy,Cybermetrics:International Journal ofScientometrics,Informetrics and Bibliometrics,2000 4(1)

[110]ThelwallM,HarriesG.The connection between the research of a university and counts of links to itsWeb pages:An investigation based upon a classification of the relationships of pages to the research of the host university.Journal of the American Society for Information Science and Technology,2003 54(7),594-602

[111]Smith AG,ThelwallM.Web impact factors for Australasian universities.Scientometrics,2002 54(3),363-380

[112]Thomas O,Willett P.Webometric analysis of departments of librarianship and information science.Journal of Information Science,2000 26(6),421-428

[113]Soualmia L F,Darmoni,S J,Le Duff F,Douyère M,Thelwall M.Web impact factor:A bibliometric criterion applied to medical informatics societies’Web sites.In Proceedings ofMIE2002

[114]ThelwallM.CommercialWeb site links.InternetResearch,2001 11(2),114-124

[115]Lei C.Rating health web sites using the principles of citation analysis:a bibliometric approach.Journal of Medical Internet Research,Vol.1,Issue 1,No.e4

[116]Vaughan L,Hysen K.Realationship between links to journal web sites and impact factors.Aslib Proceedings,2002 54(6): 356-361.Journal of Medical Internet Research,Vol.1,Issue 1,No.e4

[117]夏旭,李健康,葛驰.网络计量学在医学图书馆的应用探讨.图书情报,2001(12):865~866

[118]邹菲.试论网络信息计量学在数字图书馆中的应用.图书情报知识,2001(3):16~17,20

[119]牟华,周秀霞.网络信息计量学概论及应用探讨.情报资料工作,2002(6):22~24

[120]吴华香,钟少丹.网络计量学的应用分析.图书情报工作,2003(8):43~45

[121]刘远翔,陈玲庆,罗菊花,吴翠红.网络信息计量学在数字图书馆建设中的应用.情报杂志,2003(11):20~21

[122]吴华香,钟少丹.我国图书馆学专家的网络测评与分析.图书情报工作,2002(3):52~55

[123]张玢,许培扬.互联网医学信息资源评价现状.医学情报工作,2002(6):333~336

[124]张敏勤.关于建立“核心论文”学术评定制度的理论思考.情报资料工作,2003(1):48~49

[125]刘雷鸣,王艳.关于网站评估模式的比较研究.情报学报,2004 23(2):198~203

[126]邱均平,陈敬全.网络信息计量学及其应用研究.情报理论与实践,2001(3):161~163

[127]邓湘琳.网络信息计量学在互联网上的应用研究.科技情报开发与工作,2002(4):111~112

[128]同[25]

[129]金岩.网络信息计量学方法研究.图书情报工作,2001(2):29~31.

[130]姜春林,鞠树成.略论网络信息计量学及其对科学计量学的影响.情报杂志,2004(1):21~22,25

[131]郑家杰.网络计量学研究的应用与发展.情报探索,2005(4):8~11

[132]同[98]

[133]杨涛.中国50所大学网站的网络影响因子比较分析.图书情报工作,2005(6):47~54

[134]同[80]

[135]邱均平,陈敬全,段宇峰.中国大学网站链接分析及网络影响因子探讨.中国软科学,2003(6):151~155

[136]同[11]

[137]同[14]

[138]Egghe L.Fractal and Informetric Aspects of Hypertext Systems. Scientometrics,1997 40(3):455~464

[139]同[22]

[140]同[57]

【作者简介】

img8

邱均平:男,1947年出生,教授,博士生导师,武汉大学中国科学评价研究中心主任,《图书情报知识》副主编。

张洋:男,1975年出生,中山大学资讯管理系讲师、博士。

马瑞敏:男,1980年出生,武汉大学信息管理学院情报学专业博士生。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈