首页 理论教育 热点与进展分析

热点与进展分析

时间:2023-03-04 理论教育 版权反馈
【摘要】:共词网络分析与知识图谱绘制[1]是情报学研究的重要手段,可以帮助理解科学领域的知识网络[2]。本文采取这一较为成熟的研究方法,力图厘清信息政策法规领域研究的现状和发展脉络。这些关键词虽然也表明文献的特征,但由于对分析文献具体的研究领域和内容指向性不强,因此删除。

我国信息政策法规研究现状、热点与进展分析[1]

马费成1 李小宇2

(1.武汉大学信息资源研究中心 2.武汉大学信息管理学院)

【摘 要】 本文以近30年来我国信息政策法规领域学术文献为对象,在关键词共词网络的基础上,综合采用文献计量、内容分析和知识图谱绘制的方法,统计了文献的时空分布、著者发文、合著情况,发现了本领域的13个具体研究热点、3个研究范式和3个主要的研究层面。通过对不同年代文献关键词的因子分析和最近5年的关键词突现率的统计,挖掘出我国信息政策法规研究的发展脉络和学科前沿。

【关键词】 信息政策 信息法规 知识图谱绘制 共词分析

The Status,Focuses,and Progress of Information Policy and Law Research in China

Ma Feicheng1 Li Xiaoyu2

(1.Center for the Studies of Information Resources at Wuhan University, 2.School of Information Management at Wuhan University)

【Abstract】 Using the bibliometric analysis,content analysis and knowledge domain mapping comprehensively,this paper analyses the temporal and spatial distribution of literatures and reveal the publishing and co-authorship status of authors with Chinese information policy and law research literatures in the recent30 years as its object and the co-word network of keywords as its foundation.This paper finds 13 specific focuses,3 research paradigms and 3 cardinal research levels in this domain.And through the analysis of keywords factors in different years and the statistics of the burst ratio of keywords in the recent 5 years,this paper explores the development and frontiers of the information policy and law research in China.

【Keywords】 information policy information law mapping knowledge domains co-word analysis

信息政策和信息法规建设是我国社会信息化重要组成部分,也是信息科学研究的重要领域。自改革开放以来的30年间,信息政策与法规的研究受到了来自情报学、法学、政治与公共管理以及经济学等诸多学科的关注。尤其是随着网络时代的到来,信息技术突飞猛进,与社会信息资源相关的各种信息活动越来越需要信息政策法规的监督规范,这也使相关领域的学术研究日益深入发展。为了准确把握信息政策法规研究的现实状况,本文基于对研究文献的关键词分析,回顾了改革开放30年来的信息政策法规研究历程和发展思路,对当前研究的热点和走势做了较为系统的探讨。

1 研究方法与数据来源

1.1 研究方法与思路

回顾以往的信息政策法规领域的综述性研究,不难发现研究人员很早便注重对本领域科研文献的定量分析,采用文献计量和统计学的方法对信息政策和法规的研究加以述评。这些研究虽然便于读者理解本领域研究的基本情况,但却不能很好地揭示信息政策法规研究的关注点,也不能发掘政策法规内容的发展脉络。本文以文献的关键词为主要研究对象,将基于关键词共词关系构成的类团视为知识单元,综合采用文献计量、共词网络分析、因子分析、知识图谱绘制和关键词特征挖掘的方法,利用SPSS、MATLAB、NETDRAW、MVSP等统计和可视化工具,分析关键词间的相关度,对本领域的研究发展和当前热点做出总结。共词网络分析与知识图谱绘制[1]是情报学研究的重要手段,可以帮助理解科学领域的知识网络[2]。其基于文献特征挖掘知识单元特征的方法,不断在各个学科领域获得应用,并得到广泛认可。本文采取这一较为成熟的研究方法,力图厘清信息政策法规领域研究的现状和发展脉络。

1.2 数据来源

笔者于2009年11月30日,从中国知网(CNKI)的中国期刊全文数据库、中国博士学位论文全文数据库和中国优秀硕士学位论文全文数据库中,以信息政策、信息法律、信息立法、信息法学、信息法、情报政策、信息法制、信息法规、情报立法、情报法律、情报法作为主题词,选择1979—2009年作为时间区间,精确检索得到各类学术论文1719篇。经过人工剔除不相关和重复的文献,共保留1654篇文献作为研究对象,其中博士论文9篇,硕士论文129篇,期刊论文1516篇。由于有些文献没有关键词,笔者针对这些文献在维普期刊数据库和万方数据库做了查询补充,有一些文献的关键词是数据库提供方根据内容分析算法提取补充的,本文对这些关键词也做了保留。但由于仍有一部分文献的关键词缺失,比如1980—1989年的81篇文献只有5篇文献有关键词,最终有完整关键词的文献共有1347篇,关键词2192个。

1.3 数据处理

文献中的关键词主要由文献作者添加,这些关键词一方面依赖于学科领域的内容,另一方面联系着文章的写作主题。但文献作者依据主观判断提供的关键词属于非受控词汇,有些关键词采取不同的词汇表达同样的意思,有些则较为琐碎,对研究主题的指向性不强,这就需要对关键词加以处理,来满足研究的需要。

由于本文研究基于关键词群体中的高频词汇,笔者特别针对高频词的特征做了如下处理:

(1)去除泛指关键词,包括“对策”、“发展”、“现状”、“发展战略”、“问题”、“发展趋势”、“影响”、“管理”等。这些关键词虽然也表明文献的特征,但由于对分析文献具体的研究领域和内容指向性不强,因此删除。

(2)去除上位词汇,如“信息政策”、“信息”等,这些词汇代表的是整个研究领域,过于宽泛,也失去了对具体研究领域的指向性,对研究帮助不大,反而可能有干扰作用,因此也删除。

(3)合并同义关键词,用指向性强的词代替指向性弱的词。比如将“互联网”和“因特网”合并为“网络”,用“信息立法”代替“立法”等。

(4)删除表征方法研究的词。比如“政策研究”、“比较研究”、“理论研究”、“对策研究”等。这些词汇是理解信息政策法规研究方法的重要提示,但由于可能泛指多个研究领域,不利于研究热点的分析,因此也予以剔除。

需要说明的是,以上数据处理,是针对于全体关键词中的高频词汇统计结果中暴露出的问题词汇而做的。由于数据量繁多,不可能对每一个词汇尤其是大量的低频词汇做上述处理。实际上这些低频词汇的存在并不影响分析的结果。

2 研究现状总体分析

2.1 研究论文的时间分布

笔者搜集到的文献最早追溯到1980年第2期《技术与市场》杂志刊登的约翰·格雷著、黄仲平译的《英国的国家科技情报政策》。可见自1978年中国科技情报学会成立,武汉大学首先在国内设立了科技情报专业,情报学教育和研究得以恢复以来,国内学者很快就以科技情报为对象,以译介著作为手段探讨国家情报政策工作。从1980年的5篇文献到2008年的142篇文献,我国信息政策法规领域的论文发布数量经历了波动的上升过程,如图1所示。在进入20世纪90年代后,尤其是1994年开始,信息政策法规研究论文的数量和增长速度有了明显提高。利用SPSS软件回归分析,对30年来本领域文献累积数量做出拟合,其增长态势较好地符合逻辑曲线的描述,拟合的逻辑曲线方程为Y=1/(1/3000+0.832* 0.90X),该曲线R方检验拟合度为0.963,P值<0.01,说明拟合程度较好,如图2所示。

img1

图1 研究文献的年发文量

img2

图2 研究文献累积数量态势与逻辑曲线拟合

2.2 研究论文的期刊分布

笔者搜集到的全部1516篇期刊论文,分布在544种期刊中,平均每种期刊载文2.8篇。绝大部分高载文量期刊均为情报学期刊。载文量在10篇以上的26种期刊如表1所示。将全部期刊分成载文量相等的三部分,每部分大致为505篇,所得三部分期刊数量分别为12种、92种和440种,比例约为1∶7.7∶36.7,可近似看做公比为6的等比数列,接近布拉德福最初定量所描述的润滑领域中的期刊分布。

表1      载文量大于10篇的期刊排序

img3

2.3 研究论文的作者分布

在全部1654篇文献中,有作者标注的共1641篇,作者为1736人,平均每篇论文有作者1.06人,有合著文献413篇,全体文献的合著率[3]约为25%,这并不是一个很高的合著率,说明信息政策法规研究领域的合著水平并不高。发表该领域论文5篇以上的高产作者排序如表2所示。

表2      发文量大于5篇作者排序

img4

从表中可以发现,马海群、梁俊兰和马费成三位作者在发文数量上位于本领域研究的核心位置。其中黑龙江大学的马海群教授发表的本领域研究论文数量最多,大于第二位梁俊兰研究员和第三位马费成教授发文量的总和。为了更好地发现本领域研究学者的合作情况,笔者统计了作者合著情况。在全部作者群体中有779位作者参与了合著,共出现941人次。在合著作者群体中,出现次数排名前5位的作者如表3所示。

表3      合著次数前5位作者排序

img5

社会网络分析是研究作者合著关系较为成熟的方法[4]。图3是所有合著作者构成的合著关系网络,图中节点即为作者,节点间的有向联系表明作者合作关系,边越粗表明合著作者共同出品的文献越多,边的箭头指向第一作者。节点大小以入度为标准,节点越大表明其他节点指向该节点的关系越多,即以第一作者身份出现的概率越大。此处之所以说概率是因为有些作者(如“何建邦”、“柯正谊”、“吴平生”、“陈常松”、“黄裕霞”等)仅在同一篇文献[5]里共同出现过一次,而由于该文的作者多达11人,程序将每个处于后序位的作者指向前序位的作者,因此这些作者的入度就较高。而这种现象的出现也说明本领域研究学者群体发展并不稳定,合作发文量较少。这一点从图4可以清楚地看到。图4是全部作者合著关系中去除悬挂节点的K核图。从图中的簇团分类显示可发现,信息政策法规领域的作者合著网络连通性不强,基本分成了数个合著团体。最大的合著网络团体由11位作者构成,但总体来看,本领域的研究学者比较分散,孤立团体很多,并不构成复杂的合著网络。

img6

图3 全部作者合著关系

img7

图4 去掉悬挂节点的K核图

3 基于共词分析的研究热点分析

3.1 共词网络初步分析

文献关键词是作者对论著内容的概括,涵盖了研究课题、特定对象、研究方法、主要结论等信息。关键词中的高频词汇是在一定时期内,某学科研究人员大量应用的词汇,表征了该研究领域的研究重心,也是学科知识单元的基本单位。关键词在同篇文献中的共现关系是基于研究者对本领域的认识判断建构的知识单元之间的联系。由这些共现关系构建的共词网络可用以发现学科知识结构和研究热点[6]。在对搜集的2192个关键词做词频排序的基础上,综合考量关键词的数量、意义和统计软件的数据处理能力,笔者以词频大于8次的前68个关键词作为高频词,用以表征我国信息政策法规研究的热点。图5是截取的高频词汇通过自编程序构成的共词关系矩阵,其中对角线上的数值为对应关键词的词频。

img8

图5 高频关键词68*68共词矩阵(部分)

图6是通过共词关系得到的高频关键词的共词网络主成分布局图。图中节点为关键词,节点大小取决于与该节点相连的关系数量即节点的度,节点间的无向边表示共词关系,共现次数越多,边就越粗。根据主成分布局图,可见共现度数最大的关键词是“信息立法”,独立作为一层。位列其后一层次的关键词大致分成两大类团:“信息法”和“信息法律”构成的信息法研究类团以及“信息化”、“信息技术”、“信息资源”等词构成的信息科学研究类团。在这些高频关键词中由国家名构成的关键词依频次有“中国”、“美国”、“日本”和“俄罗斯”,借助自我中心网络分析,发现与美、日、俄三国相关的关键词有32个,接近高频词数目的一半,领域涉及信息法律伦理、信息资源管理、国家信息政策、信息产业、电子政务、网络信息、信息安全、知识产权、数字图书馆等重要领域,这说明我国信息政策法规研究领域中十分重视与其他国家的比较研究。实际上,由于高频词的共词网络连通性很强,NETDRAW工具认为这些词都可作为一种成分存在,这一方面说明信息政策法规领域的研究涉及面虽广,但很多信息领域都存在政策问题,所以研究有较强的共性;另一方面也说明需要有更加深入的方法来揭示当前信息政策法规的研究内容。

img9

图6 高频关键词共词网络主成分布局

3.2 基于因子分析的研究热点透视

因子分析是基于共词分析的动态科学图谱表示[7],其主要目的是描述隐藏在一组变量中更加基本的隐藏变量,它可以有效地为大量数据划分结构,揭示变量之间的隐藏关系,缩减变量数量[8]。因子分析是从共词相关性矩阵中得到,本文中笔者对68个高频关键词的共词矩阵做了斯皮尔曼(Spearman)相关系数处理,得到个体差异性小但总体结构不变的相关矩阵。利用SPSS工具采用主成分法(Principal Components),通过协方差矩阵(Covariance Matrix)与平均正交旋转方法(Equamax)完成操作[9],获得因子分析结果13个因子,并在此基础上人工命名加以区分,如表4所示。

表4      全体高频关键词13个因子

img10

从表4中可以发现,绝大多数关键词都划归的对应因子中,某因子的关键词是由因子载荷绝对值大于0.5的词汇构成,相同的因子中的关键词具有近似的领域意义,这是对基于共词关系构建的知识单元间的有效联系的较好印证。笔者主要根据每个因子中载荷系数绝对值大于0.7的词汇来为因子命名,尽量做到概括因子成分,同时具有较好专指度。比如第一个因子命名为“NIP(国家信息政策)比较研究”,主要依据“美国”、“日本”、“国家信息政策”等词的因子载荷系数较高。NIP是指在一国范围内国家和政府实施信息管理的指南,决定宏观信息管理的导向和行为准则[10]。而本因子中还有“电子政务”、“政府”等词说明本因子也针对社会宏观信息管理的层面。正如上文所述,学习评价和比较其他国家的信息政策法规建设是本学科的重要研究方法,涉及面也主要体现在宏观信息管理层面。因子2“政府信息公开”中,有较多的关键词也同时出现在因子7“信息权利”和因子11“个人信息保护”中,这说明这三个因子有较强的关联,事实上这些因子确实共同指明在当前信息社会建设过程中诸如知情权、隐私权等信息权利问题。因子3和因子4表征了信息政策法规研究中社会信息环境、信息资源获取等信息服务性质的课题。因子5和因子9是较为特殊的两个因子,笔者认为其反映了信息政策法规研究中的两个重要角度。因子5是从法学、伦理学、社会学等社会科学的角度,以信息为特殊对象的一类研究,主要表现为对信息立法问题的探讨。而因子9则主要表征了信息政策法规研究与情报科学之间的关系,是从情报科学和信息管理学的角度、来探讨社会信息资源管理的问题。因子6指明了信息政策法规研究的一个重要领域,也是当前研究较多的课题,即网络信息治理和网络信息安全的研究。因子8表明了本领域研究的发源——科技信息政策,正是从科技信息政策出发,我国学术界逐渐开始关注信息政策法规领域的研究,涉及这个课题的论文在20世纪80年代有较多的出现。因子10涉及的对象较广,体现在社会产业和市场的信息化、市场经济环境变化以及以互联网为代表的信息社会基础设施建设工作,这些是社会信息化建设的主要内容,是研究社会由工业时代向信息时代变迁的重要课题,因此将本因子命名为“社会信息化”。因子12是一类特殊的研究领域,它涉及企业、证券市场等经济金融领域的会计信息信用和会计信息法治问题,对这一类问题的研究集中在企业管理和经济管理等学科,是一类专指度、高粒度较细的领域。因子13涉及社会信息资源和网络信息资源配置问题,是借用经济学的概念、方法,分析社会信息政策的一类研究。

以上13个因子有效地表明了近30年来我国信息政策法规领域的研究热点,在这些因子中既有国家信息政策、社会信息化建设、信息资源配置等宏观政策研究,也有科技信息、网络信息、会计信息等微观政策研究。既有来自社会科学的法理探讨,也有来自信息管理、情报学领域的分析研究。应该说,信息政策法规研究领域涉及的层面很广泛,几乎社会信息活动相关的各个方面都有政策研究的空间,这也说明信息政策法规是各学科都应重视的研究领域。

3.3 基于聚类和多维尺度方法的研究内容分析

上述基于共词矩阵的相关矩阵得到的因子分析,可以缩减关键词数量,将关键词分类,得到关于研究热点的分布。为了更进一步的研究,需要在因子分析的基础上,对共词矩阵做更加抽象的划分和更加有效的可视化分析。笔者在此选择基于Ochiia系数距离相异矩阵的聚类分析和多维尺度分析[11],来进一步对我国信息政策领域的研究内容加以分析。

首先转换共词矩阵为距离相异矩阵,借助MATLAB工具,用Ochiia系数将共词矩阵转换成相关矩阵,其计算公式是:

img11

对角线上的数据表示某词自身的相关程度,经上式计算均为1。经过Ochiia系数换算得到的矩阵是相似性矩阵,用“1”与全部矩阵相减,得到表示两词间相异程度的相异矩阵。

在Ochiia系数相异矩阵的基础上,借助MVSP工具,选择运用Median方法,采用Baroni-Urbani Buser Coefficient距离进行聚类分析,得到聚类分析结果树状图,如图7所示。

img12

图7 高频关键词聚类视图

依据聚类结果加以人工分析,笔者将关键词群体分为八个大类,合并为三个研究范式。聚类得到的八个大类与因子分析得到的结果有交集也有差别。比如聚类分析的结果将因子分析中的“网络信息治理”部分与“信息服务信息资源管理”的内容合并,将因子分析中的“社会科学范式”部分分解成“信息立法法律”和“信息法理”两个部分。又根据聚类结果,这八个主要类别汇聚为三个大的部分,根据其中主要内容和差别,笔者将之命名为“信息研究范式”、“信息社会范式”和“信息管理范式”。

“信息研究范式”所涵盖的内容主要是从学术研究的角度,探讨当前信息科学、情报学以及其他社会科学学科中涌现的社会信息现象,涉及多种研究领域,但主要还是做学理探究。

“信息社会范式”则主要针对国家信息政策、宏观社会信息化、国家信息环境建设等社会信息活动的管理控制,是直接对社会信息政策的研究和建议。

“信息管理范式”包含了信息法研究和信息资源管理两方面,体现了当前信息政策法规在法律科学框架下的研究状况,以及当前信息管理研究中信息资源研究范式的广泛认同。该角度是从信息作为一种重要资源实现其优化配置、科学管理的角度出发来进行政策研究的。

聚类分析可以帮助人们从不同层次和更高抽象度来理解当前的研究状况,其层次化的可视效果也显得比因子分析更加直观、理想。但因子分析直接得到关键词类团,更加具有针对性和指向性。在本文中,因子分析得到的结果就细节而言也比聚类分析的效果要准确一些。因此这两种研究方法应该作为互相补充、相辅相成的手段在不同的研究层面得到应用。下面将引用另一种可视化的共词分析方法——多维尺度分析,来进一步揭示当前信息政策法规研究的热点分布状况。

多维尺度分析可以宏观全面地表现关键词之间的联系,揭示知识单元的分布结构[12]。这种分析同样要基于Ochiia距离相异矩阵,通过SPSS工具实现多维尺度,结果如图8所示。

从多维尺度分析的结果可以发现,关键词大致可以聚集为五个大类团,其中类团①主要涵盖了电子政务和国家信息政策等方面的关键词。与其紧密相连的是类团②,涵盖了信息市场、信息产业等社会信息化相关的关键词。而类团③涉及信息经济、WTO、网络信息等信息环境下的新兴研究领域,与之紧密相连的另一类团④涵盖了电子商务、知识经济以及信息政策、信息法规等指向性很广泛的高频词汇,表征了社会信息化过程中涌现的新经济现象的研究。类团⑤中汇集的关键词数量较多,主要包含信息权利、信息立法等与信息法相关的概念。在五个类团之外,信息化、网络信息资源、信息素养、会计信息和法律责任五个关键词没有被划归进临近的类团。

img13

图8 高频关键词多维尺度分析

这五个类团按照汇集的紧密程度可以大致划分为三个部分,在图8中笔者用粗虚线和罗马数字对这三个主要部分做了划分。经过分析不难发现这三个部分代表了信息政策法规研究中的三个重要层面。

层面Ⅰ:社会宏观信息政策研究。由类团①和类团②构成,从政策研究的角度,对国家信息政策、社会宏观信息化进程和社会信息活动中的政策问题加以分析。

层面Ⅱ:信息法律研究。主要由类团⑤构成,涉及信息伦理、信息权利等法理性问题,以信息现象为研究对象,探讨信息法律的立法、执行和监督等工作。

层面Ⅲ:微观信息现象研究。由类团③和类团④共同组成,这一层面涉及范围广泛,但往往以某一种信息现象为对象探讨信息政策的作用,主要针对网络信息环境、新兴经济现象等具体微观领域进行研究探讨。

从以上的聚类分析和多维尺度分析的结果可以发现,通过信息政策法规领域研究文献的高频关键词共词关系,不但可以得到基于因子分析的具体热点分布,也可以得到较宏观的结果,即从研究角度划分的三种研究范式和从研究对象划分的三种研究层面。

4 研究热点发展脉络和趋势分析

4.1 基于因子分析的研究热点发展脉络揭示

在上文中,在高频关键词共词矩阵的基础上,综合利用了因子分析、聚类分析和多维尺度分析的方法,揭示了信息政策法规研究领域中的研究热点和总体类型。这些研究是基于对1989—2009年的文献关键词全体而进行的,由于每年的发文量不同,全体关键词中的高频词分布必然会相对集中在发文量较多的近几年。为了更好地揭示本领域的科研状况和发展历程,笔者以5年为一个时间单位,将不同年代的高频关键词通过共词矩阵做了因子分析,力求发现不同时间段中,本领域研究的侧重点和发展脉络。因子分析的结果如表5所示。

表5      不同年代高频关键词因子分析结果

img14

续表

img15

在表5中,从1990—2009年,共分为每5年一组的四个时间段,按时间降序分别被分为17个、13个、8个和7个因子。由于1980—1989年81篇文献中只有5篇文献标注了关键词,笔者将这81篇文献的标题通过分词统计软件分词再按词频排序,人工分析词频大于2次的词,挑选其中的九个表示实际意义的词作为这十年的研究侧重点,如表5中最右边一列所示。笔者将这些可以作为研究侧重点标志的因子分析结果和关键词,按照对象的同一性划分为社会、政务、经济、网络、法律和其他六个大类,并将每个因子所表明的子类作为一行,使每一行的因子都指向相近的领域,这样每一行可以看作同一子类领域学科发展的线索。

社会类政策是涵盖了国家信息战略、社会信息化、社会信息资源配置以及社会信息环境建设等宏观尺度的信息政策。从表5中可以看出,关于国家信息政策的研究从20世纪80年代至今贯穿始终。这一类研究针对于国家政策层面,从政策目的、政策需求着手,特别注重通过体系结构的构建或通过与发达国家的比较,为我国的信息战略提供决策建议[13]。在社会类政策研究中,社会宏观信息化的政策问题最初是由情报学研究中的一个分支开始,基于情报科学的发展需要对社会情报活动、情报政策加以分析。在社会类政策中,关于信息污染、信息环境的政策研究集中出现于2000年之后,这是互联网的普及所带来的信息爆炸对信息环境治理的政策需求的体现。此外,关于信息资源的管理配置的政策研究,从20世纪90年代中后期发端之后,在最近几年的研究中独立成为一个研究热点,这是社会信息资源日益丰富对信息资源政策的必然要求,也是情报科学研究的资源管理范式愈发受到认可的表现[14]

政务类信息政策主要涵盖了政务信息公开和电子政务两个方面。这类政策研究单独作为一个研究热点也是从2000年之后开始的。在此之前的研究基本与社会信息化的内容作为同一个因子,这也说明近年来政务信息化的政策研究随着社会的发展更多地涌现出来。在最近的研究中,政务信息公开与公民知情权的概念紧密联系,成为当前信息公开政策法律领域研究的重点。而环境信息公开,是最近几年出现的关于环境保护信息和公民环境知情权的研究。

经济类政策涉及信息产业、信息市场、商业信息等与国民经济相关的信息政策研究。从其发展脉络看,这类研究的重心从产业和市场信息化逐渐转向更加成型的信息产业和信息市场,这一转变与我国信息化建设历程和信息产业的逐渐成熟密切相关。另一个研究变化是近几年的研究领域明显比之前的领域更广,研究的问题也从宏观的产业政策向某领域的独特微观表现转移,比如竞争情报、会计信息等,这使政策研究更加具有针对性和现实基础。

网络类政策是比较庞大的一类信息政策研究领域。在互联网普及之前,我国曾有情报机构和情报机构系统的政策研究,如图书馆、档案馆、情报研究中心等。笔者将这些视为网络出现之前的情报资源集散地,与网络在一定程度上有功能相似之处,因此划为一类。从中可以明显看到,我国的网络信息建设,先从信息机构中的信息资源建设开始,重心在经过网络基础设施建设的时期后,转向网络信息资源建设和管理上。在这一类政策中,研究方面最完备的时期是2000—2004年,内容涵盖了信息活动、信息安全、信息服务和信息资源建设等诸多方面,而这段时间正是我国互联网发展最迅猛的一段时间。近几年数字信息资源方面的政策研究主要集中于数字图书馆、网络信息资源等领域,这其中知识产权和著作权等方面的政策环境和需求,是当前研究的一大热点。

法律类的信息政策法规研究从20世纪80年代就开始了[15],但直到21世纪初才发展为独立的研究热点领域。从这个领域的因子分析结果看,信息法律研究包含了信息法、信息立法、信息伦理、信息权利、隐私权、个人信息保护和知识产权等方面。而这些关乎立法的信息权利探讨,集中出现于近十年。尤其是近五年中,关于隐私权、网络个人信息保护的探讨逐渐增多,这说明信息政策法规逐渐关乎信息用户的切身权益,也是我国互联网发展中出现的侵犯个人隐私现象的回应。

除了以上介绍的几个大类之外,还有信息素养和科技信息政策构成的两个小类。信息素养关系国家信息能力和公民信息能力两个层面[16]。涉及信息素质、信息能力、信息意识、信息道德等多方面,以及公共信息资源建设、信息教育等多个研究对象。从表5可以看到,20世纪80年代我国学者就注意到情报意识的问题,并将其作为提高情报工作水平的动力[17]。而20世纪80年代到90年代前期,情报政策研究的一个重要领域——科技情报政策,实际上也是我国信息政策研究的发端。科技政策的制定与科技的发展紧密相关[18],我国在恢复情报学研究的最初时期,急需获得国外的科学技术发展信息,在研究国外科技情报的同时,我国研究者发现发达国家情报政策不仅仅涉及科技研究领域,已经很大程度上涵盖了社会生活的方方面面,逐渐构成完整的国家情报体系方略,因此从科技情报政策的研究出发,我国学者也开始关注社会信息化多方面的政策需求。到90年代中后期,科技信息政策就不再构成独立的研究热点,这说明学者的研究方向已经转移到其他方面。

通过以上分析可以发现,改革开放30年来,我国信息政策法规研究经历了从情报研究向信息研究、从专业研究向社会研究、从宏观研究向微观研究、从单一学科领域研究向跨学科多领域研究,从以信息活动为中心向以信息资源和人为中心的演变过程。

4.2 基于战略坐标图的研究热点发展状况分析

战略坐标图是用来描绘研究主题发展状况,揭示各个主题在某研究领域中所处的位置以及自身的发展程度,直观表示研究领域内部联系情况和领域间相互影响情况的一种知识图谱绘制方法[19]。本文采用这种方法对本领域各研究热点的发展状况和地位加以探讨。

战略坐标图在因子分析的基础上,用直观的形式表示因子内部联系和不同因子之间的相互联系强弱程度。它是以向心度和密度为参数绘制成的二维坐标,其中,横坐标为向心度,纵坐标为密度。向心度被用于衡量一个因子和其他因子之间相互联系的程度。向心度越大,即一个因子和其他因子之间联系越紧密,则该因子在此学科中就越趋于中心位置。密度被用于衡量因子内部联系的强度,密度越大说明这个研究热点关注的内容彼此相关程度越大,即该因子的所代表的研究就越成熟、越稳定。通过这样的转换,每一个因子就可以由一个向量(向心度、密度)在二维平面直角坐标系中得到表示。该坐标系中,分别以因子向心度和密度的平均值作为坐标原点横纵坐标。因子依据各自的(向心度、密度)值被划分进入不同象限。不同象限代表学科中各研究主题的发展位置,如图9所示。分布在第一象限的因子,向心度和密度都比较高,说明其与其他因子的联系和自身内部的联系都较高,因此处于研究学科的核心位置,且研究程度较成熟。而第二象限中的因子由于向心度较低而密度保持高水平,因此是在总体领域中研究较多但却比较边缘的主题。第三象限中的因子向心度、密度都较低,是有待发展的不成熟且边缘的主题。第四象限的因子表示处于学科的中心地带,但还未发展成熟的因子,是研究中即将成为核心的非成熟研究领域。

img16

图9 战略坐标图各象限含义

计算因子向心度和密度的方式有多种,本文中采用各因子中关键词与其他因子关键词共现次数之和作为因子的向心度,以某因子内部关键词之间的共现次数的平均值作为密度[20]。由于每5年一个时间段的划分方法使时间段的关键词数量差异较大且不易直观表示,因此,本文将全部关键词以十年为一个单位,划分为2000—2009年和1990—1999年两个部分。对这两个时间段的因子分析和向心度、密度计算结果如表6所示。

表6      两个十年高频关键词因子与战略坐标分析结果

img17

结合因子分析和战略坐标计算的结果,将两个十年的因子统一在一个坐标系中,可得到图10的结果。在图10中,圆形坐标点是2000—2009年的因子,其阿拉伯数字标志与表6中具体因子序号对应。菱形坐标点表示1990—1999年的因子,其小写英文字母标志代表在表6中的具体序号。这样就直观地显示了每一个时间段内因子的发展状况。由于关键词数量不同,两个时间段因子彼此之间在坐标图上并没有比较的意义,但借助上一节因子发展脉络的揭示,将有意义继承的因子之间用有向箭头连接,可以发现两个十年的因子在发展位置上的变化。由图中可见,大部分因子分布在第一象限和第三象限。与国家信息政策(因子b)从第三象限跃升至第一象限(因子1)成为向心度和密度都最大的研究主题,是本领域中研究的核心。信息权利与信息规范(因子h)原本是属于研究较多但比较边缘的主题,随着时间的发展,信息公开与信息权利(因子2)逐渐成为本领域研究的热门,跃迁至第一象限。信息基础设施(因子e)与网络及信息环境治理(因子i)中的一部分共同发展为社会信息环境(因子6),前两者分别出现在第四象限和第三象限,也是从发展不成熟的阶段向成熟阶段和中心位置跃升。而最初位于第一象限的新兴经济产业政策(因子g)则指向了位于第三象限的新兴知识经济(因子10),这主要是因为因子g中的研究内容主要是信息产业和信息经济,而最近十年知识经济与知识资源作为新的研究对象加入到这个领域,使因子10成为有待深入的研究课题。信息资源管理(因子c)分化为信息资源配置(因子8)和数字信息资源建设(因子5),信息资源配置政策研究作为信息资源管理研究的继承发展,仍然处于第二象限,而数字信息资源在当前的讨论中十分热门,正处于第四象限和第三象限的交界处,是正在分化运动的热点。此外,信息污染和网络信息治理是信息政策法规日益重要的研究领域,但从战略坐标图的结果看,网络信息治理(因子i、因子3)的政策研究一直处于第三象限,说明其研究还不够成熟深入,可见这一主题需要得到研究人员更多的重视。

img18

图10 两个十年因子战略坐标变迁

4.3 基于突现词汇的研究前沿发现

在笔者收集的文献关键词集中,每一个关键词在每一年中出现的词频都可以统计出来。通过这种统计,可以发现关键词群体的一些特征。在2192个关键词中,有明确时间标签的共有2162个。

通过数据可挖掘统计出每一个关键词总词频、最初出现的年份、最后一次出现的年份、最初出现年的词频、最低非零词频、最高词频、最高词频首次出现年份。通过这几个数据字段,可以计算出每个关键词总共出现过多少年(终现年-初现年+1)、平均每年出现次数(总词频/总现年)、关键词从首次出现到最高词频所需的爬升时间(最高词频首现年-初现年)、关键词从最高频到最后一次出现的消亡时间(终现年-最高频首现年),以及表征关键词从首次出现到跃升至最高词频的上升趋势的突现率(最高频-初现频/爬升时间)。

统计发现,在全部关键词中总词频为1的关键词有1571个,占全部统计关键词全体的72.7%,大量低频词汇使全体关键词的各项指标都偏低,但这也是本领域的一大特点。经过计算,发现信息政策法规研究领域的文献关键词平均出现年限为2.57年,平均每年出现关键词0.97个,每个关键词平均用0.36年爬升至最高频,继而平均经过1.20年滑落至最后一次出现,即每个关键词平均经历0.36+1.20=1.56年的生命周期过程,由于计算的是时间差值,这个值比关键词平均出现年限少1年。其中,“中国”、“美国”、“图书馆”、“情报学”并列为出现年份最多的关键词,同为21年,从最初出现关键词记录的1989年到统计截至的2009年每年都出现过。这四个词表征了本领域研究最核心基本的问题。而“信息政策”关键词1992年才正式出现,但是总词频(199次)和平均每年词频(11次)都是最高的。爬升时间最长的关键词是“图书馆”,从1989年出现到2006年才首次达到最高词频。消亡时间最长的关键词是“模式”,1990年出现最高频,2009年最后一次出现,不过这个词的最高词频是1,总词频也仅仅是3,不能说明其特殊性。

在这些关键词当中,有2008个爬升时间为0的关键词,有1644个消亡时间为0的关键词,爬升时间和消亡时间均为0的关键词有1606个。因此有1644-1606=38个关键词截止到统计日期词频总体只有上升趋势,最后一次出现即为最高频次,可以理解为是上升词汇。而有2008-1606=402个关键词,首次出现即为最高频,而后词频总体处于下降趋势,可以理解为是下降词汇。而爬升时间和消亡时间均为0的1606个关键词,其首次出现即最后一次出现,可以视为孤立词,统计孤立词词频最高是3次,分别是2005年出现的“《电子签名法》”、“信息保密”以及2008年出现的“和谐社会”。

在计算关键词突现率的时候,由于爬升时间需要做分母,需要去掉爬升时间为0的关键词,这样研究总体即为154个关键词。计算得到突现率大于1的18个关键词如表7所示。这些词可以看作本领域中受到研究者高度重视的研究热点。

表7      高突现率关键词

img19

由于截至数据收集时间,2009年没有新的关键词出现,统计2004—2008年新出现的关键词中的上升词,并将之按照各自的突现率排序,可得到最近一个时期内,信息政策法律领域研究的学科前沿,如表8所示。考察突现率大于1的关键词,可以发现关键词含有“立法保护”的6篇文献中,除一篇涉及金融信息外,其余5篇均是对个人信息保护的研究。因此这个关键词与排列其后的“个人资料”、“个人信息保护”和“个人数据”共同说明了个人信息的法律和政策保护研究是当前的一大热点。其次,含有关键词“研究模式”的3篇文献均是对信息法学研究方法和学科建设的研究,这也是当前本领域的一个研究前沿。而关键词“档案开放”与排列其后的“会计信息披露”、“信息披露”和“信息泄露”共同表征了当前信息政策法规研究的另一个前沿课题,即信息公开与披露。此外,在表8中发现有关环境信息政策法规的关键词出现最多,包括环境信息、环境信息公开、环境信息法和环境信息权,虽然其突现率小于1,但也可以认为这个课题是当前研究较集中的领域。综上所述,当前本领域的研究前沿相对集中于个人信息保护、信息法学研究方法和信息公开与披露三个课题。同时环境信息政策法律在一定程度上也是较新兴的研究主题。

表8      近五年初现上升词突现率排序

img20

5 结论

20世纪80年代是中国情报学研究的全面复苏时期,我国学者开始注重情报学基础理论的探讨,并引进多门学科理论,对情报学进行全方位的研究。信息政策法规研究首先从科技情报政策开始,逐渐向国家信息政策、经济活动政策等宏微观领域政策拓展。经过近30年的发展,本领域的研究日益深入,涵盖领域日益扩大,产生了一系列理论和实践成果。

从文献发布和著者关系来看,本领域研究发展历时长,在1994年后进入快速发展时期。著者数量多,发文量两极分化较严重,合著团体较多。

就研究领域而言,研究对象针对约13个具体的研究热点,涉及社会信息活动和社会信息资源管理的多个方面。通过信息研究、信息社会和信息资源三种研究范式,对分布于宏观社会信息、微观信息现象和信息法律权利三个层面展开研究。

从历史演化的角度,可以发现信息政策法规领域的研究,日益从理论走向实践,从宏观走向微观,研究对象日益增多。而这些变化,与我国社会信息化的实际历程是非常吻合的,说明我国信息政策法规研究注重实际的社会需求。通过战略坐标图的分析,可以发现不同时期因子间的变迁与因子所处的学科位置的关系。关键词作为本研究的主要依据和数据来源,可以很好地表征学科知识单元的结构。通过定义上升词、下降词、孤立词、突变率等概念,帮助发现近期本领域研究的热点和前沿。

本文的研究对关键词特征与关系的挖掘,尤其是对于学科知识点和发展脉络的可视化方面有待做进一步的研究。信息政策法规是我国情报科学、法学、经济学等学科的重要研究对象,希望本文所作的梳理能对学者们更深入的研究起到帮助作用。

【参考文献】

[1]廖胜姣,肖仙桃.科学知识图谱应用研究概述式[J].情报理论与实践,2009,32(1):122-125.

[2]王晓光.科学知识网络的形成与演化(I):共词网络方法的提出[J].情报学报,2009,28(4):599-605.

[3]邱均平,杨思洛,王明芝.改革开放30年来我国情报学研究的回顾与展望(二)——情报学研究论文的作者分析[J].图书情报研究,2009,2(2):8-13.

[4]李亮,朱庆华.社会网络分析方法在合著分析中的实证研究 [J].情报科学,2008,26(4):549-555.

[5]何建邦,柯正谊,吴平生等.国家地理信息共享政策框架意见[J].资源科学,2001,23(1):17-22.

[6]马费成,望俊成,陈金霞等.我国数字信息资源研究的热点领域:共词分析透视[J].情报理论与实践,2007,30(4):438-443.

[7]He,Q.Knowledge Discovery Through Co-Word Analysis[J].Library Trends,1999,48(1):133-159.

[8]D.N.Lawley,A.E.Maxwell.Factor Analysis as a Statistical Method[J].Journal of the Royal Statistical Society,1962,12(3):209-229.

[9]陈金霞.国外数字信息资源研究热点分析[J].情报理论与实践,2008,31(4):525-530.

[10]卢泰宏.国家信息政策[J].北京:科学技术文献出版社,1993:64.

[11]钟伟金,李佳.共词分析法研究(一)——共词分析的过程与方式[J].情报杂志,2008,5:70-72.

[12]张勤,马费成.国外知识管理研究范式——以共词分析为方法[J].管理科学学报,2007,12(6):65-75.

[13]张丹丹,马海群.我国国家信息政策的重点领域研究与分析[J].情报科学,2004,22(10):1172-1175.

[14]庄善洁.信息政策法规在信息资源有效配置中的价值取向[J].科技情报开发与经济,2007,17(14):113-114.

[15]杜飞进.信息法浅论[J].法学杂志,1985(5).

[16]李玉海,陈娟.从ACRL标准谈信息素养对信息资源共享的作用[J].科技情报与对策,2004(8).

[17]卢泰宏.社会的情报意识和社会的情报能力[J].情报科学,1983,4(3):1-7.

[18]J.Law,S.Bauin,J.P.Courtial et al.Policy And The Mapping of Scientific Change:A Co-Word Analysis of Research Into Environmental Acidification[J].Seientometrics,1988,14(3-4):251-264.

[19]张晗,王晓瑜,崔雷.共词分析法与文献被引次数结合研究专题领域的发展态势[J].情报理论与实践,2007,30(3):378-380.

[20]蒋颖.1995—2004年文献计量学研究的共词分析[J].情报学报,2006,25(4):504-512.

【作者简介】

img21

马费成,男,武汉大学信息管理学院教授,教育部人文社会科学重点研究基地武汉大学信息资源研究中心主任,兼任国务院学位委员会图书馆、情报与档案管理学科评议组召集人,教育部社科委委员,国家自然科学基金管理科学部评审专家,国家社会科学基金图书馆、情报与文献学评审专家组副组长,中国科技情报学会副理事长,中国信息经济学会常务理事及国内外多个重要期刊编委。主要研究方向为情报学理论方法、信息资源管理与信息经济。近30年来,出版专著和教材10余部,在国内外重要期刊上发表论文100多篇,承担各级各类科研项目20余项。获教育部人文社会科学研究优秀成果奖、湖北省科技进步奖等国家及省部级教学科研成果奖20余项。

李小宇,男,武汉大学信息资源研究中心博士研究生,研究方向为信息资源规划与信息经济、情报学理论方法,发表论文多篇。

【注释】

[1]国家自然科学基金重点项目“基于生命周期理论的数字信息资源深度开发与管理机制研究”(批准号:70833005)的成果之一。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈