金红勤
互联网的迅猛发展产生了大数据,大数据又驱动互联网加速演进。河北省社科界积极挖掘和利用大数据带来的便利和惊喜,引发了科研业态的更大变革。
一、大数据时代已经来临
近年来,随着互联网和信息行业的发展,“大数据”引起了人们关注,成为人们街头巷尾谈论的话题。其实,“大数据”在物理学、生物学、环境生态学等领域以及军事、金融、通讯等行业存在已有时日。只是经过了2009年联合国制定“数据脉动”计划,2010年英国发起“数据权”运动,2012年美国实施“大数据”战略,2014年新加坡提出“大数据治国”理念之后,“大数据”时代的序幕才正式拉开。《华尔街日报》将大数据时代、智能化生产和无线网络革命称为引领未来繁荣的三大技术变革。“大数据”在我国始于2013年。2014年3月5日,李克强在十二届全国人大二次会议上作政府工作报告时说,要设立新兴产业创业创新平台,在新一代移动通信、集成电路、大数据、先进制造、新能源、新材料等方面赶超先进,引领未来产业发展。这是“大数据”首次进入政府工作报告,也表明其作为一种新兴产业,得到国家层面的大力支持。“大数据”成为继物联网、数字城市、智慧城市之后的又一个流行词汇,它与互联网是怎样的关系?又会给人们的生活、工作,特别是对于我们从事的社会科学研究工作带来什么影响,发生哪些变化呢?
(一)互联网在中国的崛起
我们不妨先回顾一下互联网在中国的发展历程:
1986年,北京市计算机应用技术研究所实施的国际联网项目——中国学术网(Chinese Academic Network,简称CANET)启动,其合作伙伴是德国卡尔斯鲁厄大学(University of Karlsruhe)。
1987年9月,CANET在北京计算机应用技术研究所内正式建成中国第一个国际互联网电子邮件节点。9月14日,我国发出第一封“Across the Great Wall we can reach every corner in the world(越过长城,走向世界)”的电子邮件,揭开了中国人使用Internet的序幕。这一天,也被中国互联网协会后来定为中国网民节。
1993年3月2日,中科院高能物理研究所接入美国斯坦福线性加速器中心的64K专线正式开通。这条专线是中国部分连入Internet的第一根专线。
1994年4月20日,中国正式接入互联网,可以全方位地访问国外Internet。至此,中国成为国际上第77个正式真正拥有全功能Internet的国家。中国互联网终于蹒跚起步。
1994年5月21日,中国国家顶级域名(.CN)正式完成注册,运行了中国自己的域名服务器,改变了中国顶级域名服务器一直在国外运行的历史。
虽然在20年前,通过一条64K的接入全功能国际互联网国际专线,使得中国互联网就与世界“接轨”,但是,在此后的多年里,上网也只是象牙塔或研究机构中,范围狭窄的特定人群间享用的高端奢侈品,老百姓只有望洋兴叹。也许那时人们未曾想到,这根网线竟改写了中国,它和现实社会、和普通人之间,建立起如此密切的联系。如今,上网已成为大众化消费,智能手机等的普及和3G、4G、WiFi的应用,更让成千上万中国人几乎可随时、随地“泡”在网上。这也让互联网从当初高大上的“新生事物”,在短短20年里,成为中国亿万人日常生活不可或缺的一部分,同时,中国也从昔日互联网世界的后入者,变成今日全球网民拥有量第一的国家。下面的一组数据也证明了这一点,中国互联网络信息中心(CNNIC)2015年7月23日在京发布第36次《中国互联网络发展状况统计报告》数据,截至2015年6月,我国网民规模达6.68亿,互联网普及率为48.8%。社交媒体用户6.59亿,超过美国和欧洲的总和。手机单独用户6.75亿,手机开户入网用户数量有13亿。手机互联网用户5.94亿,占中国所有网民的89%。手机社交媒体用户5.74亿,同比增幅1.5%。无疑,在区域用户规模上,中国网民已经无可争议地成为世界最大的群体。
(二)互联网引领世界进入数据爆炸时代
在当今这个时代,我们已经离不开互联网,它已成为我们生活中不可或缺的一部分,已成为我们学习办公、交友联络、表达感情的重要工具。微博、博客、社交网站、视频网站、网络论坛、微信的兴起和应用,更使网络传播成为当今信息传递和人际交往的重要方式。互联网能够方便、准确地记录用户相关数据,引领世界进入数据大资料爆炸时代。
2012年,大数据(big data)一词越来越多地被提及,人们用它来描述和定义信息爆炸时代产生的海量数据,并认为大数据以及如何应对大数据已经成为当代社会发展中的重大事件。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”据统计,全球新产生数据年增40%,即信息总量每两年就可以翻番,这一趋势还将持续。有数据显示,1998年全球网民平均每月使用流量是1MB(兆字节),2000年是10MB,2003年是100MB,2008年是1GB(1GB等于1024MB),2014年是10GB。全网流量累计达到1EB(即10亿GB或1000PB)所需的时间,在2001年是一年,2004年是一个月,2007年是一周,而在2013年仅需一天,即一天产生的信息量可刻满1.88亿张DVD光盘。目前,单一数据集容量超过几十TB甚至数PB已不罕见,其规模大到无法在容许的时间内用常规软件工具对其内容进行抓取、管理和处理。[1]
在我国,2013年被称为中国大资料时代的元年。从这一年开始,大数据一词充斥各种媒体;有关大数据的图书迅速出版且发行量巨大。百度的李彦宏、腾讯的马化腾、阿里的马云等大数据的富豪们,更是成了家喻户晓的数字财富的传奇人物。如今,大数据彻底地改变了我们的工作和生活方式,对一般老百姓来说,大数据的最大影响莫过于网购。淘宝网站每天有超过数千万笔交易,单日数据产生量超过50TB(1TB等于1000GB),存储量40PB(1PB等于1000TB)。百度公司目前数据总量接近1000PB,存储网页数量接近1万亿页,每天大约要处理60亿次搜索请求,几十PB数据。一个8Mbps(兆比特每秒)的摄像头一小时能产生3.6GB数据,一个城市若安装几十万个交通和安防摄像头,每月产生的数据量将达几十PB。医院也是数据产生集中的地方。现在,一个病人的CT影像数据量达几十GB,而全国每年门诊人数以数十亿计,并且他们的信息需要长时间保存。我国网民数居世界之首,每天产生的数据量也位于世界前列。
在拥有这么多数据“接收者”与“读者”的同时,就潜在地拥有了这么多数据的“发送者”与“作者”,并潜在地一周二十几小时在“生产”与“输出”各种各样的数据。这些数据可以是文本、音频、视频、位置、图片等结构化的、半结构化的或非结构化的数据,信息消费、信息交互、信息活动等已成为人们日常工作与生活的重要内容,人们越来越感觉“一日不可无网”。近年来,随着互联网技术与应用向“物”的世界的急剧延伸和扩展,物联网应运而生,未来全球可挂网上的“物”的数量将比上网的“人”的数量要大得多,必将产生更“大”的数据,不可置否,大数据时代已经来临。
二、大数据特性与价值
(一)大数据特性
究竟大数据是什么,目前国内外都还没有统一的定义或认识。
美国互联网数据中心将大数据定义为:通过高速捕捉、发现、分析,从大容量数据中获取价值的一种新的技术架构。大数据的特点被人总结为4个“V”:一是Volume(大量),即数据数量巨大。从TB级别,跃升到PB级别。二是Variety(多样),即数据类型繁多。除了标准化的结构化编码数据之外,还包括网络日志、视频、图片、地理位置信息等等非结构化或无结构数据。三是Value(价值),即商业价值高,但价值密度低。在数据的海洋中不断寻找,才能掏出一些有价值的东西,可谓“沙里淘金”。四是Velocity(高速),即处理速度快,实时在线。各种资料基本上实时、在线,并能够进行快速的处理、传送和存储,以便全面反映对象的当下状况。
(二)大数据价值
大数据的价值主要体现在它的预测价值和科研价值。
1.预测价值
预测是大数据的核心价值,指的是将数学算法运用到海量的数据上,从而达到对事物发生的可能性进行预估的目的。预测系统之所以受到重视,关键在于它们是建立在海量数据基础之上的,接收和处理的数据量越庞大,系统纠错和自我改善的功能则越发达。日食、洪灾、旱灾等许多过去被认为无法解释的现象,现在都能够被人类理解、描绘、量化和预测。全球天气预报系统在过去5年里对未来3天的天气预测的准确度已经达到了95%,而这一系统采用的预测方法和上世纪初几乎一致。问题不在于方法,而在于科学技术支持下人们所能掌控的数据。当今气象系统依靠的是精密的雷达和卫星地图,地面和高空的温度也会在世界各地的气象站实时更新,不需要到处收集参差不齐的大气情况数据。在大资料时代日趋精密的数字技术条件下,人们的活动、决定、社会关系都能够被记录,对这些电子踪迹的分析为洞悉人类的行为开拓了思路。人类的行为不再被视为互不相关、随意偶然的独立事件,而是相互依存、相互串联的网络集合中的一部分。[2]
2.大数据的科研价值
在信息获取和信息流通受限的时代,研究人员需要处理数据以解释未知世界的规律,由于缺乏用于收集和分析数据的技术工具,当时是使用随机采样的研究方法,目的是用最少的数据获得最多的信息,其本身存在许多固有的缺陷。在云计算等互联网技术高速发展的今天,感应器、手机导航、网站点击产生的大量资料可以被轻易获取,而且计算机也具有高速甚至实时处理这些数据的能力,那些属于工业时代的一系列问题已不再难以解决。大资料时代的技术甚至可能实现所有特定目标数据的收集和处理,即实现“样本”与“总体”的等同。与局限在小范围的数据相比,将大数据应用于研究不仅意味着更高的准确性,也有助于揭示以前无法发现的细节。不论是社会学、心理学、经济学还是教育学,过去都曾非常依赖通过问卷调查法进行样本分析,甚至在无法获得实证数据时纯粹依赖假设、经验去尝试解释未知领域的规律。大资料时代的来临,使得社会科学研究者能够在更多的领域和更深的层次中获得和使用全面而完整的数据,从而改变由演绎到归纳这一思维路径。[3]
三、大数据带给河北省社科界的变革
大数据不仅给人们的日常生活带来了很多变化,也对科学研究产生了巨大的影响。在科研领域,从宏观到微观,从自然到社会,越来越多的观察、计算和传播等仪器设备正在产生着源源不断的海量、复杂的数据,这使得几乎每个学科领域都在面对着空前的资料爆炸。美国学者杰弗里·汉考克认为,大资料对社会科学研究的意义,堪与显微镜的诞生对化学发展所起到的促进作用媲美。大资料权威舍恩伯格指出,“执迷于精确性是信息缺乏时代和模拟时代的产物。只有5%的数据是结构化且能适用于传统数据库的。如果不接受混乱,剩下95%的非结构化数据都无法利用,只有接受不精确性,我们才能打开一扇从未涉足的世界的窗户”,因此,我们可以说,大资料在人文社会科学研究领域有着广泛的应用前景,是社会科学的春天来临,它也必将为社会科学研究开启新的研究范式,提供新的研究视野。
(一)大数据为河北省社科界提供新思维
随着大数据时代的发展,大数据本身及其巨大的功能和价值对传统思维方式造成了强烈的冲击,要求传统思维方式随之发生转变,舍恩伯格论述了大数据带来的三大思维变革,即,要全体不要抽样,要效率不要绝对精确,要相关不要因果。对于河北社科界来说,大数据与社会科学研究的融合出现了新的研究思维:
1.开放全过程研究思维
以往人文社会科学研究成果的表现形式为最终成果,再利用主要以文献引用、转述和评论等为主。而数字人文研究可记录人文社会科学研究的完整过程,资源化的原始数据、中间成果得以立体化应用,再利用水平显著提升。
以河北省社会科学院为例,目前,根据《河北省社会科学院中国特色新型智库建设先行试点方案》,省社科院正在积极地开展智库建设。其中,河北省社会科学数据信息网络平台、河北省社会科学评价平台、河北省社会科学成果转化平台,成为河北省社会科学院的基础设施建设。在这些平台上,不只是有最终的科研成果,还有科研过程的数据,和阶段性成果,这些数据的挖掘,不仅可以盘活科研人员手中闲置的原始数据,循环再利用,同时,还可以将整个科研过程得以完整记录,便于今后科研工作的跟踪。这种以在线实验室、项目网站、开放数据集、项目论坛、项目社会网络为特征的立体开放研究思维普遍确立,可参与性大大增强。
2.碎片化重组研究思维
哲学社会科学是以人类社会活动为研究对象的。从生产力的角度看,人类社会沿着农业社会——工业社会——信息社会的路径发展。当今时代,人类社会活动的多样化使得哲学社会科学的研究对象发生“裂变”,同时伴随着明显的“碎片化”特征。[4]因此,在大资料环境下,河北的人文社会科学研究更加注重片段数据、海量数据、非结构化数据的采集、清洗与分析,通过碎片化重组,深度揭示难以处理或无法预知的科学问题。比如通过海量自然语言表达效果观测公众的政治参与意识、通过科研人员的在线时间与资源下载时间分布研究科研人员的作息时间与工作强度等。
3.计算分析研究思维
在河北社科界的以往研究成果中,定性研究居多,定量研究也主张采用是非论断,采纳或拒绝某一特定假设,是采用确定性、因果关系的研究思维。在大数据环境下,河北的社会科学研究可采用计算分析思维,对相关命题进行趋势分析。
4.智慧思维
人类思维活动的过程是一个信息加工的过程,以云计算为代表的大数据时代数字技术是人类思维的有力工具。大数据系统也能够自动地搜索所有相关的数据信息,并进而类似“人脑”一样主动、立体、逻辑地分析数据、作出判断、提供洞见,那么,无疑也就具有了类似人类的智慧思维能力和预测未来的能力。“智能”是大数据时代的显著特征,大数据时代的思维方式也要求从自然思维转向智慧思维,不断提升机器或系统的社会计算能力和智慧化水平,从而获得具有洞察力和新价值的东西,甚至类似于人类的“智慧”。
(二)大数据改变了河北省社科界的认知方式
大数据不仅是一种应用性很强的实用工具,而且是一种重要的思维方法。在大数据时代背景下,数据无所不在,许多过去难以量化的信息都将转化为数据进行存储和处理。通过大数据时代的数据储备和技术理念,以前所未有的方式洞见事物的发展趋势,进而影响人们的价值体系、知识体系和生活方式。在大数据时代,能否激发和利用隐藏于数据内部尚未被发掘的价值,实现在社会科学研究领域的革新,取决于我们科研人员对于大数据及其潜在价值功能的认识和态度。也就是说,形成与之相适应的思维方式是驾驭大数据和实现其价值的关键。这就需要形成“大数据思维”。
大数据时代的思维方式离不开大数据的支撑,大数据是大数据时代思维方式出现的源头和赖以生存的基础。从根本上说,大数据时代思维方式是产生于大数据时代、立足于大数据平台之上的新观念体系。大资料认为,世界的一切关系皆可用资料来表征,一切活动都会留下资料足迹,万物皆可被数据化,世界就是一个数据化的世界,世界的本质就是数据。过去只有物质世界才能用资料描述,实现定量分析的目标,而现在,大数据给人类精神、社会行为等主观世界带来了描述工具,从而能够实现人文社会科学的定量研究。总之,大数据通过“量化一切”而实现世界的数据化,这将彻底改变科研人员认知和理解世界的方式,带来全新的大数据世界观。[5]
(三)大数据为河北省人文社会科学研究提供新视角
当前,以各种载体形式出现的文献资料在社会科学研究中的作用日益显著,数据密集型知识发现方法受到社会科学界的普遍关注,以“人文计算”、复杂网络分析、大规模数据分析为特征的研究方法逐渐被采纳,人文社会科学的“科学性”显著增强。
科研人员不仅通过对大量数据实时、动态地监测与分析来解决科学问题,更基于资料来思考、设计和实施科学研究。资料不仅是科学研究的结果,且成为科学研究的基础;人们不仅关心数据建模、描述、组织、保存、访问、分析、复用和建立科学数据基础设施,更关心如何利用泛在网络及其内在的交互性、开放性,利用海量数据的可知识对象化、可计算化,构造基于资料的、开放协同的研究与创新模式。
作为河北省社会科学院的智库建设中的一个项目——河北省社会科学信息网络平台,就引进国研网的国务院发展研究中心行业景气监测平台(DRC)。DRC该行业监测体系涵盖48个行业,嵌套多个模型和独立数据算法,是国内目前覆盖行业领域最广,最先实现按月度发布,率先实现行业间联动和网络化分析的景气体系。无疑,该平台将成为社科院科研人员密集型数据检索和分析的一个便利工具
(四)拓宽了学术研究空间
大资料分析方法的出现为河北社科界提供了新的研究空间,新的研究可能。
国务院办公厅在《2015年政府信息公开工作要点》中明确提出积极稳妥推进政府数据公开,再加上互联网的特有开放性使诸多原来无法面世的材料得以见光,使自媒体冲破以往的学术禁区变为可能,这种变动极大地拓展了学术空间,如随着新史料的开放,一些以前的定论恐怕也需要重新审视。
随着大数据思维与分析技术的深入发展,社科研究能够通过片段海量非结构化数据的采集整理分析,通过碎片重组,深度揭示以往难以处理或无法预知的难题和关系。大数据所涉及数据均超过一般的阅读、分析和理解所能处理的范畴,是以往“不可研究”或“难以研究”的,大资料不仅使社科研究者知道以前“不知道”的事情,而且能把研究者带入一个“不知道自己不知道”的世界。[6]
在大数据时代,在科学的研究方法指导下,降低了社会调查和实践的难度,使得规律的发现和验证变得可行。突破了许多以往社会科学工作者们对于社会组织架构及人类行为的理论的空想,根据大数据和大数据技术,就可以开展实实在在的调查研究。通过大数据和数据挖掘,基于概率以及可能性的实证和经验研究正在被资料分析报告和专项预测研究所取代,从而进入一个全新的领域。由于这种预见是一种自下而上的知识发现过程,是在没有理论假设的前提下去挖掘信息、发现知识、预知事物发展的规律和趋势,从而更具有科学性、有效性和实用性。近年来,研究者在许多社科领域运用大数据取得了突出成果,如在今年年初,河北工业大学和天津北方网新媒体集团联合组建了“天津网络新媒体技术研究中心”,该中心利用IPTV电视用户和万视达手机电视用户时实交互的数据进行数据挖掘研究,以推动新媒体技术发展。
(五)大数据带来研究方法的突破
大数据研究具有重要社会影响,为公众表达、商业运营、社会管理提供了机会,也对河北的社会科学的研究具有启示意义,大数据挖掘是对社科研究中材料和研究方法的突破。
大数据通过数据挖掘“让数据发声”,提出了全新的“科学始于数据”这一知识生产新模式。数据挖掘为研究者提供了深入分析和有效利用大数据的手段。而云计算等数据挖掘手段将传统的经验归纳法发展为“大数据归纳法”。数据挖掘的特性在于,它不是用于验证某个假定模型的正确性,而是在数据库中自己寻找模型,本质上是一个归纳的过程,并不需要假设或期待可能的结果,从而突破了研究者的视野局限,突破了以往的研究方法,扩展了人类的经验范畴。通过数据挖掘技术,研究者能够从海量数据中搜索和发现信息与知识,找出存在于数据中的潜在关联,并利用数据之间的相关关系来解释过去、预测未来,从而用新的数据规律补充传统的因果规律。
在传统的实证研究中,研究者首先在理论分析的基础上提出假设,之后通过调查和资料分析来验证假设,是一种自上而下的决策和验证过程。在社会调查中,研究者根据本人的经验、见识、认知和判断,设计出访谈内容和问卷,被调查者也只能据此回答提出的问题。这种方法其不足或缺陷在于调查结果局限在研究者的视野之内,研究者的学术能力决定了研究成果的方向与深度。而大数据的应用使研究者的视野得到有效扩展。大数据的海量信息在时空上具有传统抽样数据无法比拟的广度和深度,其全样本的性质能够在最大程度上避免个人经验有限性对研究过程客观性的主观影响。研究者不仅能通过对大量数据实时、动态的监测与分析来解决社会问题,更能通过这些海量资料来思考、设计和实施研究计划;可以通过数据的相关性测量揭示事物的本来面目,发现规律和展示规律,提炼出重要的理论,突破了研究者的主观臆断的局限,有效提高研究的客观性和科学性。[7]
(六)大数据为河北省社会科学研究的推进提供了条件
我们知道,社会科学研究很大程度上是依赖于信息的占有量,信息资料能否被研究者比较完整准确地占有,是学术质量的主要取决因素之一,而网络时代以数据的海量而著称,能够为研究者提供前所未有的海量和高质量的社会数据、数据和信息。据中国互联网络信息中心2015年6月4日《2014年河北省互联网发展状况报告》,在2014年,河北省网民通过搜索引擎、微博、网络新闻等渠道获取网络信息的比例分别高达80.7%、37.4%和78.4%。因此,从某种意义上讲,我们也可以认为大资料大数据为社会科学研究的推进提供了条件。
过去,社会科学研究资料主要来源于田野调查和采访,受调查成本和可操作性等因素的限制,获得的数据数量和质量都十分有限。随着计算机及网络技术兴起,社会科学研究除了依赖一手的调查资料,还可通过网上调查,由网民主动参与填写问卷;同时还可借助各类专业数据库、互联网记录的民众、企业和政府处在其环境中的一切行为,以及智能手机和计算机用户、政府机构、统计部门及大型企业、网络平台数据监控等,这些都成为数据增长的重要来源。
如今,我们的专家学者坐在电脑、手机屏幕前就可以立即接入上述数百万的互联网用户数据,这些开放、流动的数据,成为研究者观察社会行为的“显微镜”,通过资料挖掘技术帮助研究者捕捉以往难以获取的关系和知识。
这种借助互联网用户的数据进行研究,利用这些数据和数据挖掘技术,能够深入观察和分析人类社会的复杂行为模式,这已经成为当前社会科学的研究前沿。
(七)大数据提升了河北省社科界研究成果的学术影响力
前互联网时代,学者和学术成果基本在专业圈子里展开,按专业各就各位发表成果,和同行及相关群体交流。局限于行业组织、研究所、专业报刊、学会、高校相关院系等。传播结构的这种局限,必然造成成果普及和推广困难,部分研究成果只能孤芳自赏,局外人和非专业人士谈论与传播专业的渠道严重受阻甚至没有可能。尤其如史学、哲学等思想性专业性强的学科,很少能在业外有所影响。很多情况下,学术价值越高,影响面越窄,被关注度越低,专业途径领域拓展极为艰难。再如,河北省图书馆学会,每年都举办次数不等的学术活动,但参加者大都是河北省内图书馆及相关部门,其他学科知道的甚少,后期跟进报道也只局限于圈内有关的单位,产生的社会影响可想而知。
互联网改变了上述情况,观点碎片化、传播途径多元化、学者活动圈子平民化、观点表达通俗形象化等新特点,使学术冲破狭隘单一的状态,走向寻常百姓和专业之外的群体。学术成果的影响力与传统的作者社会角色、职称、学历等因素几乎失去了联系,而直接取决于知识含金量与网民阅读习惯的契合度。尤其是网络传播功能助力原创的功能较前互联网时代剧增。传播的作用比原创更显得举足轻重,这是互联网时代独有的现象。据中国互联网络信息中心2015年6月4日《2014年河北省互联网发展状况报告》,在2014年,河北省网民在交流沟通类网络应用最多分别为即时通信,占86.1%,电子邮件占33.6%,博客QQ空间占68.0%,论坛BBS占20.4%。一些研究者通过微博、博客、微信、朋友圈、网上学术网站、网上论坛、网上会议甚至在网上经营自媒体等多种形式,将研究成果以通俗的博文、微博等导入普通读者和专业圈之外,
这些好的原创性研究如果经过网络的充分发酵,出版的类似图书都有不俗销量,产生了比较乐观的影响力。“非主流”学术被广泛认可。
通过网上和纸质出版物的互动,不仅促进多元学术探讨和传播,而且进一步促进了学术界百家争鸣、百花齐放的局面。
(八)提升社科界的科研及管理质量
基于云计算的互联网科研,已经成为一个开放性的自主科研和学习系统,科研人员可以不受时间、地点以及经济条件的限制,自主选学相关知识,获得自我提升。这自然就为科研工作者提供了更为广阔的学习空间,能够形成与众不同的知识结构、才能结构。对于科研管理部门来说,还可以利用这种大数据的方法,提升管理质量。通过对与科研人员相关的海量资料进行分析,辨别出每个科研人员的科研行为和科研模式,记录科研人员的学习过程,进行实时的科研情况监控,从而有效提高科研管理水平。
如在河北省社会科学院新智库建设项目之一的科研成果评价平台的设计中,就可考虑,在这个平台上,科研成果的质量评定可以增加“成果浏览量”“引用次数”“下载次数”等客观评价指标,而这些指标都可以为科研人员所利用(比如作为申请科研项目资金的资质证据),成为建立自己学术地位的客观指标。因为信息的公开性,这种新型的科研成果评价方式还可以有效遏制学术不端,打击学术造假。通过这个平台,科研成果评审方式还可以从传统的小范围“专家评审”,扩大到整个行业乃至全社会的“集体评审”,同时,科研人员可以通过信息反馈意见,集思广益,对成果进一步改进和完善,从而使学术成果的质量达到更高的水平。
(九)大资料加强了河北省各领域学科协作的黏性
以大规模数据分析为特征的研究方法的广泛应用,使社会科学的科学性显著提升,学科融合趋势进一步增强。
随着大数据时代的到来,科研数据总量的快速增加给社会科学学者带来了巨大挑战。每一位人文社会科学研究者在自身研究领域都面临大量文献数据的处理,这些文献数据的数量巨大已经远远超出了传统阅读能力所能处理的范畴,因而我们的这些学者不得不借助计算机来处理完成相关文献资料。同时,以“大数据”为代表的数据资源相对于数字文本、数字文献等数字信息资源,来源更加广泛,数据粒度更小,记录单元更加碎片化,结构更加多元化,机器生成数据也显著多于人工生成数据,信息质量参差不齐,对数据的汇集、保存和分析利用更加依赖计算机的辅助,更需要依赖计算机对研究过程的支撑。此外,由于大数据为社会科学提供了全新的分析对象,学术界越来越认识到交叉学科的重要性。随着跨学科研究趋势的日益增强,传统人文科学和社会科学领域引入了大量的计算机处理模式和分析方法,各类依托计算机存储媒介数字学术资源的开发,基于复杂运算和分析的计算机模拟与实证,基于事实与证据的商业预测与案件证据推理等研究议题广泛兴起,从根本上改变了人文知识的获取、标注、比较、取样、阐释与表现方式。尤其在语言学、文学、历史学、文艺学、民族学等多个人文领域取得了引人注目的效果,并组建了专门的科研机构。[8]目前,国际上已形成了国际数字人文机构联盟和数字人文中心网络两大数字人文研究联盟。在我国,2011年,武汉大学也成立了我国首个数字人文研究中心,该中心的成立可以有效促进跨学科研究发展,促进人文社会科学的深入研究。
(十)大数据促使河北省社会科学学术与科研社交网络的形成
随着世界范围内大众型社交网站的蓬勃发展,专门针对学术与科研工作者的“小众”型社交网站也出现了迅猛发展的势头。在河北,有关社会科学学术网络也正在蓬勃兴起。河北省教育科学研究所主办的《教育手机报》的教育资讯平台,集各学科专家智慧为一体,为家长、教师以及学生提供权威、专业、便捷的教育资讯。河北省委宣传部《移动学习课堂》手机彩信平台,为向全省宣传系统的处级以上领导提供时事资讯,普及各种科学、文学、社会治理等知识;省社科规划办创办了公众微信号《资政育人》微信平台,向社会推出燕赵社科名家、社科小贴士等栏目。社科院、高校、讲师团等各个系统均利用QQ、微信等聊天工具建立了本系统的信息交流平台。
此外,河北省社会科学院正在搭建的社会科学信息网络平台,河北电子政务研究会牵头准备搭建的河北省智慧城市建设联盟平台;在社科院系统,已着手建立全国地方社科院大数据智库联盟平台,等等,这种新型的交流平台和学术与科研型社交网络,其必将对传统的科研方式、科研合作方法、科研成果发布模式,科研人员互动交流形式等都产生了不可忽视的影响。首先,平台缩短了科研成果发布时间。学术与科研成果发布的主要模式是在行业内学术刊物出版发表,发表周期短则二三个月,长达一二年,甚至几年。利用这些网络平台可以让研究者实时发布自己的成熟或不成熟的研究成果,加速了知识流动进程。其次,改变了科研交流合作模式。研究者利用这些平台,通过对自己科研成果的实时发布以及对同行学术动态的掌握,可与同行随时开展互动讨论,迅速获取同行评价,并改善提升自己的科研成果,极大地加强了同行业科研人员的交流与合作。再次,可以促进对科学研究信息获取与产学研合作。这些平台的开放性意味着任何互联网使用者都可以方便查阅由众多用户贡献出的公开科研成果信息。通过系统的热点推送功能,平台还可以显示各行业的最新研究热点与研究方向,此类公开信息不仅能为科研机构与生产企业提供方向性研究指引,也为它们直接获取科研成果信息提供了极大的便利。
结束语
虽然大数据时代已经到来,大数据热已是不争的事实,但我们在对之抱以热望和翘首以待的同时,仍需要保留一份谨慎。比如大数据脱离了所处的具体场景,如何鲜活地表现人文情怀;在大数据分析中如何体现个体特征;如何融合大数据技术分析、创新思维和思辨分析;如何消除海量数据闲置沉睡,充分挖掘信息富矿。除此之外,像与其他学科领域的共性的网络安全和个人隐私问题,也是大数据时代人们极为关心的个人和社会问题,这些都是需要进一步探究的课题。
(作者系河北省社科院社科信息中心副主任、研究馆员)
【注释】
[1]邬贺铨:大数据时代的机遇与挑战,求是2013年第4期,第47页。
[2]张燕南、赵中建:大数据时代思维方式对教育的启示,教育发展研究2013年第21期,第2页。
[3]张燕南、赵中建:大数据时代思维方式对教育的启示,教育发展研究2013年第21期,第2页。
[4]荆林波:哲学社会科学的新变化新特点,人民日报,2012年3月15日。
[5]黄欣荣:大数据时代的哲学变革,光明日报,2014年12月3日。
[6]李文、邓淑娜:大数据带来社科研究新变化,人民日报,2015年8月24日。
[7]李文、邓淑娜:大数据带来社科研究新变化,人民日报,2015年8月24日。
[8]孙建军:大数据时代人文社会科学如何发展,光明日报,2014年7月7日。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。