梁 昕*
* 梁听,上海交通大学国际与公共事务学院讲师、博士。
一、概述
《社会舆情的网络分析方法与建模仿真》是“十二五”国家重点图书出版规划项目,也是“公共安全应急管理丛书”之一(刘怡君等,2016)。该书系统介绍了网络分析方法的理论、概念、指标、工具及其在社会舆论中的建模、仿真和应用。全书分为三篇:第一部分为理论基础篇,详细介绍了社会网络分析、动态网络分析和超网络分析。第二部分为模型方法篇,创新地提出了“社会舆论超网络模型”“超链路预测”和“超链路排序”等,针对社会舆论形成与演化、引导与干预全过程进行建模分析。第三部分为案例应用篇,通过有代表性的真实网络事件,展示了网络分析和模拟仿真方法的应用,介绍了如何运用网络分析方法,特别是超网络方法解决实际问题。
牛文元先生在本书的序中提到社会科学和自然科学在某些方面有着高度的共性。例如个体间通过交互作用形成的“社会舆论”和原子重排形成的磁场惊人的相似;社会中人与人的连接关系形成的社会网络也与自然界中原子由分子键连接形成的分子十分相似;每个人作为个体,其时空分布具有高度不确定的粒子性,而人组成的群体则具有较为确定的波动性,这是“波粒二象性”在社会科学中的体现。因此,近年来学者们不断追求一种新的社会科学研究范式,希望利用自然科学的研究方法,从微观视角出发,通过对个体行为的研究,剖析宏观的社会科学问题。
网络分析,特别是近年来发展的动态网络分析和超网络分析,可以认为是社会科学中较为微观的“分子”级研究。自然科学的研究经历了宏观层面、分子层面、原子层面三个阶段。每个阶段都是对人类认知极限的突破,特别是从宏观层面到分子层面的跨越,经历了漫长的过程。自然科学宏观层面的认知往往使用一系列指标,比如对水的认识是通过水的密度、比热、熔点、沸点等一系列参数。这些参数从各种角度描述了水的属性,但始终没有能够涉及这种物质的本质。直到对分子的研究开启了认识物质本质的大门,科学家认识到原来水就是H2O,是氢气和氧气两种元素经过化学反应化合而成,继而可以利用各种手段准确地控制物质的化学反应,改变物质的形态和特性,甚至创造出新的物质。传统的社会学研究也主要在宏观层面,通常采用的统计、计量等研究方法也属于统计性、描述性分析,并没有涉及问题的本质。本书中介绍的网络分析方法是对社会学研究的重要突破,其与自然科学研究中的分子层面类似,更加关注微观层面不同元素间的互动关系,从而有助于社会科学更加深入的探索,因此本文将网络分析称为社会学中“分子”级研究。后文也将对此做进一步的探讨。
本文以下主要分为四部分:第一部分对网络分析为什么被称为社会科学中的“分子”级研究做出解释,并且探讨网络分析对社会科学研究的意义;第二部分讨论该书涉及的网络分析的主要创新之处;第三部分梳理该书中介绍的网络分析方法;第四部分介绍网络分析方法的应用案例,说明可以得到哪些分析结果以及解决现实中的哪些问题。本文最后对该书的贡献做出了总结,同时也提出了该书的局限性和未来研究的发展方向。
二、社会科学中的“分子”级研究
自然科学的研究对象从初期的宏观物质到分子再到目前的原子,每一次都是对人类认知边界的突破,也释放出更加巨大的能量和生产力。自然科学发展初期,主要是对宏观物质的分析,即通过一系列参数指标,对物质进行描述。如前文提到的对水这种物质的分析是通过密度、比热、熔点、沸点、浮力等参数。这些参数从各种角度描述了某种物质的属性,但始终没有能够涉及这种物质的本质。直到对分子的研究开启了认识物质本质的大门,科学家认识到原来水就是H2O,是氢气和氧气两种元素经过化学反应化合而成。通过化学反应水可以分解为氢气和氧气,也可以和其他元素组成新的物质。于是物质的世界变得没有那么纷繁复杂,也不需要一系列参数来描述和定义一种物质,任何物质都可以用一个分子式来表达。相对宏观物体到分子层面认知的跨越经历了千年的时间,分子层面到原子层面的跨越仅仅经历了百年的时间。虽然在分子级研究时,人类就知道原子的存在,但对于其内部结构,特别是电子运行规律等并不了解。当人类开始认识到原子的运行规律,产生了量子力学,对经典物理学是一次全面的颠覆,人类对物质世界的认知又一次突破了瓶颈,达到了新的高度。
自然科学对物质不同层面的认识也释放出了不能级别的能量和生产力。在宏观物体的认识层面,人类仅能通过经验使用火和简单的炸药。对物质有了分子级别的认知后,人类能够可控地操作化学反应,制造新型炸药,释放巨大的能量。同时,通过对物质分子级的理解,人类可以对物质进行分解、重组,从而创造出新的物质,实现了真正意义上的“造物”。例如现在被广泛使用的塑料,超高强度的碳结晶以及分子合成药物等。对物质有了原子级别的认知后,人类能够应用核能,制造原子弹与建设核电站,释放更加巨大的能量。同时,通过对电子运动的理解和控制,人类发明了半导体,进而衍生出了现代的计算机技术、通信技术、自动化、人工智能等一系列技术和产业。因此,自然科学发展到对物质原子级的认知,是第三次工业革命的基础,也是现代科技高速发展的起点。
对比自然科学的发展进程,目前社会科学研究仍主要停留在“宏观物体”层面。对宏观物体的认知是通过描述性的参数,如质量、体积、密度、比热、温度等。类似的,目前社会科学主要使用的定量研究方法也通过参数来进行分析,如国民生产总值,平均年龄,收入中位数等。而这些指标均是宏观的、描述性的,并没有深入探索社会内部的结构和运行规律。而本书所述的网络分析方法则突破了传统社会科学研究方法的瓶颈,更接近从“分子”层面来解析社会问题的结构和规律。其相似性主要有以下几点:
第一,关注微观层面的个体,而不是宏观层面的统计指标。网络分析法的每个节点可以代表一个组织、一个群体、甚至一个个体。它直接关注个体的具体活动,例如在社会舆论分析中,每个网络节点的主体就是一个互联网发言者,每个发言者有自己所处的环境、观点、发言的主题等,所有分析都是围绕着个体的活动展开。
第二,关注节点间的连接关系。物质世界中的元素并不丰富,一张元素周期表即可表达,常见的元素甚至只有几十种。而这仅仅几十种元素通过不同的连接关系,形成了不计其数的分子形态,进而塑造了缤纷的物质世界。这种连接关系被称为化学键,是不同种类物质形成和变化的关键所在。而网络分析方法的关键也在于网络中微观个体的连接关系。同样的人群有不同的连接关系就形成了不同的组织架构,对外反映出不同的形态。例如社会舆论分析中,信息在不同网络结构中传播的方式、流向、速度等都有很大差异。
第三,由微观至宏观的逻辑推导和精准控制。当自然科学发展到分子层面,可以掌握分子的结构和规律,进而可以从分子微观的变化推导出物体宏观的变化。例如当外界温度升高,分子键被破坏,分子的形态就产生了变化,而宏观层面则反映为宏观物质的性质变化。基于对分子微观规律的掌握,自然科学中衍生出“计算化学”,即不需要通过实际的化学实验,而是通过计算机对分子建模,模拟化学实验,精确地仿真化学反应,合成或分解新的物质。其效率之高是传统化学实验无法比拟的,这就是从微观到宏观的逻辑推导带来的精准控制效果。网络分析方法是对社会科学中微观规律的分析和总结,在掌握个体与个体互动关系的微观规律基础上,可以推导出宏观的结果。进而通过信息技术对网络进行建模仿真,快速高效的对网络进行分析,并通过微观层面的干预,精准地控制宏观层面的事件发展。例如本书中提到的通过网络建模,找到“活跃人物”、“焦点人物”和“舆论领袖”等关键节点,施以不同的引导策略,可以对社会舆论进行有效的控制。
三、网络分析的主要创新点
传统的社会网络分析相对较为成熟,一般建立网络模型并通过图论分析人与人之间的网络关系。例如企业管理中不同利益相关者之间的网络关系、舆情分析中不同发言者之间的网络关系。2009年9月,著名期刊Science推出了复杂系统与网络专辑,其中《反恐怖主义的新工具:元网络》分析一文中指出了传统网络分析的局限性:“网络分析并没有真正起到控制恐怖分子的作用,网络分析作用受到限制的部分原因是图论作为网络分析的基础数学理论不够灵活。我们善于构建静态网络,但是,像这样的网络总随着时间改变,而我们并没有动态的图理论。”(Bohannon,2009)。传统的社会网络分析的局限性主要体现在两个维度,即“单模”和“静态”。“单模”即网络只有一层,仅探讨“同类元素”之间的关系,在管理学、社会学中一般具体为人与人之间的关系。而现实中,人不仅与人互相联系,也与其他元素互相联系。例如舆论分析中,人会与话题产生联系,会与观点产生联系,也会和环境产生联系。因此对于许多问题,并不仅仅是分析人与人关系那么简单,这就需要进行“多模”的网络分析,分析不同类元素之间的关系。“静态”即网络是静态不变的,然而现实中大多数网络是随时间动态变化的,例如舆论网络,每个人的观点会受到周围环境的影响,人和人的关系也在动态变化,静态网络不足以反映和分析现实中的问题。
为了突破这两个维度的局限性,“超网络分析”和“动态网络分析”应运而生。超网络,也被称为“网络的网络”,是跨越多个网络的“多模”网络,用以研究不同网络间的互相作用。超网络的出现突破了传统“单模”网络的局限性,与实际的网络具有较强的一致性。动态网络是规模、结构可以随时间不断调整的网络。动态网络突破了传统的静态网络分析,能够更加适应实际社会网络的动态发展。近年来网络分析方法的突破具体有以下几点:
(1)元矩阵(Carley,2002):Carley结合知识管理、运筹学和社会网络技术创建了元矩阵表示方法。元矩阵表示方法是表示异质个体和他们之间的多种不同边。例如一个元矩阵可以由人、资源、任务、组织四个元素构成,元素两两相连形成共10个内部链接的网络,如表1所示。元矩阵可以看作是网络嵌套的基础,对一个网络的改变会影响到其他网络,一个网络中的关系也同时蕴含着其他网络中的关系。
表1 元矩阵示例
(2)概率边(probabilistic ties):网络中边的连接是具有一定概率的。多种实时产生的影响是具有概率的,包括观察者对边的确定性和链接存在的可能性。动态网络分析多使用贝叶斯更新策略,认知推理方法和社会认知改变过程模型,用于评估概率和它随时间的变化。概率边的出现是网络分析方法的一大进步。对比近代物理学,越微观的物质其不确定性越强。例如某一电子的运动轨迹,跃迁能级是无法确定的,但可以用概率表达。类似的,当社会学研究至微观层面,不确定性也显著增大,特别是人类个体的行为不确定性非常大,难以用确定的数学形式表达。因此,用概率表达个体的行为以及个体之间的关系是非常必要的。
(3)多主体网络模型(multi-agent network models):传统社会网络分析方法的一个主要问题是个体不具有主动适应能力,即不能采取行动,学习和改变他们的网络。利用多主体(multi-agent,也称为多智能体)技术,每个个体可以根据某种机制进行学习、合作、博弈等,从而促进网络动态演化。驱动个体学习和交互的因素有很多,如自利性,即追求自身的利益最大化,与其他个体交换资源等;相似性,即相似的文化背景、性别、年龄等;探索性,即希望寻找新知识,探索未知世界的激励等。
(4)超网络(supernetwork):指高于而又超于现存网络的网络(supernetwork—above and beyond existing network)(Nagurney and Dong,2002)。超网络可以表达不同网络的相互关系,如图1所示。其主要特性包括:网络嵌套,及网络中包含网络;多层,层内与层间都有连接;多级,同级和级间都有连接;信息流向可以是多维的;网络的多属性与多准则;存在拥塞性;协调性,全局优化与个人优化的协调。
图1 超网络示意图
四、网络分析方法的升级
动态网络分析和超网络分析与传统的社会网络分析相比,在度量指标、分析工具、建模方法等方面均有较大差异。
(一)度量指标对比
传统社会网络分析主要采用中心性分析、凝聚子群分析、核心—边缘结构分析等,采用的指标为度、距离、平均路径长度、介数、集聚系数等。这些参数基本是从图论中直接引用过来,表达网络结构以及节点之间的关系(Wasserman and Faust,1994)。
动态网络中引入了“元矩阵”的概念,这使传统的网络变得丰富而蕴含多种变化。网络不仅仅是点和线的关系,而升级为“元矩阵”之间的关系以及“元矩阵”包含元素之间的关系。动态网络分析的度量指标也显著地丰富起来,除了传统网络分析的指标,增加了许多与“元矩阵”相关的指标,如可访问索引—基于资源(access index,resource based),交流需求度,交流一致度,知识多样性等。可以看出这些增加的指标均与元矩阵的智能体(agent)的“动作”相关。作为一个智能体,它需要通过网络获取需要的资源,因此“可访问索引—基于资源”表明它获取资源的范围。每个智能体需要通过交流获取知识等,因此“交流需求度”表达了智能体与周边其他智能体交流的需要。
超网络由多层网络构成,其分析指标已不局限于单层网络,但其指标可与单层网络指标相对应(王志平,2008)。如对应单层网络中的节点度指标,超网络中有“节点超度”指标(vertex hyperdegree),其表示某个节点参与组成的超边数。对应于单层网络的距离指标,超网络中有“节点间距离”指标(vertex-vertex distance),其表示连接任意两个点的最短路径超边数,也即两个节点相连通过的最少超边数。
三种网络的度量方法对比如表2。
表2 不同网络分析方法的度量指标对比
(续表)
(二)分析工具对比
传统社会网络分析经历了几十年的发展,已经形成了一系列较为成熟的分析工具,如应用较为广泛的Pajek,Gephi等。然而传统的网络分析工具无法满足逐渐兴起的动态/超网络分析的要求,因此适应动态/超网络分析的新型网络分析工具开始出现。本书中重点介绍了Carley及其团队开发的动态网络分析工具,包括三个开源软件:Auto Map,ORA和Dy Net,涵盖了从网络建立、网络分析到动态仿真模拟的全生命周期分析工具。Auto Map是一个计算机辅助网络文本分析软件,可以将网络文本中词语之间的联系进行编码,将关联词语构建成网络。其中运用了最新的语义分析技术,可以将作者的心理版图建模为网络。ORA是一个网络分析工具,可以对元矩阵进行管理(输入信息、编辑参数等)。ORA可以计算和判断动态网络的参数变化,侦测一个组织结构中存在的风险和脆弱性。Dy Net为模拟仿真工具,根据多种不确定信息对网络进行推理,分析网络组织如何演化,面对不同级别的干扰鲁棒性如何,以及不同隔离策略下的网络演化趋势等。Dy Net中的agent可以通过交互不断学习知识、调整状态、适应环境,通过agent的动态变化,推动整个网络的动态仿真。
(三)链路预测到超链路预测
链路预测是复杂网络研究中关注的一个热点问题。其目的是基于已知的网络数据,包括网络的拓扑信息和外在属性信息,通过选择合适的算法,估计节点间存在链接的可能性。在超网络建模环境中,网络结构更加复杂,各层节点的属性可能相同或不同,超边(也称超链路)连接着不同网络层之间的节点,包含的信息多元又丰富,传统的链路预测无法适用于超网络结构。相对于传统的链路预测(link prediction)研究,超链路预测是指在超网络结构上,对未知的超链接(existent yet unknown superlinks)的预测以及未来超链接(future superlinks)的预测。
与传统链路预测不同,超链路预测的本质是希望通过对不同复杂网络下一时刻的超链路预测达到判断网络动态演化趋势、干预网络结构进、调整系统功能的目的。超链路预测的过程就是模拟和分析超网络动态演化的过程,不同的预测方法也赋予了网络动态演化的不同规则。因此超链路预测已不仅限于链接概率的分析,而是模拟网络动态演进的一种重要方法,同时可以通过预知网络的发展而进行网络系统的干预,从而调节超网络系统的功能。
五、网络分析的应用与成果
该书以社会舆情为研究对象,介绍了网络分析方法在社会舆情分析与管理领域的应用。主要应用的领域有三个方面:关键人物识别、舆论传播建模和舆论的干预与引导。
(一)关键人物识别
关键人物是指在网络中具有重要地位或重要影响力的人物。例如美国有研究通过建立恐怖组织的网络,分析恐怖组织中较为核心的成员,予以重点打击。在社会舆情研究中,关键人物通常被定义为“意见领袖”,指能够影响别人的态度或一定程度上改变别人行为的人。美国学者拉扎斯菲尔德、贝雷尔森等提出“两级传播理论”,及信息流向为“大众传播—意见领袖—一般受众”。该理论中意见领袖作为两级传播的中间层,对舆论传播有非常关键的作用。
传统社会网络分析的意见领袖识别:传统社会网络分析通过网络指标对意见领袖进行筛选和分类。常用的网络指标包括:连接度、关注度、活跃度、影响度、扩散度、中心度、帖子长度、平均路径长度变化等。通过各项指标的综合排序,排序较高者被识别为意见领袖。再根据不同属性指标的排序,可以划分出不同类型的意见领袖。例如,连接度、中心度、平均路径长度和扩散度可以衡量发言人在社会网络中的地位,识别“重要地位人物”;帖子长度、发帖数、点击率和影响度则可以判断“关键活跃人物”;删除现有意见领袖,构建新的社会网络关系,可以识别出“潜在意见领袖”。
动态网络分析的意见领袖识别:动态网络分析不同于传统的社会网络分析,在于它能处理大规模、动态、多模、多边的具有多层不确定性的网络。其整合了元矩阵、多智能体建模和机器学习等方法,可以克服传统社会网络分析的局限性。动态网络分析识别意见领袖的步骤为:模型构建、指标筛选、识别机制建立。模型构建主要是构建元矩阵和多智能体动态行为的规则。该书的案例中,元矩阵包含舆论主体、讨论话题和思想态度三个元素。指标筛选是在建立模型的基础上选择合适的度量指标。动态网络的度量指标非常丰富,常用的指标也多达几十种,因此需要根据研究问题选择合适的度量指标。识别机制构建是通过不同指标的组合,识别出不同类型的意见领袖。本书中的案例通过不同的指标识别了六种类型的意见领袖:焦点人物、传播人物、活跃人物、潜在活跃人物、帖子独占人物和关键词独占人物。
超网络分析的意见领袖识别:该书的案例利用超网络建立了四层结构的超网络模型用以表达舆论的主体联系,包括“社交子网”“环境子网”“心理子网”和“观点子网”。在超网络分析中,意见领袖通过超链路排序算法进行识别。通过对所有的超链路进行排序,找到社交子网中舆论主体形成的所有超链路分值,然后结合节点的超度,可以计算各舆论主体的平均超边分值,得分高者即为超网络中的意见领袖。
(二)舆论传播模型
传统社会网络分析是静态的,无法建立舆论传播模型。动态网络分析给舆论传播模型提供了空间,通过舆论传播模型与动态网络的结合,对舆论传播进行模拟分析。该书以谣言传播为例,介绍了几种模型的应用,包括数学模型、物理模型、仿真模型、多智能体模型、系统模型。其中目前应用较多的是多智能体模型,每一个智能体被视为具有适应性的主体,能够与环境和其他主体交互。在交互的过程中不断地“学习”和“积累经验”,并根据学习到的经验不断改变自身的行为模式。智能体具有自治性、可通信性、反应性和主动性的特征,非常适于模拟舆论传播中的人类行为。通过从微观至宏观的建模,可以模拟和预测舆情动态的发展和演进。
(三)舆论的引导与干预
在识别关键人物和建立舆论传播模型的基础上可以对社会舆论进行引导和干预。
舆论引导:舆论引导主要是通过影响意见领袖使舆论走向往预定的方向发展。对不同类型的意见领袖有不同的引导策略。例如,对于活跃人物(网络中超度值较大的节点为活跃人物),应引导他们发挥表率和示范作用,因为活跃人物的舆论影响力巨大,示范效应显著。而焦点人物(网络中超边重合度较高的节点)一般发帖数量较多,关键词基本一致,得到多数舆论主体的认同和支持,通常为媒体或专业的舆论平台。对于焦点人物,应当引导他们具有更强烈的社会责任感,有助于形成自律机制。
舆论干预:舆论的干预主要需要考虑干预时机、干预方式以及干预强度。目前对于舆论的干预通常是待舆论发展到一定程度,再进行干预,具有显著的滞后性。而舆论事件通常是在造成重大影响前进行干预才具有较为理想的效果。动态网络结合舆论传播模型可以对舆论的动态发展进行分析预测,对舆情事件进行预警,从而较为准确的把握舆论干预时机,在舆论发展初期进行有效控制。干预方式主要是通过主流媒体、互联网、移动端等渠道对舆论网络输入正向信息,改变舆论的环境,推动舆论向正向发展。干预的强度需要针对网络主体的心理和对事件的反映情况,其强度需要足以改变主体对舆论的心理,使主体的态度起到变化。超网络模型可以计算网络主体的心理变化情况,为干预的强度提供定量依据。
六、结语
《社会舆情的网络分析方法与建模仿真》一书向读者展现了新兴的网络研究方法的理论框架、分析工具及在社会舆论管理实践中的强大作用。这是一种典型的“自然与社会”交叉的研究方法,以传统自然科学研究中的网络分析、模型构建、仿真技术为手段,研究社会舆情这个复杂的社会科学问题。同时,这也是一种从微观颗粒度出发的研究方法,关注到每一个发帖者、每一篇文章、每一条回复甚至每一个关键词,挖掘其背后的潜在关系并推导出宏观舆情的发展规律。因此,本文称其为“分子”级的社会科学研究方法。网络分析法,特别是动态网络和超网络分析赋予了社会科学研究一个强大的“显微镜”工具,可以把宏观的社会科学问题做微观的剖析,为社会科学的研究提供了一种全新的视角。
然而这种新兴的研究方法也存在很多方面的不足与局限性。首先,社会科学的问题相对较为复杂,一个问题中可能存在成千上万种特征参数,然而在构建模型的时候无法纳入过多参数,会损失大量的信息,有可能造成结果的失真。另一方面,虽然目前的研究已经进行了一些微观层面的剖析,但研究中的个体在网络分析中仍然是比较抽象的“点”。类似几何中的“点”是没有大小没有面积的抽象概念,本书中网络中的节点(即社会舆论中的个体)也是没有特征和实体的一个抽象模型。而实际世界中的个体并不仅仅是网络发言的一个ID,他背后有丰富的特征,比如年龄、性别、教育背景、经济条件甚至社会网络。基于此可以塑造一个丰富立体的而不仅仅是概念性的个人模型,并且进一步挖掘出更加有价值的信息,对舆情问题有更加准确地分析和预测。如果以自然科学作为对比,可以形象地说目前网络分析的方法达到了“分子”级的精度,但还没有达到“原子”级的精度。
现代信息技术给研究方法的发展带来了新的机遇。大数据、机器学习、模式识别、物联网、人工智能、云计算等技术的出现为针对微观个体的研究提供了有利的工具。伴随信息技术的快速发展,近年来越来越多微观化、动态化、智能化的社会科学研究方法不断涌现。虽然目前的网络分析方法还存在很多方面的不足与局限性,但其仍然具有一定的创新与前瞻性。沿此方向不断探索,社会科学应当像自然科学一样,能够实现宏观到微观的突破和质变,届时社会科学研究将迎来一个崭新的时代。
参考文献
Bohannon,J.2009.Counterterrorism's New Tool:‘Metanetwork’ Analysis.Science325(5939):409-411.
Carley,K M.2002.Smart Agents and Organizations of the Future. Handbook of New Media12:206-220.
Nagurney,A,and J Dong.2002.Supernetworks:Decision-Making for the Information Age76(2):93-95.
Wasserman,S,K Faust.1994.Social Network Analysis:Methodsand Applications.Cambridge University Press.
刘怡君,李倩倩,马宁,等.社会舆情的网络分析方法与建模仿真[M].北京:科学出版社,2016.
王志平.超网络理论及其应用[M].北京:科学出版社,2008.
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。