网络论坛舆论领袖筛选方法初探
陈 然
作者简介 陈然,华中科技大学新闻与信息传播学院传播学博士生,黄冈师范学院新闻与传播学院讲师。E-mail:chenranlc@163.com。
摘 要 随着互联网对人们生活的逐渐渗透,作为一种显性的力量,网络舆论领袖对现实社会的影响力日益增强,不同学科背景的研究者为了不同的目的对其展开了研究。无论对舆论领袖进行哪方面的研究,准确识别舆论领袖都应该成为首要的工作。然而,目前已有研究中尚未形成一致的筛选网络舆论领袖的方法。因此,本文首先梳理了目前几种主要的网络舆论领袖筛选方法:自我报告法、简单统计测量方法、网络分析方法、影响力扩散模型和运用PageRank思想的筛选方法。然后,以天涯社区天涯杂谈版块为例,结合网络论坛的特点,总结出识别论坛舆论领袖的四个基本原则:①应该根据研究目的和研究对象来选择适当的筛选方法;②应该考虑参与者不同的兴趣空间;③应该考虑参与者的受关注程度和主动性;④应该考虑回帖者的影响力大小和褒贬态度。
关键词 网络论坛,舆论领袖,筛选方法
一、引 言
“舆论领袖”(opinion leader)的概念最早由美国传播学者拉扎斯菲尔德(Paul F.Lazarsfeld)等人在《人民的选择》(1944)一书中提出。拉扎斯菲尔德等人通过对美国1940年总统选举时选民投票意向的研究,提出了两级传播理论,同时发现了在人际交流中对他人态度产生影响的舆论领袖。之后的几十年,舆论领袖的概念在创新扩散、传播研究以及市场研究的文献中一直占据着重要的位置。今天,随着互联网对社会政治、经济、生活各个领域的日益渗透,越来越多的人习惯于借助论坛、博客等网络平台交流心得体会、参与公众话题讨论。在网络传播的过程中,舆论领袖作为一种显性的力量,在社会舆论形成过程中发挥着不可忽视的作用,影响力直接渗透到现实社会。有关网络舆论领袖的研究也逐渐受到业界和研究学者的重视。
然而,目前针对网络舆论领袖的研究显得比较杂乱,学者们的看法和观点也存在不少分歧。如高俊波、杨静(2007)利用论坛帖子间的回复关系构建出社群网络,通过对社群网络平均路径长度的分析,找到代表舆论领袖的关键结点,并发现舆论领袖都是网络群体中的核心人物,其发帖往往能够引起论坛成员的广泛关注,同时也积极回复其他成员的帖子,知名度很高。而余红(2007)在利用影响力扩散模型识别出论坛活跃分子之后,根据声望值高低筛选出的舆论领袖表现出较低的中心性和中介性,其并非社会网络中的明星人物。学者们观点的差异,原因之一就在于目前已有研究中尚未形成一致认可的筛选网络舆论领袖的方法。而无论对舆论领袖进行哪方面的研究,准确识别舆论领袖都应该成为首要的工作。因此,本文试图在总结现有网络舆论领袖筛选方法的基础上,结合网络论坛的互动特点,提出筛选论坛舆论领袖的基本原则。
二、现有网络舆论领袖筛选方法
1.自我报告法
自我报告法是一种传统的舆论领袖识别方法,通常使用舆论领袖量表让受访者进行自我判断和回答,然后按一定比例二分舆论领袖及其跟随者,或将得分在某个阀值之上的人认定为舆论领袖。研究者通常利用三种方法获取资料:网下发放问卷、网上发布问卷以及网上和网下调查相结合。因自我报告法由来已久,目前采用这种方法识别网络舆论领袖的研究多沿用传统舆论领袖测量量表。例如,林建邦(2004)在以病毒行销的观点探讨如何让电子邮件成为更具爆炸性的传播工具时,通过网上问卷调查,参考Childers(1986)舆论领袖量表,取总分前30%的受访者作为舆论领袖。Barbara Lyons等人(2005)在探讨网络舆论领袖及其跟随者使用电子商务的差异时,通过网下问卷调查方式,使用Childers(1986)量表将样本二分为舆论领袖及其跟随者,舆论领袖被指定为得分等于或高于平均值(3.07)的受访者。Young K.Sohn(2005)在比较线上、线下两种环境中舆论领袖和寻求意见者的行为和特征的差异时,通过网上问卷的方式,采用Flynn等人(1994)量表来测量网民的舆论领袖特征以及寻求意见的水平。
自我报告法具有操作方便、容易实现的优点,然而它的有效性也一直被许多研究者所质疑。自我报告法最大的问题就是回答的主观性。心理学研究表明,个人一般比其他人更积极地评价自己。因此,个人可能过高地估计自己对他人的影响,尤其是那些试图寻求社会表扬的人,这样就可能导致一些自认为是舆论领袖的人实际并不是舆论领袖。再者,自我报告法在识别舆论领袖过程中显得过于简单。自我报告法通常依据舆论领袖得分将回答者按照一定比例二分为舆论领袖和跟随者,这种简单的二分法并不能真实地反映网络社会复杂的成员结构。此外,识别舆论领袖的重要目的是为了进一步利用舆论领袖来推动社区发展、促进产品推广或进行舆论引导,然而自我报告法所识别出来的仅仅是人们自认为的舆论领袖心理特质得分较高的人,缺乏网络社会互动信息,不利于后续的研究。
2.简单统计测量方法
简单统计测量方法指利用网络数据海量丰富以及获取方便的特点,对某些代表舆论领袖特征的指标进行简单的统计分析,以此实现筛选的目的。J.Rhee等人(2007)在对网络政治讨论中心讨论者的社会政治特征和个人差别进行考察时,根据注意力和影响力两个指标,将在线参与者分成舆论领袖、安静的说服者、注意力收集者以及一般公众四个群体。舆论领袖被定义为受到其他讨论者注意,并且对其他讨论者实施影响的一群人。讯息的浏览量被用来作为衡量注意力的指标,平均值作为区分高低注意力收集水平的标准。影响力利用讯息获得的积极反应的数量减去消极反应的数量来测量。Nohil Park等人(2008)为了识别公共关系中有影响力的博客,使用了一个PIIPM模型,通过调查问卷(量表)测量博客的公共问题参与行为和传播行为,以此为指标识别舆论领袖,然后使用博客声望和发起公共讨论的行为两个指标来证明模型的有效性。公共问题参与行为指博客中涉及的是私人问题还是公共问题。同时,该研究认为,在线舆论领袖应该是积极实施政治参与的行动者和积极表达自己政治观点的媒介使用者,因此将积极的讯息生产作为判断传播行为的指标。
简单统计测量方法操作简单,对研究者的统计知识要求不高,然而这种方法仅仅通过统计论坛成员或博客的基本特征信息来识别网络舆论领袖,忽视了个体发挥影响力的生存环境以及其社会网络关系。另一方面,用来识别舆论领袖的指标也表现出研究者主观判断的特点,影响了舆论领袖筛选的准确性。例如,仅仅将讯息的浏览量作为衡量发帖者受到关注的指标,忽略了讯息本身的吸引力。
3.网络分析方法
网络分析是基于社会关系的一种定量分析方法,利用网络分析方法来识别舆论领袖,首先需要收集基于关系的二元属性数据,目前所采用的方法主要有两种:调查法和内容分析法。调查法是通过调查方法(如调查问卷)询问成员间的关系,如询问“你和谁来往最密切?”“你认为谁最有威望?”等问题,让被调查群体中的每个成员都填写问卷,然后计算每个人被选择的次数及选择他人的次数,得出关系属性数据。内容分析法是直接利用网络交往过程中存储的信息,如发帖、回帖数量、强度、方向等情况来构建成员间的关系属性数据。无论采用哪种数据收集方法获得的数据,最终都要转化为网络分析软件可以接受和处理的数据格式,最后利用网络分析软件进行分析。网络分析一般通过计算成员的外向程度中心性(outdegree centrality)、内向程度中心性(indegree centrality)和中介性(betweeness)等指标来识别舆论领袖。例如,Nancy Baym(2000)对一个肥皂剧新闻组虚拟社区进行研究时,利用问卷调查要求成员指出社区的舆论领袖,研究发现,发帖多的社区成员很容易被认定为舆论领袖。高俊波、杨静(2007)以在线论坛为研究对象,建构一个以论坛作者为节点,他们之间的回复关系为边的社群网络,发现其具备小世界网络的特征,然后通过比较原有的社群网络CN的平均路径长度L与没有第i个节点的社群网络CNi的平均路径长度Li,来找到代表舆论领袖的关键结点,L-Li值最大的为舆论领袖。项方产(2007)在挖掘基于通信关系的意见领袖时,按照通信关系网的性质,将规模巨大的网络使用层次聚类方法划分成可分析的通信子网,然后利用最短路径计算得到密切度和中间度,再结合节点广泛度计算综合中心度,以综合中心度判断意见领袖节点。
利用网络分析方法识别舆论领袖具有独特的优势。首先,从网络分析的观点研究个体行为,保留了个体间互动模式的完整性,能够从原本的社会关系结构中分析出个体所处的结构位置、关系以及互动模式。同时,各种各样的用来显示传播关系的社会网络图,能够直观地反映网络中的各种社会关系。另外,网络分析是建立在非概率方法的基础上的,它的数据不是由样本的随机选择获得,而是通过最大甚至是全部的群体成员获得,因此能够提供更正确和更真实的分析。然而,网络分析方法最大的问题就是基于社会关系的这种定量分析方法往往忽视了成员间信息交流的内容。
4.运用影响力扩散模型的筛选方法
影响力扩散模型最初由日本学者Naohiro Matsumura等人(2002)在“Influence Diffusion Model in Text-Based Communication”文章中提出。该模型认为,在基于文本的计算机中介交流环境下,人们通过发表主帖或回帖来表达观点,词语是组成帖子的基本单位,论坛交流通过词语来表达和传播,论坛对话链体现影响力的传递结构。影响力扩散模型筛选舆论领袖的具体做法为:如果Cy回复Cx,则认为Cx影响Cy,影响力通过对话由Cx传递给Cy,将Cx对Cy的影响用字母ix,y表示,ix,y=|wx∩wy|/|wy|。假设Cy回复Cx,Cz回复Cy,那么Cx对Cz的影响力用ix,z表示,ix,z=(|wx∩wy∩wz|/|wz|)×ix,y。在该模型中,帖子影响力是一个讨论串中,某帖对其下游所有跟帖的讨论内容所产生的影响;ID影响力是在一段时期内某ID所发全部帖子(主帖或回帖)的影响力之和;高影响力的ID被认为是舆论领袖。此模型提出后引起了国内外许多学者的关注。Joo Young Lee等人(2004)认为,舆论领袖能够提供吸引人的话题来促进社区的繁荣,因此将影响力扩散模型应用到韩国一个分享全世界科学家和工程师知识和信息资源的社区,试图识别舆论领袖并刻画舆论领袖的特征。余红(2007)认为,该模型测量的是能够激发论坛讨论气氛、发帖积极的活跃分子,因此在针对网络时政论坛舆论领袖进行研究时,首先根据影响力扩散模型计算出论坛参与者的影响力,然后根据声望值的高低使用聚类分析从活跃分子中筛选出真正的舆论领袖。石矛等人(2008)认为,影响力扩散模型中公式的分母项导致了最终影响力的计算失误,而分母项对影响力的计算又没有实际意义,因此主张通过省去公式中的分母项来改进影响力扩散模型的算法。
影响力扩散模型采用严格定量的方式,从网络论坛帖子立体结构和内容相关性两个维度来识别舆论领袖,既重视了网络社会关系,也强调了帖子内容本身。然而该模型也存在着许多的不足。首先,在中文环境下简单地利用BBS中成员言论中的词语传播比率来确定人物的行为是不完善的。中文环境中的发帖行为,词语运用非常丰富,回帖字数有多有少,多数情况下,简单量化计算词语传递的多少很难真正反映帖子影响力传递的大小。其次,影响力扩散模型的有效性也值得商榷。该模型算法假设对话链体现的是一种线性关系,倘若对话链中某帖与其上级帖子无词语交集,即使后面还有很多积极讨论的帖子,但根据模型算法,原帖对它们的影响力为零。另一种情况是,某些ID所发主帖被回帖数量多,根据模型算法很容易被识别为舆论领袖,然而也许此ID的主帖只是转载了媒体的新闻,其实际发言频率低,在影响其他人观点方面并不一定发挥作用。此外,该模型也没有考虑到回复帖子的ID本身所拥有的影响力水平,同一篇文章被不同的人回帖,影响力应该会随着回帖者本身在网络中的地位而有所不同。
5.运用PageRank思想的筛选方法
PageRank(网页排名)是一种由搜索引擎根据网页之间相互的超链接计算的网页排名技术,以Google公司创办人拉里·佩奇(Larry Page)之姓来命名。Google把从A页面到B页面的链接解释为A页面给B页面的投票,一个页面的得票数由所有链向它的页面的重要性来决定。也就是说,在实际计算PageRank值时,除了考虑网页得票数(即链接的纯数量)之外,还要分析为其投票的网页的重要性,一个网页本身的PageRank值越高,则它对其链出网页的推荐能力就越强。同时一个网页的链出网页越少,那么它对其中一个链出网页的推荐程度就越高。也就是说,PageRank还会根据页面链出总数平分一个页面的PR值。目前已有学者将PageRank思想运用到识别网络舆论领袖的研究中。
X.Song等人(2007)运用InfluenceRank(影响力级别)算法来识别博客圈中的舆论领袖,这种影响力级别算法根据两个方面来分类博客:博客在网络中的重要程度;博客提供的信息的新颖度。在测量博客在网络中的重要性时,他们运用了PageRank的核心思想,在评定A博客的影响力时考虑了被A博客吸引的那些博客本身的影响力水平。Zhongwu Zhai等人(2008)在识别BBS中的舆论领袖时,首先提出了两种将用户聚类到不同兴趣领域的算法:基于版块的算法(FieldPR_Board)和基于文章链的算法(FieldPR_ChainCluster),然后将Global-PR算法应用到每个领域。GlobalPR不仅考虑了每个用户的回复数,而且也考虑用户跟随者自身的显著度,实际上GlobalPR就是一个加权的PageRank。其中,基于版块的算法认为在某种程度上,BBS每一个版块就是一个兴趣领域;而基于文章链的算法认为一个用户回复文章链是由于他对文章链中的文章感兴趣,因此可以将文章链作为兴趣领域的基本单位。
运用PageRank思想的识别方法很好地利用了互联网现存的海量信息来挖掘舆论领袖,相比自我报告法等传统方法更具有科学性。这种方法最大的特点是在识别舆论领袖时,不仅考虑了舆论领袖在社会网络中被关注的程度,而且也考虑了跟随者本身在这个网络中的重要性。另一方面,这种识别方法还强调了舆论领袖的跟随者在社会网络中关注的人的数量,因为每个人的精力是有限的,一个人关注的人过多,那么分配给其中之一的关注度也必然大打折扣。然而,这种方法也存在着一定的缺陷,最大的问题就是忽视了文章或帖子的内容。以BBS为例,拥有高回复数的ID并不一定就具有高影响力,不应将用户间的回复关系简单地理解为支持关系。
三、识别网络论坛舆论领袖的基本原则
近年来,随着互联网在中国的日益普及,网络论坛越来越成为中国社会各阶层意见表达、情感宣泄和思想碰撞的重要渠道,植根于中国特殊国情下的中文网络论坛在人们的社会生活中发挥着越来越重要的作用。而在网络论坛影响力的发挥过程中,一个重要群体“论坛舆论领袖”扮演着至关重要的角色。正是由于论坛舆论领袖日益凸显的社会影响力,不同学科背景的研究者出于各自的目的,努力寻找着识别网络舆论领袖的最佳方法。然而,究竟什么才是最佳方法?该部分笔者将以天涯社区天涯杂谈版块为例,结合网络论坛的互动特点,在已有筛选方法的基础上,探讨识别论坛舆论领袖的基本原则。
1.应该根据研究目的和研究对象来选择适当的筛选方法
市场营销以及创新扩散的研究学者筛选舆论领袖,是为了利用他们的人际关系和良好的信誉来推广自己的产品;准确定位舆论领袖是其唯一目的,其研究对象多是产品讨论型论坛以及学习型论坛。而社会学和传播学研究者们筛选舆论领袖,更多的是为了能够正确认识舆论走势,对社会舆论进行引导;研究不仅需要找准舆论领袖,而且需要了解舆论领袖所处的社会网络关系,其研究对象多是讨论社会民生问题的时事论坛和时政论坛。在选择筛选方法时,应该综合考虑研究目的、研究对象以及研究的可行性。以天涯社区天涯杂谈版块为例,作为关注社会民生问题的论坛版块,其讨论的内容具有很强的社会性和新闻性,因此,论坛讨论主题往往变化大,主题众多,内容复杂。识别这类论坛舆论领袖的最终目的是为了进一步了解网络舆论领袖的特征,以利于构建和谐的社会舆论环境,因此,在筛选方法的设计上不宜过于复杂,要便于后续研究。此外,天涯杂谈以广泛的社会批评和文明批评为主要内容,在中文环境中探讨社会民生问题,词语的运用是非常丰富的,简单地量化计算词语传递的多少很难真正反映影响力传递的大小。
2.识别论坛舆论领袖应该考虑参与者不同的兴趣空间
网络论坛参与者之间的互动主要是因为参与者对帖子内容的兴趣,虽然不排除发帖作者自身的魅力,但更多时候,参与者的回复关系是建立在他们对内容的兴趣的基础之上,而不是原发帖的作者。一个论坛涉及不同内容的版块,即使是同一版块也会因为不同的兴趣点而聚集成不同的兴趣空间。因此,识别网络论坛舆论领袖应该首先考虑论坛参与者不同的兴趣空间,然后再在同一兴趣空间中寻找舆论领袖。划分兴趣空间的方法依据不同的研究对象有所区别,对于版块主题非常鲜明的论坛可以直接以每个版块作为一个兴趣空间,例如专门讨论化妆、服饰内容的版块;而对于主题较庞杂的论坛或版块则需要对其作进一步细分。以天涯杂谈为例,虽然版规中注明以社会批评和文明批评作为主要内容,但其主题实际涉及的范围却非常之广,对于这一类论坛版块,就需要划分更具体的兴趣空间。因此,在筛选舆论领袖之前应该先按主题将版块中的对话链进行聚类。
3.识别论坛舆论领袖应该考虑成员的受关注程度和主动性
在网络论坛环境中,由于大量社会线索缺失,论坛参与者的影响力主要来自其在论坛中的文本表现和发帖质量。而另一方面,论坛海量的信息以及按时间顺序排列的特点使得许多主帖回复不多,甚至无人问津。因此,成为舆论领袖的首要条件是参与者发表的言论能否被关注。综合已有研究,笔者认为论坛参与者受关注程度应该从参与者主帖浏览数以及收到的回帖数两个方面进行考察。特定兴趣空间范围内某ID的主帖浏览数的总和很容易通过网站统计数据获得,而参与者收到的回帖数应该被定义为特定兴趣空间范围内,某ID参与的所有对话链中收到的其他ID的直接回帖数的总和。其中参与的所有对话链既包括该ID所发主帖的对话链,也包括参与的其他对话链。不同兴趣空间中,同一ID的回帖数应该分别计算。此外,舆论领袖要对其他人施加影响,仅仅发表主帖而不参与互动交流,是无法影响到人们的观点和意见以至于改变人们的态度的,因此,识别舆论领袖还需要考察参与者的主动性。具体说来,可以从所发主帖数、对外回帖数以及自回帖三个方面进行测量。以往研究一般将自回帖作为影响回帖数统计的因素而加以剔除,实际上,自回帖本身可以成为反映发帖者主动性的一个评价指标。
4.识别论坛舆论领袖需要考虑回帖者的影响力大小和褒贬态度
正如PageRank算法所强调的,在识别舆论领袖时,不仅要考虑每个参与者在社会网络中被关注的程度,而且也应该考虑回帖者自身在网络中的影响力大小。因为一个具有高影响力的回帖者,将拥有更大的号召力和传播能力,能够将被他关注的参与者的观点和意见扩散到自己的交往网络,从而间接扩大该参与者的影响力。同时一个人的关注度是有限的,因此,在具体识别过程中,需要考虑回帖者在论坛中关注的人数,将其影响力按照回复帖子的比重分配给每一位被关注者。另一方面,回帖并不一定代表支持,回复帖中也可能存在许多反对的声音,识别舆论领袖需要考察回复帖具体的内容和态度,仅仅那些支持的回帖才能表明受到了发帖作者的影响。因此,在筛选指标上,应该结合参与者收到的回帖总数,考察回帖者的褒贬态度,也就是支持或反对的态度,将其收到的支持票和反对票分别作为识别舆论领袖的两个指标。
[参考文献]
[1]高俊波,杨静(2007),“在线论坛中的意见领袖分析”。《电子科技大学学报》,2007年第6期。
[2]林建邦(2004),《打个喷嚏大家都感冒——以病毒营销观点探讨电子邮件之散播》。静宜大学硕士观光系论文。
[3]石矛,方勇,曾祥平,王长辉(2008),“IDM模型分析及其影响力改进算法”。《成都信息工程学院学报》,2008年第1期。
[4]项方产(2007),《基于通信关系的意见领袖挖掘与应用》。上海交通大学软件
学院硕士论文。
[5]余红(2007),《网络时政论坛舆论领袖研究》。华中科技大学新闻与信息传播学院博士论文。
[6]Lyons,B.,Henderson,K.(2005).Opinion Leadership in a Computer—Mediated Environment.Journal of Consumer Behaviour,4(5),319-329.
[7]Joo,Y.L.,Yoon,J.S.,Hahn,S.H.(2004).Spotting and Characterizing Opinion Leaders in Cyber Communities.from http://www.vrsj.org/ic-at/pa-pers/2004/Poster_Session/P-049.pdf.
[8]Matsumura,N.,Ohsawa,Y.,Ishizuka,M.(2002).Influence Diffusion Model in Text-Based Communication.Transactions of the Japanese Society for Artificial Intelligence,17(3),259-267.
[9]Park,N.,Jeong,J.,Han,J.(2008,March).Who Are the Power Bloggers as Potential Target Public in PR:Public Issue Involvement-Production of Messages Model.Paper presented at 11th international public relations research conference,Florida.
[10]Rhee,J.,Kim,E.,Kim,H.(2007,May).Exploring Online Opinion Leadership:A Validity Test of the Concept in the Digital Age.Paper presented at the annual meeting of the International Communication Association,TBA,San Francisco,CA.
[11]Song,X.,Chi,Y.,Hino,K.,Tseng,B.(2007,November).Identifying Opinion Leaders in the Blogosphere.Paper presented at The 16th ACM Conference on Information and Knowledge Management,Lisboa,Portugal.
[12]Sohn,Y.(2005).Opinion Leaders and Seekers in Online Brand Communities:Centered on Korean Digital Camera band Communities.Master's thesis,Florida State university,Florida,America.
[13]Zhai,Z.,Xu,H.,Jia,P.(2008).Identifying Opinion Leaders in BBS.Paper presented at 2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology,Sydney,Australia.
The Exploration on Identifying BBS Opinion LeadersChen Ran
Abstract:Today,with the fast development of internet,more and more scholars pay attention to online opinion leaders.However,so far,researchers have not yet formed a consistent method of filtering online opinion leaders.On the basis of summarizing current filtering methods,this article sets out some basic principles of identifying BBS Opinion Leaders.Basic principles are as follows:Should be based on the purpose and object of study to choose the appropriate filtering method;should consider the different interests space of participants;should consider the degree of concerned by others and initiative of participants;should consider the influence and attitude of replier.
Keywords:BBS,Opinion leaders,Filtering methods
【注释】
[1]本次被评价的城市为广州、深圳、珠海、东莞、佛山、中山,调查对象为省情专家库的400多位、涉及各个领域的专家学者。
[2]本文选取重点关注调查的网络论坛主要包括:南方网、奥一网、金羊网、大洋网、21CN、广州视窗及一些广州本地论坛。
[3]刘易斯·芒福德最早提出“大媒介”(mega machine)的概念,林文刚(Casey Man Kong Lum)最早用“媒介”的新形式,界定了芒福德“王者机器”中的“机器”,提出“大媒介”(mega medium),用于解释纽约、北京、上海、香港等大型城市中心。笔者在此基础上,用“大媒介”(Mega Media)解释我们所处的多媒体环境。参见笔者著:《北美媒介环境学的理论想象》,光明日报出版社。
[4]Scavo & Shi在1999年对美国地方政府网站的内容进行的评估研究。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。