朱海松
中国传媒大学沈浩教授制作的杜蕾斯官方微博传播路径图——“上帝的指纹”,笔者在《从杜蕾斯官方微博的可视性路径图看微博的碎片化传播》一文中曾有过深入探讨,该图是混沌分形图,具有无标度和自相似的特点,同时该图也清晰地呈现了幂律的长尾特征。微博的碎片化传播是在复杂网络中推进的,本文进一步探讨分布复杂网络的幂律空间结构在微博传播中的特点。
复杂网络的空间分布:幂律
在随机网络思维的统治下,如果将节点随机连接起来生成一个网络,则所有节点的度数都会差不多。同样的,网络中也不会有中心节点和小的集群。对网络访问量做大量统计实验之前,科学家预测,连接数应当服从泊松分布或正态分布,即每个网站的被访问量差异不会太大。钟形曲线也被称为正态分布。正态分布有特定的尺度。在正态分布中,平均值同时也是频率最高的值,然而,实测结果推翻了这个预测。网页的度分布是无标度而不是钟形曲线。网络科学家发现,他们研究过的自然、社会和技术网络中,大部分都具有这些特征:高度的集群性、不均衡的度分布以及中心节点结构。这些特征的出现显然不是偶然的。
美国复杂网络科学家巴拉巴西的研究小组设计了一种软件,可以从一个节点跳到另一节点,收集并记录网上的所有连接。在对几十万个节点进行统计之后,发现了令人惊异的结果:当绝大多数网站的连接数很少的情况下,却有极少数网站拥有高于普通网站百倍、千倍甚至万倍的连接数。在互联网中,其结构也是被一些高度链接的中心节点所主导,如新浪、网易、腾讯等,中心节点的存在颠覆了网络空间是平等的幻象。中心节点的存在使网络呈现小世界的特点,而中心节点和众多节点之间的链接,为网络传播系统中任意两点创造了传播路径。
随机网络的度分布是泊松分布,度值比平均值高许多或低许多的节点,都十分罕见,是一种高度“民主”的网络,而无标度网络的度分布则是幂律分布,节点度值相差悬殊,往往可以跨越几个数量级,是一种极端“专制”的网络,二者之间有本质的区别。在过去的40多年里,科学家们一直想当然地认为现实中的网络都是随机的,但无标度特性的发现打破了这种构想。
但是互联网中到底是什么机制,使它偏离了随机网络的平均主义预言呢?
1999年,巴拉巴西小组发现无处不在的中心节点具有等级差别,并且符合幂律。在微博中,一位新浪注册账号叫“琢磨先生”的用户,把微博形象地分成了九个层级:“微博的层级:第一层牢牢地掌控在娱乐明星手里。第二层被各行业的领袖投行的教父及明星经济学家占据。第三层被营销账号占领,是各山寨水军聚集的地方。第四层是各种情调的小资活跃的地方。第五层多为明星企业的中高层。第六层为草根领袖。第七层为资深草根。第八层为草根。第九层则是受苦受难受迫害的群体。”
所谓等级差别是指许多节点仅有几个链接,少数几个中心节点拥有众多的链接,缓慢降低的幂律分布很自然地能和高度链接的中心节点结合起来。无标度网络一定遵循连接度幂律分布。
幂律是指在网络中随机抽取一个网页,它刚好会有某个数目的进入或者发出的超链接的概率,与它所拥有的超链接的数目,两者是满足乘方关系的。网页的入度分布大致是:入度为k的网页数量正比于1/k2。即“指数为-2的幂律分布”。
在连续的等级分布中,无法找到一个特定的节点,说它能代表其他节点的特性。这样的网络不存在内在的尺度。因此,巴拉巴西研究小组把符合幂律分布的网络称为“无标度”网络。“无标度”通俗的解释是说,用我们熟悉的普适标准尺度无法测量,可以理解为无标度。这里所说的“我们熟悉的”是指我们已习以为常的欧几里德空间,我们日常生活的空间,只要有空间,就有测量,就有测量的标准和尺度,在欧氏空间中我们最熟悉的普适标准尺度是以两点距离为基础的“米”,以此为基础建立的标度体系成为我们习以为常的东西。但真实的空间并不仅仅是我们眼前所见的欧式空间,还有毫斯道夫空间、希尔伯特空间、混沌分形空间,复杂网络所存在的空间,是非欧几里德的混沌分形空间,这样的空间是无标度的。
幂律告诉我们,网络的连接与尺度没有关系,无标度网络没有“特征尺度”。无标度的英文叫Scale-Free,其中Scale是刻度、标尺的含义,Free是自由的、什么都可以的意思,其潜在的意义是说,如果是任何标度或刻度都可以的话,那么就跟没有标度是一样的!
无标度网络有4个显著特征:
1、相对较少的节点具有很高的度(中心节点);
2、节点连接度的取值范围很大(度的取值多样);
3、自相似性能;
4、小世界结构。所有的无标度网络同时也具有小世界特征,但不是所有小世界特性的网络都是无标度网络。如果幂律分布的网络是这种无标度,那么是否有新的测度来测量这类网络呢?答案是有的,这就是分维度。幂律分布的复杂网络系统具有标度不变性和自相似特点,即网络结构是“破碎”的分形结构。
无标度是复杂网络混沌本质的反映
幂律的曲线像一条长长的尾巴,在幂律分布的网络中缺乏峰值,说明在真实网络中,不存在带有普遍性的典型节点。这种“长尾”分布表明,绝大多数个体的尺度很小,而只有少数个体的尺度相当大,这种分布的共性是绝大多数事件的规模很小,而只有少数事件的规模相当大。
无标度性是“蝴蝶效应”产生的属性。我们所讨论的网络传播实质上是探讨复杂网络传播的规律,互联网与移动互联网为一个无标度网络,则网站、博客、网友等均是网络中的节点。网友从数量上占网络中结点的绝大多数,但它们仅与网络中少数的网站或社区相联系,因此是属于分散节点,而门户网站尽管仅占少数,但它们却与网络中大多数节点相联系,因此属于无标度网络中的集散节点。
2012中国网络科学论坛上,复旦大学电子工程系李翔教授在其名为《籍有限的无线记录探究人类集群动力学》的演讲中谈到,人类集群事件研究的重要性;人类动力学;在演讲中他提到复旦大学wifi集群的研究实例,研究事件交互和时间演化;通过WIFI的行为数据记录反向记录人的活动行为,发现社会关系。他特别提到了美国复杂网络学者巴拉巴西团队通过研究手机的行为数据发现:93%的人的行为可以预测!
网络家瓦特于2007年在《科学(Science)》杂志上发表的一篇题为《21世纪的科学》的文章的主旨就是:如果处理恰当,关于在线通信和交互的数据有可能对于我们理解人类集群行为产生革命性的变革随着手机、GPS和Internet等能够捕捉人类通信和行踪的电子设备的日益普及,我们最有可能在真正的定量意义上首先攻克的复杂系统可能并不是细胞或Internet,而是人类社会本身。
微博粉丝规模的度分布
中国微博流传着这样的说法:“粉丝超过一百,你就好像是本内刊;超过一千,你就是个布告栏;超过一万,你就好像是本杂志;超过十万,你就是一份都市报;超过百万,你就是一份全国性报纸;超过千万,你就是电视台;超过一亿,你就是CCTV了。”
许多做网络公关的公司发现,微博上的意见领袖具有惊人的人气。只要“掌握”住了20%的知名博主,就可以“控制”80%的流量,对舆论有巨大的影响。如果微博作者提出的主张得不到粉丝的支持或重视,它的信息传递就会戛然而止,在粉丝的页面中被沉没下去;但信息一旦获得粉丝的认可,他们就会拼命地转发,形成信息流瀑,产生病毒式传播,这种模式被称为混沌分形的“蝴蝶效应”。
产生蝴蝶效应的机制与复杂网络的幂律分布相关,微博博主与被关注粉丝量的分布呈幂律分布。微博上的连接有两种:入连接(被关注)和出连接(关注)。如果我的微博关注了你的微博,而你却没有关注我,则我有一个出连接而你则有一个入连接。我们可以将微博的入连接数量(被关注量即粉丝)称为微博的入度(in-degree),这一定义是从通用的网页的入连接数得到的。一些网络学家通过采样和巧妙的网络爬虫(Web-crawling)技术得到了近似结果。
研究者发现网页入度分布可以用非常简单的规则来描述:具有某一入度的网页数量大致正比于入度数平方的例数。如果用字母k表示入度,则:入度为k的网页数量正比于1/k2。这个规则实际上只适用于入度(k)为数千或更大的情形。该规则同样适用于微博,即具有某一粉丝规模量(入度)的微博数量大致正比于粉丝数(入度)的平方的倒数。不同规模微博粉丝数的分布具有无标度分布和自相似结构特点,实际这种结构是分形的!分形结构是产生混沌的蝴蝶效应的重要条件。
北京师范大学的狄增如教授在其“社会网络的空间结构”的演讲中提到,网络空间分布是幂律的,不同的幂律指数取决于空间优化的条件,网络产生涌现性是相互作用的结果,网络是产生相互作用的基本结构。他指出距离并未死亡,互联时代社交网络和地理空间中距离的关系相似,并提到了“信息熵”在社会网络空间中的作用。
为了更清楚地看到千万级、百万级和十万级粉丝博主的空间分布规模,现把纵轴定为微博粉丝数,横轴为具有相应粉丝量的微博博主,根据微博的幂律分布特点,可以想象到,不同级别的粉丝规模,微博博主的分布应是呈现幂律分布的,也就是人们常说的长尾效应。不同规模的分布是一样的,被称为是自相似的,因为不管在哪种粉丝尺度上进行绘制,形状都是一样的。说得更专业一点,就是“在不同尺度下具有不变性”。这就是无标度一词的由来。自相似这个词与分形有关。
长尾理论是网络时代兴起的一种新理论,由美国人克里斯•安德森提出。长尾理论认为,由于成本和效率的因素,过去人们只能关注重要的人或重要的事,如果用正态分布曲线来描绘这些人或事,人们只能关注曲线的“头部”,而忽略了处于曲线“尾部”、需要更多的精力和成本才能关注到的大多数人或事实。而在网络时代,由于关注的成本大大降低,人们有可能以很低的成本关注正态分布曲线的“尾部”,关注“尾部”产生的总体效益甚至会超过“头部”。即众多小市场汇聚成可与主流大市场相匹敌的市场能量。安德森认为,网络时代是关注“长尾”、发挥“长尾”效益的时代。安德森的《长尾理论》主要谈的是:如何在信息化的网络时代低成本、大规模、高质量地满足个性化需求。这里要强调的是,在商业上电子商务不仅仅是网络零售,B2C(Business To Customer)的商业模式是传统工业经济时代大规模、流水线、标准化、低成本的运作模式,“长尾理论”告诉我们的是未来真正的商业模式应该是C2B(Customer To Business),如何让目标消费者自己主动找到需要的个性化服务和产品才是数字时代面临的商业挑战。本质上,长尾理论是对复杂网络幂律特点的通俗解释。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。