奥巴马赢得了这场竞争激烈的大选,这是美国现代选举历史上的一个里程碑。自1940年罗斯福总统以来,还没有哪位在任总统在失业率高达7.9%的情况下赢得连任。他改写了过去70年失业率高于7.4%时白宫必定易主的历史,也成为第二次世界大战结束以来第二位赢得连任的民主党籍总统。
那么,是什么原因使奥巴马反败为胜,成功连任的呢?其秘密就在于大数据技术与大数据思维的运用。
就在美国总统奥巴马成功击败罗姆尼,再次赢得美国总统选举的当天,《时代》杂志登载了一篇文章,描述了奥巴马在民调落后罗姆尼的情况下获胜背后的秘密,这就是数据挖掘。数据是能够最后击败罗姆尼的核心优势!
从美国历届总统选举来看,在奥巴马获胜前的70年时间里,没有一名美国总统能够在全国失业率高于7.4%的情况下连任成功。另外,美国历史上总统选举还有一个铁律,就是谁筹的钱越多谁胜出可能性越大、谁花的钱越多谁就会赢。奥巴马在整个竞选过程中的花销不到3亿美元,而罗姆尼花了近4亿美元却仍然败选;奥巴马最终以344票赢得选举,高出罗姆尼一百多张选举人票,而在大选前一周的一项民调中显示,55%的被调查选民都认为罗姆尼比奥巴马更具有领导力。但这些都被选举结果所颠覆。
原因在于奥巴马团队从三个最根本的目标进行数据挖掘,这就是让更多的选民掏更多的钱,让更多的选民投票给奥巴马,让更多的选民参与进来!在锁定目标之后,他们对选民需求的分析从“微观”层面进行数据的挖掘、汇集,从而确定竞选攻势的方向:每个选民最有可能被什么因素说服?每个选民在什么情况下最有可能掏腰包?什么样的广告投放渠道能够最高效获取目标选民?一句话:草根阶层的票仓是扭转不利选情的关键所在。
经过分析,奥巴马团队制定了相应的竞选策略,从而赢得了大量草根阶层选民的支持和捐赠,一项民调显示,80%的美国选民认为奥巴马比罗姆尼让他们感觉更加重视自己。结果是,奥巴马团队筹得的第一个1亿美元中,98%来自于小于250美元的小额捐款,而罗姆尼团队在筹得相同数额捐款的情况下,这一比例仅为31%。虽然,奥巴马团队所获得筹款落后罗姆尼,但是,所获得的选票却反超罗姆尼。
总统选举中“微观智能”的运用靠的是什么呢?靠的就是数据。正如竞选总指挥吉姆·梅西纳所说的那样,在整个这次总统竞选活动中,没有数据做支撑的假设很少存在。奥巴马团队运用数据挖掘技术在美国政坛上取得的胜利,告诉了我们一个不争的事:今天,我们已经进入了一个“微竞争”的时代,在激烈的选举过程中,如同在市场中竞争一样,谁能够深入了解他的每一个用户的个性化需求,谁就能在竞争中击败对手,获取胜利。而奥巴马团队正是在数据挖掘的基础上满足了选民个性化的需求,从而赢得总统大选的。
2012年《自然》杂志上的一篇论文提出这样一个观点,社交网站上的用户在政治倾向上,会受到自己网络好友的影响。对于争取那些还没有决定要投票给谁的选民来说,这一点尤为重要。识别用户之间的社交关系,带动那些摇摆者投向某个方向,也是重要的竞选策略。深根分析公司的大卫·西赖特说:“我们的市场随时有新的数据来源加入。如果我们能够利用社交媒体数据来更好地理解人们消费方式、人们与社交媒体的连接方式,这将会更有价值。”因此,不同竞选团队所依赖的数据来源不仅仅是民意调查结果,还涵盖了诸多社交网站和公开及私有的数据库。及时收集这些数据,并且帮助制定策略以获得更多选民的技术,成了两党候选人的重要武器。
在整个的竞选中,奥巴马团队的广告费用花了不到3亿美元,而罗姆尼团队则花了近4亿美元却落败,这是因为在本次竞选中,奥巴马团队的投票动员绝不是千篇一律的,对于不同的用户,他们动员的渠道及采取的互动方式都因人而异。奥巴马数据分析团队清楚了解选民的心理,知道如何与选民进行个性化互动,特别是广告购买的决策,是经过缜密的数据分析之后才制定的,即通过复杂的数据建模来找到目标选民。
掌握目标选民的投票倾向是赢得选举的关键,这应该归功于奥巴马竞选团队数据挖掘工作。他们曾发布一款名为“Obama ForAmerica”的手机应用程序,可以迅速了解选民及其周围邻居的政治立场,进而作出是否需要花精力去进行动员和游说的选择。
奥巴马竞选团队数据挖掘工作,主要是从三个方面进行。
首先,收集和整理历届美国总统选举的数据。在这样一个枯燥冗长的过程中,重要的是既分析民主党选民的倾向,巩固票仓,又要掌握共和党选民意愿与民主党竞选纲领重叠的数据覆盖,也就是选民的“灰色地带”,做到“知己知彼”。其实,奥巴马就任第45任总统之时,就已经开始做连任的谋划。他的数据团队在下一届总统竞选前两年就已经在做数据的收集工作。他们将民主党所有各自独立零散的选民数据库汇总在一起。也就是将那些分散在各地的服务器、各种文件、各种存储器中的数据进行有效的集中存储和格式清理,做到“胸中有数”。
其次,就是在“精准”数据的背后挖掘其关联性的规律。机器学习是数据挖掘中常用的方法,它的基本原理是让计算机从历史数据中“学习”规律,并利用该规律对未来数据进行预测,从而为数据建模和预测提供路径。不同的选民数据有不同的类别和数据库,且每一组数据中都会有自己独特的数据模型。比如,奥巴马的数据分析团队对每一个群体的选民都进行建模,进而预测他们的选举倾向和捐款行为方式(通过网络捐款,还是汇款)。
最后,选民数据模型需要根据实际情况进行动态调整。选民因环境、喜好或其他因素常常会导致其行为规律发生一定的变化,使得其产生的数据也随之变化,这些变化将会影响数据模型的预测的精准性。因而,奥巴马数据分析团队需要随时动态地去调整模型中的数据构成。比如,在关键的“摇摆州”俄亥俄州,数据分析团队获得了约2.9万人的投票倾向数据。这是一个包含1%选民的巨大样本,使他们可以准确了解每一类人群和每一个地区选民在任何时刻的态度。当奥巴马与罗姆尼第一次电视辩论结束后,选民的投票倾向发生改变,数据分析团队立即将分析的数据传输到竞选总部,使奥巴马的竞选班子在第一时间就知道什么样的选民改变了态度,什么样的选民仍坚持原来的投票选择。
奥巴马赢的是选举,而不是赢得了民心,是利用数据“抓住”了民心,更确切地说,不是奥巴马赢得了选举,而是“大数据”赢得了选举。
正如谷歌“新闻实验室”的负责人史蒂夫·格罗夫说:“关注在哪里,政治家就去哪里。”
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。