金融行业好像不满足于从不公平的资本市场榨取钱财的数据分析系统原有的高端性能,打算在大数据第二波的商业化浪潮中提取我们的个人数据。金融企业知道,在个人数据中隐藏着信息,可以借此继续将利润最大化。我们已经记录下向个别消费者宣示的第一步行动,如同对待一只成熟的柠檬,插手其自治与未来,使其发展的机会受到强有力的限制。这里星球改造得以继续,并产生了巨大的差异,无论人们监控、分析和操纵的是股票的行情或者一个人。全球金融市场的星球改造隐藏着高风险,使用在人身上,是一种对他的自治的侵犯。因此并非智能机器或者技术导致这个问题。以利润最大化的名义,所有羞耻的界限在银行和其他大数据分析的获益者的身上失守。
世纪之交,德国南部有一个州的刑事侦查局跟踪过一个新项目,借助新式的数据分析系统对分配给不同警察检查的、尚未联网的数据库加以充分利用,验证不同的假设。例如:“毒品交易中心由A城市转移到B城市”,利用的方法之一是网络分析(Netzwerkanalyse)。虽然可以首先参考用于网络分析的结构化数据,但是在警察系统中却关系到新型的数据融合的先驱。除了量化的数据之外,还考虑了任意的文本和频繁的传真。人们在不同的警察检查数据库上提取,对其中的刑事罪犯、犯罪行为和犯罪前科进行分析:X先生受到过拘留吗?如果是,为什么?谁是X先生,他和谁是亲戚或者朋友关系?有人在“组织化犯罪行为”科提出类似问题,并对分散在联邦州的各不相同的数据分析评估。此外确定,谁是谁,并不始终平常,尤其当不涉及德国人的姓名时,姓名的写法都可能差异极大。毕竟该系统确定,毒品交易真得推迟了,并非空间上的,而是从一个族群转移到另一个族群,从中可以确定,根据名字被识别的人物。但是警官们有一个完全不同的问题:当原始数据在其数据库失效时,将会发生什么。然后有人必须把它们从警察办公场所的数据库中删除。那么,需要把新获得的信息“X先生属于毒品交易的幕后策划者小组”继续存储吗?人们做出了相反的决定。如果与个人相关的数据过时,比如删除其前科,那么每种以此为基础的其他信息也必须删除。如果原始数据基础变得对他有利,X先生未来也不会出现在毒贩名单上。数据删除系统在项目结束时成为了整个系统最昂贵的部分。
尽管没人愿意在一个警察系统中被重新找到,与一家银行的网络分析相比也许是一个更小的弊端。在国家机构中访问个别公民的私人空间要依法执行,目前存在数据保存期限的规定或者删除规定。但是在一家私人银行情况又会是怎样呢?其数据分析涉及没有法律约束的空间。没有东西得到处理和存储,我们与谁通过互联网相连,我们从事哪些活动或者我们拥有哪些优先权,简单和诱人。当诸如Facebook这类公司开展其商业模式时,也许把用户的私人数据卖给第三方,完全违背社交网络确保的用户数据不公开原则。这些让若干Facebook的用户感觉太离谱了。众所周知,2014年,美国发起了对社交网络的集体诉讼,指控它们违背了私人电子交流的不伤害权利。17“Facebook系统化地伤害了消费者在私人领域的权利,因为它传阅私人用户的信息,而没有得到用户的同意。”指控如是说。广告说,Facebook的私人空间是史无前例的,这本来就是一个谎言吗?申诉者继续说,从对私人信息的监听得出的认识变卖给第三者。属于对私人用户数据感兴趣的获益者还有银行,可以通过用户的活动了解他们客户的朋友群和家庭成员,比如用以下问题打听:您有太太和孩子吗?一幢房子吗?或者您要去度假吗?当银行用这些数据计算预测出您的家政金融需求的规模,那么这种举动也许对你算是小恶心,您也许会认为银行给您的信贷额度的前瞻性报价非常符合实际。当银行机器评估分析您的私人数据之后确定的内容使您不再具有良好的信誉呢?您的金融需求、投资愿望的预测,这些是奖章的一面;预告,人们何时更喜欢与您这位客户告别,这是事物不利的一面。您随后能够买得起这辆前往工作地的汽车吗?或承受得起搬到居住在您工作地更近地方的费用吗?而且您自己的企业前景如何?您在金融上站稳脚跟了吗?银行想要的东西是您期待东西的预期,为了增加您自己的盈利和防止您的信贷风险,银行也许与您都赞同这些。
未来一家银行的预测应该决定我们个人发展的机会,这似乎并不是一个令人不安的设想。设想一下,如果银行预言不准确,我们的未来会发生什么——您会想起错误编程的糟糕软件或者是其不透明的问题——可能更令人不安。而且信息删除以及您生活的重新计算该怎么办呢?如果它得不到持续更新,某个时间就会发生错误,因为您的生活在不断变化之中,而且今天能与您实际生活发生关联的信息可能到明天就会过时,因此也就不是真实的。但是一家银行在持续保护您的原始数据用于大数据分析时应该具有哪些兴趣呢?没有,因为持续更新原始数据的基础用于大数据分析既费力又昂贵。而且谁有权利修正或者删除直接与您相关的信息呢?在您本人不知晓和同意的情况下,您的数据继续传递给哪个人,眼下没有人知道。毕竟销售数据或者与个人相关的信息是一个合算的商业模式,即使之前它们遭到了偷窃,自德国金融机构大量购入税务光碟发生争论,我们事后肯定清楚那是什么东西。
有关您生活的信息交到第三者手中完全可靠吗?肯定不。最近数据盗窃的案件发生在沃达丰,而且涉及上百万次侵入邮箱账号,把用户的个人信息占为己有。您的虚拟替身可以在网上随意冲浪。也许它已不是您的替身,更确切地说是一具僵尸,海德先生(Mr. Hyde)。您既无法控制它,也不知道结论,从其臆想的性格特征、偏好和倾向以及行为中抽取其他的东西。但是其结果不会契合它,而是您自己。您不再能获得信贷额度,因为这个虚拟的活死人大概负债累累;您的医疗保险总额也将提高,因为替身能够推断您也许会患遗传疾病。不是您能掌控您的生活、现状和未来,这些将会更多地由您的虚拟替身决定,智能机器已经从搜集到的有关您的数据——其中有许多是您自己自愿和轻信地提供的信息计算得出了。
眼下的情况甚至是这样,利用您的未来的企业比您的数据得到了更好的保护。2014年1月28日德国联邦法院判决,德国信用保障机构(Schu-fa)(1)的评分流程比分析过的授信人数据更有保存价值,这是大数据商业模式的磨盘之水。但是从未来立场来看,这项判决骇人听闻,且对处理今后若干年内向我们走来的大数据保护难题帮助甚微。18
不损害个人隐私权,大利润照样可行。然而通过大数据金融提取大量公开可使用的批量信息,例如股市行情、基础数据或者新闻,却隐藏着另外一种方式的系统化危险。虽然对我们个人而言不是直接的,但却直接影响到全球资本市场和我们国家的经济稳定,尤其大数据与联网的证券市场上的大速度(Big Speed)相连的地方。金融市场的大速度甚至害怕机构交易商,这些人多年来每天习惯与大数据技术打交道。因此较为大型的多样算法不仅有可能,而且稳定地对金融系统造成影响。单作(2)(Monokul-turen)在工业领域同样也弊大于利。
一家投资公司向一个数学家提出通常的任务,从确定的投资期限——也许三个月也许为一年——的有价证券之中计算出证券组合的最优化排列。他考虑着委托人的风险—利润—轮廓:“损失不能超过全部投资额的10%!”现代的证券组合理论的认识权衡,“使产品多样化,减少证券组合风险”,所有的市场参与者依此理性交易的新古典主义经济学如此考虑,最终向基金经理介绍其模型。
“让我们假设。”他开始解释,“个别有价证券的价格未来如何发展,我们没有有关的其他信息。”
这个数学家指出他模型中有价证券的变量以及当今价格的正态分布。他感到自豪。他的方法既漂亮又科学,与现代的投资组合理论一致,推导出一个优化的投资组合的完整的解。他也不必指责任何东西,尤其无须指责他的投资组合升值是隐藏在其数据中的信息优势(Informationsvorsprung)的结果里。他选择了一个古典的、学院派的方法——但是在现实中真能持久吗?或者他直接跳到那地方时间太短,此处尚无法完全解释许多现实的观察,因此他确实“错”了?在经典的金融数学模型的彼岸是大数据,它要改变投资者的投资方式与方法,这种未来已经开始了。
“让我们假设”是数据科学家典型的初始状况。但是他的模型的假设不必反映现实,一个特征,正如我们所见,一般黏附在模型上。作为现实的替代,在金融市场存在非常合理的信息优势,使用它们意味着运用金融工具可比其他投资者获得更多利润或者完全盈利。市场既非理性也非有效的观点将激怒1970年提出的效率市场假说的代表。就是在今天,适时的信息时代,那些追随者团体也会提出论证金融市场的参与者完全没有可能优先使用信息。有关金融工具的信息迅速传遍了全球,它们几乎同时为参与者所采用,相同的公平交易条件即将实现。
现在不是这种情况。19因为我们的数据科学家尚未假设信息优势,但并不意味着这就不存在了。若干金融市场的参与者比其他人更无关紧要,他们知道,允许他们预见有价证券的行情——一种知识,人们喜欢称为“私人信息”——能够由智能机器从行情变化中重构。但是并非每个金融市场参与者都使用智能机器,特别是私人投资者和散户就不可能使用。这类系统巨大、昂贵,具有危险性,鉴于它们的速度或者最苛求的分析方法,更多、更好的技术意味着始终具有优势地位。谁在市场上揭开私人信息,他便获得了一种可靠的决策优势。其他不同于我们的科学家假设,大数据@华尔街知道私人信息存在于市场,便会自问:人们如何才能提早发现这些信息,几乎充当内部之人交易,由此获取利润呢?
原料交易商的行为老派,但至少有效,他们彼此熟悉,直接互相交换信息,也就是所谓的心灵与心灵的交谈。20棉花交易商,每年在国际棉花协会(ICA)相聚,能够预估他们的棉花在不远的将来会达到何种价格。最有可能精准预报的是涉及原料的交易,正如采用其他金融工具的交易,例外是高频交易,它首先需要定位,然后才提出问题。在原料交易之中基于信息优势做出可获利的交易决定,不是由于游戏时幸运或者错误的设想就能够打开市场。交易商无法解释他们如何获利,在原料交易中通常是可疑的。投机的交易商生意上不会持久。
为了在交易决定之前做出形势分析,大米、小麦、大豆或者糖的农产品原料交易商大约五年前就开始使用大数据分析,参考气象数据和自己的气候模型。对一定种植区的天气预报越精确,对农作物的生长和产量的预估就越好,其未来价格的投射就越精准。此外还有分析利用卫星图像,交易商可以尽量地放大地球表面,直到每平方米的种植面积都可以调查和计算出其土壤的性能。对此可靠的预测将有可能预期多少产量。大数据分析的数据融合技术更美妙的应用几乎难以想象。
对交易至关重要的信息从哪里来搅动,通常是存疑的。交易商的行为无把握的地方,如果根本没有被超越,起码也达到内部人交易的极限。有一个原料交易世界的案例:2010年俄罗斯发生了干旱,俄罗斯政府宣布小麦出口禁令,并明确保证向俄罗斯民众提供基本的粮食。国际原料交易商,位于瑞士巴尔的嘉能可国际股份公司,与弗拉基米尔·普京圈子周围的俄罗斯政府代表保持着良好关系,提前获悉了禁运消息,豪赌小麦价格会上涨,当小麦价格由于俄罗斯停止出口在全球上涨了30%时,他们获得巨大利润后退出其位。当时正值嘉能可公司在伦敦证交所公开招股之际,他们承认,其俄罗斯的分公司已经向俄罗斯政府建议禁运,几天之后得到政府遵循。21正是这种内部交易,也许甚至允许人们投机,与腐败相关。道德的考虑?失实的报道——一个涡轮资本主义(Turbokapitalismus)的可靠的征兆。
为了评估价格走势而被交易商利用的数据流与日俱增。不仅适时的价位、基础数据或者政治和经济的热点“故事”都会影响交易与投资的决定。大型机构投资商,例如黑石责任有限公司在全球各地开设了办事处,在当地雇用成百上千的分析师,提出他们对投资的机遇及其风险的评估。黑石公司的超级计算机阿拉丁(Aladdin)掌握着分析师的观点。运用坚实的数字、金融工具和经济指数的量化数据,汇集了数据融合和短期或者长期概率的足够数据。如果出现地震、风暴、恐怖袭击事件,阿拉丁就能在几秒钟内计算一项投资风险有多高。如果人的因素损害到超级计算机的量化计算,这里从量化分析中将产生投资——伏都教。如果贝氏统计准则得以遵循,机器绝对不可能学习一个人类分析师如何可靠,如何信赖他的输入。如果它们不能持久或者非常不稳定,时间越长,人工智能机器的风险与投资分析就越不会“注意听”分析师。这听上去如同“奇迹”,系最高水平的数据融合。
一款阿拉丁神灯(Aladdin Light)应该马上可以提供给私人投资者使用。它的名字是沃伦(Warren),借用传奇般的投资者沃伦·巴菲特。这种系统能够在数秒之内回答涉及交易的关键问题,比如:“如果非洲不存在干旱期,那么当地叛乱对咖啡种植将会产生何种影响呢?”沃伦相信其对大数据时代的非结构数据回答,地理政治与气象学一样。正是这种创新,将继续决定未来金融市场上算法的军备竞赛。美国新兴企业Kensho技术有限责任公司(3)能够通过广告为沃伦争取到上千万美元的启动资金。22在欧洲不可能吗?理论上虽然不行,实际上却可以。在大西洋此岸既不缺少创新技术,也不缺少专业知识或者企业。缺少的东西是钱和投资人的冒险意愿。如果一家技术企业的创新商业模式已经取得了关键的数量,拥有能带来营业额的长期客户,它才有获取欧洲风险资本的机会。相反,在美国是另一种做法。创新性的主意首先获得经济上的装备,然后在两到三年时间内就可以找到其商业模式。这是一条更容易的创新资本的入口,因此大西洋彼岸的西方国家——美国,在技术上已经远远地领先于我们。由于大西洋彼岸更大的创新爱好和更高的风险准备,美国与欧洲间的技术缺口已经大大地裂开了。
个别市场参与者的私人信息在市场上虽然存在,但是并未直接引起市场参与者的注意。更确切地说,这些信息深深地隐藏在公开的、可供使用的海量的市场数据中。人们必须像大海捞针那样在市场里寻找私人信息,对它们进行识别、提炼与重构——一宗包含辛辣点的数据融合的经典应用案例。常常是企业员工,他们比其他市场参与者早就更多地了解企业。比如一个股票公开上市的“红色”生物技术企业的研究者,当他了解到他的企业有一款革命性药物将得到药监局的批准时,为了从企业价值的升值中获利,他去购买了雇主的股票。23准确地说,这涉及内部交易,如同嘉能可公司向他承认了公司与俄罗斯的小麦交易。然而恰恰是大数据能够把一项非法的内部交易洗白成合法的交易。
人们业已达成一致,要评估生物技术的股票,仅仅依靠基础数据是不可能的。许多这样的企业没有营业额,与传统的工业企业存在显著的区别,但研究业绩非常巨大,足以将其成本推到超常的高度。在美国,纳斯达克技术股票市场上有800多家生物技术和健康保健的公司上市,其研发业绩在1982至2007年间占了38%,按企业资产衡量,与所有工业企业平均只有3%的研发强度相反。24由于生物企业强大的创新能力,市场价格遵循另外的标准作为企业经济的数据;例如它会评估这类企业雇用了多少个明星研究者。25美国联邦州例如加利福尼亚州、马萨诸塞州或者华盛顿州资助研究行动,尽可能吸引更多的最初研究者,被视为高开发频率,成功产品和生物技术企业经济成就的担保者。26而且一款新药是否能得到许可决定着一只生物技术股票的价格。在许可之路上,生物技术股票的价格可以迅速升高或者急速跌入无底的深渊。
“苦杏素、病毒和阿雷纳(Arena)等制药企业的股票,在他们的药品得到美国药监局的批准之后,价格得到了显著的增长。自此之后人们投资这类项目应当更为谨慎。”一个市场观察者抱着“内线的兴趣”对四只生物技术股票如此评论道。27对于经济金融化的代表而言,假如一台智能机器能够预期价格朝哪个方向运动,那么这就是一项值得做的交易。
“评估一只股票潜力的有效方法是观察机构投资者和内线投资人的投资行为。在生物技术项目中,这些发挥了最有效的作用。”一名投资专业人士写道。28这首先涉及监控价格的波动,谁能够比机器更完美无缺地监控股票行情的特征呢?如今仅仅监控股票行情还不足以识别一种盈利的投资机遇,证明一种假说可行,要把我们再次交还给数据科学家及其模型:在机构投资者或者知情人购买生物技术股票之后,价格出现了大幅度攀升,因为他们比其他的市场参与者知道得更多,而且这些私人信息在股票价格上涨之前的股市行情中表现出来。
我们得再度与一种潜在的变量打交道;因为每当我们仅观察一只生物技术股票的走势时,还无法直接观察这些投资活动。我们必须另外推断私人信息,选择一种复杂的、机械式学习方法,它能够识别股票走势潜在的变量。在此使用了一种智能机器的有趣方法:解释清楚(Explaining A-way)。如果机器确信,一个提高的价格波动性应该追溯到一个另外的事件,而不是一家机构投资者的股票购买上——比如一家企业的通告或者一种整个行业的宏观经济方面上升的波动性——然后它才会考虑到这点。最后机器要弄清楚概率,做出形势分析:“我拥有83%的概率在时间点t观察到机构投资的活跃”,而且“受监控的股票价格将以67%的概率平均上涨n点”。
仅仅公开的、量化的“大市场数据”依照这种方法就可真正很好地证实我们数据科学家的假说。
但是最后一步应该这样迈出:通过控制策略(Kontrollstrategie)对受监控的生物技术股票实施投资控制。控制策略没有控制或者操纵股票行情,就像其名称阐释那样。控制策略自动控制与优化的内容是对受监控股票有利的投资决定(Investmententscheidung)。控制策略是人工智能,在适时的形势分析基础上计算,哪个时间点应该有多少企业的股票购买或者脱手。运用算法投资决策使他们的受益者实施黄金般的交易。它几乎让内线交易合法化,全自动、方便、高伸缩性,因为它的智能机器是可以克隆的,能够轻易地监控整个行业。
在全球货币市场,信息重构发挥作用有些不同于生物技术题材股票,因为货币市场由其他的市场通过若干特征显现。由于一方面是这种情况,市场会始终继续分化。不同于在一个中央股票交易市场上进行股票买卖,货币交易直接在市场参与者之间进行场外交易(Over-the-Counter)。每个初级交易商对欧洲美元(Eurodolar)报出自己价格的行为,无论怎样都奉行这个原则。但是也有例外,市场结构迅速发生变化,不但受货币交易自动化提高的程度影响,而且受经济事实的驱动。29因为一方面几家银行分摊了全球大宗交易量的一半之多;另一方面货币市场几乎集中化。如果若干市场参与者,即整合者(Aggregatoren),把许多初级交易商的价格汇总,转交给他们的终极用户。在机构交易中,其意义在于:一家企业,把其美元的营业额换成欧元,一定期待“最便宜的”欧元价格,因为它可调节负担,30通过一个集成平台比较各种货币与欧元的报价,以物物交换的形式与最佳报价者敲定。这让我们认识到货币市场的第二个特征:有别于其他的金融工具,这里多次涉及真实的金钱流动或者风险保障,不只是纯粹的投机。您在一家取得良好收益的美国企业投资,要从美国经济的复苏中受益吗?如果升值的欧元把您的盈利抵消,或者在最糟糕的情况下反向造成损失,您将从中获利微小或者什么也得不到。也许您将在行情可靠的情况下实施货币交易。或者您卖掉您从“北海钻探”的天然气,防止美元流向美国,但是必须把5亿欧元利息在一个确定日子付给您的股东吗?如果欧元相对于美元继续走强,就会遇到问题。但是您和您要优先与之兑换的私人银行支配着私人信息。全体成员大会周年纪念日临近,日期早已提前公布,而且您与您的家庭银行打算大量抛售您的美元:货币交易的有利情况,这里不涉及投机,充其量是选择最佳的兑换时间点。喜欢今天兑换2000万,或者等到明天,再兑换3000万。
愈来愈多的全球化企业转向采用智能算法降低外汇风险,运用算法为他们计算出最佳的兑换时间点。理由是自全球金融危机以来,愈来愈多的欧洲企业报告,在美元行情疲软时有很大的问题。31行情会导致战略损失以及企业年终报表不好看的风险增高。但是大数据在首席财务官(Chief Financial officer)处并非理所当然,因为此话题不具有战略优势。有些企业的财务官把这种风险定义得非常遥远并且宣称:“我们没有货币风险,当我们需要时,简单兑换就行。”货币风险——一个上帝提出的问题?今天记录的损失,未来(或许希望)会再度返回盈利。因为随着时间的推移,就像这种哲学的代表们所期待的,货币风险将以某种方式查明。
随着时间的推移,比如十年、二十年内——货币风险就消失了?无论如何这是一种勇敢的假设,尤其当企业的报告时间比兑换行情波动的循环更短暂时,季报面对年度或者十年的波动期限。我们钱包里的欧元已经诞生了十二年;伴随着0.89美元兑1欧元的行情,2002年1月1日引入了欧元,到了2014年1月1日,其开盘汇率已达到1欧元兑1.38美元。在今天的和伟大的“欧元欣快”开始之间的各个年份里,这种统一货币并没有在先期利率的附近交易。但是有些财务官已经厌倦了在全体成员大会上对货币损失表明态度,作为替代应该报告他们核心业务的产值和盈利,尽管他们一再强调:不允许拿企业金融进行投机。但是金融董事会态度消极,当他们希望在“未来某个时间”结算货币的损失与盈利时,投机不完全类似吗?
数据科学家能够理解货币交易的参与者及其动机,描述目标及其行为,一切将注入一个反映此类结构的模型中——微结构(Mikrostrukturen),如同其名称具体的表现。模型与多代理系统组合也是第一选择。一名数据科学家首先观察和分析个别活动者的行为,其中包括中央银行、贸易企业或者投资商。他把其观察编程综合到货币市场参与者、代理之中。下一步他克隆他的活动者,获得一个社会软件代理的完整社会。而且这个完全人为的小团体最后除了在一个实验室的虚拟市场互相兑换货币之外,不允许做其他的事。
如果没有代理掌握货币价格之外更多的信息,为了做交易决策,就会谈到零智能(zero Intelligence)。零智能代理常常被解释为愚蠢,但是人们不会轻易那么做。Intelligence这个词您可以这样理解,它既不指聪明,也不是理解,而是纯粹的“信息”。零智能代理除了其价格之外并不包含有关金融工具的其他信息,一个代理,拥有私人信息,不再是零智能。尽管如此代理仍然能够复杂地架构,尽管小组智能最终是建立在其小组成员的合作基础上,不是基于其单独存在的精美。
一种以代理为基础的货币市场的蒸馏瓶的认知值得注意,因为它们可以特别好地解释货币价格如何实现,它们倾向于平衡、公平的市场价格或者一种均衡。32
如果使代理的虚拟交易场所承受不同的边际条件,例如一种金融大宗交易税,像Tobin Tax(托宾税(4))概念,此外它还允许模仿种种的监管意见。33
此外,在货币市场蒸馏瓶里允许的事件,能够用一定的概率预测,价格在接下来几小时内将如何变化。机智的数据科学家们因此将市场在活体之外(invitro)与真实的市场整合起来,从蒸馏瓶中得出虚拟价格作为重新获得的额外信息,它们既不可从真正的货币行情,也不可从分析师与中央银行的公告中直接推导出来,却由真实市场的交易决定所用。这就是大数据为金融参与者能做的工作——但这并非全部。毕竟在利用第三方的个人数据用于自己的盈利企图方面,人们没有走得太远。智能机器一再公开利用可支配数据与数据科学家的创意,最大限度地利用公共数据。直到这里,大数据都没有对消费者的自治产生负面影响。只有一点得到明确:智能机器的使用者自己陷入对机器的依赖之中。而且这也是金融市场认为的,不存在从数学那儿返回。智能机器独自与金融工具的数据完成的内容具有诱惑性且令人兴奋。这些已经被小型银行、资产管理、对冲基金和独自经营者所认可。不是没有我的算法(Algo),他们中许多人那么说,倘若没有机器的帮助,他们就不可能完成他们每日高度紧张的工作。他们还说,因为他们认识到,长此以往,智能化的交易机器将不可能被击垮。
现代数学及其算法在期货交易所也支持证券交易商。或多或少的智能机器正在处理行情、基础数据和推特新闻。面对机构中间商(Forebroker),您如果提及“大数据”及其“算法交易”概念,他马上就会说中要点,告诉您,大数据对新式的电子股票其实意味着高速度(High speed)。大数据通过高频交易(Hochfrequenzhandel)来代表证券运营商和交易商。2014年分析师估计,全美证券交易所的70%~80%的交易是高频交易构成的,34即使在金融危机的2008年,美国证券交易所来自高频交易的纯利估计达80亿到200亿美元。美国交易场所在此期间完全被超大数据(Very Big Data)支配,仅仅高波动性美国预先选购选销业务市场可以提供每秒650万种价格,期权价格报告机构(Option Price Reporting Authority,简称OPRA)如是说。这大约为每个交易日60亿种价格。无法想象一个交易商能够处理这些价格点上的海量数据,显然是委托机器处理的。机器与机器交易,以毫秒或者更快的速度下达上千次委托,而无人介入该流程。为了使算法交易继续加速,把机器用电子方式与“它们”的证交所连接,人们常常把它们安装在同一个计算中心。为了在所有参与计算机之间尽量缩短路径,使委托能够尽快,无时间等待马上得到处理,35交易商利用特殊的高速网络的主机托管(Colocation)。如同“他们的”的交易场所处理合同那样,交易商不仅充分利用方式与方法获得利润优势,而且为了操纵股票行情。高频率算法的新形式将愈来愈频繁地被观察到,它们类似于病毒,迫使有价证券的价格通往期待的方向。在这里也会发生前面提到过的星球改造。
20世纪90年代计算机交易就已不再处于初级阶段。首先,证交所的电子交易必须开始其彗星般的上升。美国证券监管机构美国证券交易委员会(Securities and Exchange Commission,简称SEC)2005年的一项调控措施导致高频交易在短短几年内成为优势战略,较小的市场参与者愈来愈多地遭到证券交易所的排挤。因此纽约证券交易所的新规定未直接与电子交易关联,而只是打算更好地保护投资者。规定包括:一次委托必须始终以最好的价格办理,必要时有必要向委托人销售更贵的有价证券。36规定触发的东西是非线性系统的动力学的一个令人信服的范例:假设一个善意的刺激,但在一个复杂的世界里它无法或者只是局部地激起期待的效果。今天的世界不再是线性的。人们拧紧一颗调节螺丝,但是五个别的地方的阀门可能会意外破裂。因此眼下发生的是由规定限制的方面造成的:它的视野除了有价证券的价格之外别无其他,连交易的速度也没有。它导致了交易商围绕同样最好的价格展开军备竞赛。只有足够快者,才能在其他人抢先采取行动之前,确保最佳的价格。调节监管机构并没有预料到规定可能会导致市场交易加速。
这期间交易商只与失控的速度螺旋有关。非常明显,在大批量的极快速机器猎取最佳价格的过程中有些人可能失败。许多投资者排斥的东西,有机构的经纪人感觉到且表达了出来:这种机器之间几秒钟之内完成的有价证券交易是全球联网的资本市场的整个系统的定时炸弹。高频算法以毫秒和微秒的速度在无人协助的情况下买卖有价证券的地方,人类将会成为股票行情波动的看客,成为无足轻重的观察者。不是少数专业人士今天谈论的一种“反常系统”,而且,他们还担心,金融恐怖分子可能在这点入侵或者彻底改造世界。因为高频交易仍然不受限制地继续扩散,始终与高频说客的符咒相伴,快速的算法确保资本市场的流动资金,人们必须理解其系统的风险。
1987年10月19日,星期一,道琼斯股票指数暴跌了23%,黑色的氛围持续了一整天。在我们现代化的极速证券交易市场上,几分钟内就可能上演恐怖的现实。如果我们回忆起股票历史上的闪电暴跌,将会发现类似情况都是以几分钟和几秒钟的速度发生的。最先开始的暴跌是2010年5月6日:道琼斯指数在几分钟之内丧失了其市值的9%。在一个脆弱的、非流动性市场上,有一家机构投资者,一家基金,抛售了不同寻常的高数量股票,由此打开了高频算法,当它跃升到假定的前进趋势上,同时开始卖掉股票时,便加速了指数价格的下跌。37如果企图刺激这种趋势,人们便说是动量点火(Momentum Ignition)——一种故意的市场投机。
由于股市的软件错误——一个技术的崩塌(Technology Breakdown)造成市场动荡的臭名远扬的案例是2012年8月1日,在纽约证券交易所由初级交易商骑士资本集团(Knight Capital Group)所造成的。在有价证券命令的自动合同处理中,一个错误的程序行导致公司系统在45分钟内放弃了200多项小委托,无意中出错买卖了上百万股的股票。例如,软件在零的数目上弄错了,直到骑士资本集团偶然看见股价在长位上超过350亿美元,短位仅仅有300亿美元。最后经过清算,因为初级交易商的软件错误,一次性损失约4.6亿美元。38只是通过高频交易商Getco L.L.C在计算机崩溃之后几天内承担损失,才使得骑士集团免于破产。
证交所的技术缺陷并非个案,而是规律。每周在全球证券交易所都会发布电子故障报告。2013年8月16日,当投资公司光大证券错误地在上海证券交易所购买了总共将近40亿美元高额订单之后,上海股票市场因为计算机错误在几秒钟内快速上涨了5.5%。39三天之后,即2013年8月20日,再次出现计算机故障,这次是在纽约。高盛公司交易系统限制误差地发送股票选择名称的买单从字母H到L开始,其中有许多蓝筹股(Blue Chips),证交所的顶级股票。波及的证交所开始加晚班,确定哪些订单执行或者撤销,高盛公司态度生硬地解释只有轻微的损失威胁企业,最高达上亿美元,正如结账之后所强调的。402013年8月22日,一个初级交易商的接口错误导致纳斯达克历史上最长时间的交易中断,像是市场被瞬间冻结(Flash Freeze)。41
绝对不是技术上的失灵,而是2013年8月22日发生了哈希崩溃(Hash Crash),这种情况对证券交易所来说是绝对恐怖的景象。哈希崩溃是一个提高易损性的典型案例,我们用大数据技术买进。为了在市场上更好地估价气氛和感受股票交易商阅读新闻,并对新闻分析实施自动化,电子阅读所有的新闻,让一种交易算法马上对此反应。
“突发新闻:白宫发生了两次爆炸,贝拉克·奥巴马受伤了。”2013年4月23日的一条推特消息如此写道。如果涉及大数据@华尔街,这是一条假新闻(Falsch information),即潜在的“核电厂超大事故”(Super-gau)。黑客让美联社(AP)的推特账号丢尽了面子,散布了错误的消息。几分钟内道琼斯指数跌掉10%,摧毁了1360亿美元的市值,然而在很短的时间内再度恢复,幸运地达到了在错误消息发布前的水平。对于挽救性的更正形势做出贡献的是华盛顿特区的人们,他们吃惊地朝窗外眺望,什么都没有看见。有人夹住电话听筒,给他们证交所的朋友们打电话。如果涉及的信息得到证实,直接贴近的心灵与心灵的交流在现代的金融市场也具有合理性。
建构在错误信息的基础上并点燃一种高频算法的形势分析,在多米诺骨牌效应中引起全球的股市崩盘,这是许多交易商恐惧的创伤。高频算法在发动一连串的交易之前,是不会确证形势的。“先射击,再询问。”高频算法交易商的格言如此。有意识散布的一条虚假信息,几分钟内就把世界的资本市场拖入深渊,引起危机,比2008年的金融海啸更糟糕,这正是让专业人士恐慌的金融恐怖主义。但是经纪人、证交所运营商、机构投资者像我们所有的人一样都是同样的材料。他们希望紧急情况不要出现,交易继续以高速度进行。
1600个德国电子邮件账户被黑客攻破?没有问题,只要与我本人没有关系。杀毒软件、防火墙?只要我的工资账户没有被清除,又怎么样。今天也是这样的情况,信息时代一个颠扑不破的现实:监控,公民权的废除,政治,工业和每个单独的消费者提高的易损性(脆弱性);对所有这些都必须同时容忍,人们随处都能听到,害怕联网的国民的天真与冷漠。但是数据科学家怀疑,全面的监控能否带来更多的安全。如同2013年的哈希崩溃表现得令人印象深刻,相反的事实确切来说不对吗?更多的监控意味着机器适时地监控与分析欲望的对象,并瞬间执行。正是里面隐藏着高风险,我们的公民社会的脆弱与日俱增。由于一切互相联网并与我们自己联网,每当出现损害情况时,多米诺骨牌效应就无法停止。面对机器的平行世界导致的风险,公民社会集体把脑袋塞入沙堆,奉行逃避策略,希望一切都变好。也许机器冲突可能造成的威胁过于新颖和抽象,相反,在证券市场的人们一定得忍受若干次电子偷袭;够了,信用评级机构标准普尔在此期间就曾威胁过,对股票市场的评估降级,因为算法交易的连续干扰,它们已经遗弃了一种提高的名誉损失和更严格的监管规定。42
显而易见的崩溃还是小的问题。更糟糕的是“超快极端事件”,也就是行情下跌以及过度评价,非常快地出现,人无法看见。在2006年高频交易彗星般地上升之时,一个科研小组便确定,高速算法会导致多达1.8万次闪电般的行情暴跌或者暴涨,以毫秒的速度发生,只有机器的交易算法才能看见。43自2006年以来,历史上的股票行情的分析才令研究者关注这些极快发生的极端事件。他们的结论是新型证券市场上发生的事件在我们人类察觉之外,属于意外事件,我们对此不了解或者一无所知,只有当它们不可见地陷入震荡之中或者犹如晴空霹雳地击向全球资本市场之后,我们方才知道。当它们导致全球的金融海啸时,我们除了观望和被迫收拾接连发生的混乱之外,不能有更多的作为。一种极速算法的后续系统危机,让专业交易商吓出一身冷汗。
通常,一次极快的意外事件的原因是证券市场上众多算法的堵塞,这些算法为了同一个最好的价格展开竞争。它们如同肉食的野兽冲向同一件战利品,一个糟糕算法的——更好更系统化的——设计。但是这不应该指责高频交易商。高频交易算法与其交易场所的通信只是根据接口的规定;但是不同交易商的高频算法彼此重叠相遇时,一项到底该如何表现的公约尚未达成。因为算法的“行为准则”,以遭遇规则(Rules of Encounter)知名,应该有助于股市更大的缓和与稳定。不禁止技术,作为替代使用更好的技术,让系统整体保持稳定。
连续的电子行情传输的更改经过证实可以限制高频交易,因为高频交易仅仅在持续的价格流动(Streaming Rates)中发挥作用。斩碎不引人注意的毫秒间的价格流动将迅速地禁止高频交易,就像设置了一个包括多代理蒸馏瓶的模拟。不,这种严守秘密不会让市场变干,而且亦实施检验。44此外模拟也确定,高频算法整体来说用途不多。
证券交易所营运商自身,也可以引入技术措施遏制肉食动物——算法,改变股票交易的参与条件。但是证券市场不太有兴趣限制高频交易。大量的订单对证券交易所营运商而言是高收入,更多的订单意味着更多的收入,因为证交所通过每笔金融交易盈利。因此可以预期高频交易会继续增长,不受限制。谁迄今对高频交易商缺乏吸引力,谁就会积极行动招募高频交易商。45毕竟执行安全措施是自动断路器(Circuit Breakers),只要股市行情面临暴跌,就应该终止交易。但是现代化的高频算法正在行军。他们非常清楚其股票市场的熔断机制,他们会以智取胜。我们也要面对另外一个高频算法的问题:交易商,拥有足够的预算和聪明的算法,会按照计算机病毒的方式实施高频算法,让病毒状的算法有目的地操纵市场。
2014年1月6日,美国纽约当地时间上午10点14分。一个病毒状的交易算法在芝加哥期货交易所把4200笔期货交易合同抛向市场——一个非同寻常的高数额,因此黄金期货的行情在不到一秒钟时间内下落了几乎2.5%。仅仅几毫秒之后纽约商品期货交易所(COMEX)黄金债券的价格就下跌了,开始时COMEX交易中断阻止了10秒的下跌。为什么不是芝加哥?一个合理的提问。这个偶发事件后来的分析让交易算法非常可疑的行为曝光。抱着让金价下跌的目的,该算法仔细考虑过,应该不至于触发芝加哥期货交易市场的自动断路器。为此,该算法把其大项目分成若干同样大的订单包,可以在市场上向预期的方向运动,按照每个订单的执行占有尽量长久,使得证交所的波动性中断不起作用。想要黄金更便宜的人,会为了同样快地压价,而使用顶尖技术。因为订单总额约为5亿美元,对已经发出算法的许多市场参与者并不适合——怀疑很快对准了美国货币发行银行及其影响范围。市场投机对他们来说并不新鲜。如果允许潜在的市场投机入侵的技术可能性得到维持,这大约也就是欧洲央行提倡高频交易的原因。46
如果您仍坚持认为证交所每个投资者都是平等的,我们却观察到一个不平等的问题,一种高速度和昂贵购买的优势的混合物。
世界上没有一个证券交易商不着迷地等待每天定时的统计结果发布,其中包括美国失业率、房屋销售状况和生产商价格,所有的经济健康指数。统计数据在其公布之后直接对资本市场产生影响,推动有价证券的行情上扬或者下跌。人们在关注统计结果公布的同时有两种选择:减少风险投资,在公布日期前关闭所有的岗位,等待市场动作,直到它再度恢复宁静;或跳上该短暂“趋势”,动量(Momentum),在统计公布时从有价证券的波动中获利。越早知道经济指数得出的结果,就越能提前定位,获取越高的行情盈利就有可能,预测如是说。
经营投资者比其他市场参与者更快知道,因为他们为此花了非常多的钱,首先获得了与市场相关的统计数据。低延迟数据(Low Latency Data)是对股票至关重要的经济数据,将高速地传递给投资者。在将要公布统计结果的新闻发布会时刻,市场处在信息平衡状态,因为高速信息的提供者,其中包括汤森路透集团(Thomson Reuters)和德意志证券集团,关注让他们的优质客户获得优质的服务。为此,信息提供商委托他们驻国家和私人机构的记者,提取统计上的经济信息。在公布之日,他们聚集在一间隔音室——一间封锁信息的房间内,如同教皇选举的西斯廷小教堂,等待信息限制的结束。到那时为止他们有三十分钟时间,供他们把事先可使用的统计结果编辑加工。当信息限制开始,而且在所有被委托人身上同时发生时,统计才传向公众。在这里,详细的通信程序会让精英投资者取得信息优势。当某些记者向他们的负责全球传播的编辑发送经济指数的同时,另外一些记者在公布之前便与优质客户商谈好了代码,他们在信息封锁期间就能事先用代码标记数据。经济数据之后不是通过“编辑”的弯路,而是以机器可读的模板直接由记者的笔记本电脑发送给优质客户的交易算法,能够在一眨眼的工夫比其他投资者更快地执行获利的投资。
这里再次变成了投资者的两极社会,能买得起超快数据流,使用极快计算机对其进行处理的精英和世界上的其他人。再一次验证:有钱者,才能挣更多的钱。每个月为了高速度数据支出五位数美元或者更多的人,就可以购买信息优势。
市场公平吗?哎哟!您想哪儿去了!2013年夏天纽约最高检察长责成路透集团暂时延迟这种商业模式。47这种与高速数据非常特别的利基交易几年前运行良好,迄今为止这种高频交易不受打扰地运行。但是这种交易的选择愈来愈少。机构慢慢做出反应。值得注意的是商业监管机构愈来愈少,而检察院和法院则愈来愈多,直至速度和程序员的足智多谋在证券交易所受到遏制。金融市场保持稳定,只是一个时间问题。
请不要以为,高频交易和高速度数据与您无关。在存款量少的时代,高频交易商还对我们养老积蓄的减少做出了贡献。这里一分,那里一分,可能让您觉得无所谓,但是经过较长时间可能会汇集凑齐一笔漂亮的数目。您把您的养老积蓄委托给各类保险公司与基金,如果它们自己也不拥有类似的精心制作的机器,便会转交给高频交易商。巨大的订单量,在几年前还完全按期望价格执行,在高频交易的时代通常没有了结就被退还。因为在订单和执行之间,那微乎其微的几毫秒内,高频交易商已经把询价的金融工具价格推高。结果是您的保险公司将不得不再次试探,而且现在必须支付更多。正是这种物价上涨,额外地让储蓄者受到零利率政策和通货膨胀的压力,与此同时,证券行情的差异、套利(Arbitrage),作为盈利记入高频交易商的账户。
储蓄者的损失可以理解,全球资本市场的潜在风险显而易见,市场利用高频交易问题成堆。愈来愈多的机构投资者与经纪人因此也在思考。他们自问,人们用什么来应对这种大数据形式,减少风险,限制损失。仅仅法律上的调控肯定还不是最有效的,毕竟“最佳的价格”的调控规定恰恰被视为高频交易的加速器。这使得调控机构不能阻止颁布限制高频交易的法规。
2013年2月28日,德国联邦议院通过了《避免高频交易中的风险与滥用》的法律,提高了对高频交易商监督权利与组织机构的要求。欧洲证券和市场管理局(ESMA)也于2012年起草了《金融市场参与者利用电子交易平台和算法准则》。但是更仔细阅读文本就会发现:调控干预过短。如果调控者相信仅仅以这种方式监控大数据、大速度和大技术,证券交易所和机构投资者就应该雇用受过更好培训的人员,更仔细地监管交易场所,更认真地测试交易算法,那么他们既没有完全理解爆炸力,也没有搞明白大数据@华尔街的技术可能性。这并不意味着法律的监控措施是给算法设限的完全不合适的手段。但是通过法律条文或者法律上的传统监管不是唯一的手术与塑造的可能,也许不是最有效的。有意义的是——事先仿真——政治、经济和技术的边际条件代替了法律的禁令,其作用在非线性的系统中反正经常受到质疑。能够理解这点相当重要,因为我们必须为大数据的算法以及将来可能造成个人损害的智能机器制定边际条件与准则。
有时候,我们还要为此结束对金融领域的大数据的观察,系统自己帮助自己。这产生勇气,因为这向我们展示了我们作为伙伴能够实现某些现实政治的跛行之后的东西。我们必须达成一致,起码我们中的若干人必须互相理解共同的价值,创造其他的途径。
对极快的肉食野兽般的算法早就视为眼中钉的交易商已经与正规的证交所告别,建立了其他的全新平台。在美国除了13家知名的证交所之外,目前还有44家替代性的市场,由银行、保险公司和基金公司运营,彼此之间执行合同。这些剩下的合同量,在这样的黑池交易(Dark Pool)中没有询价,才走向公共的交易市场。池子黑暗、“私密”、不公开——是围绕监管与监控的现实讨论的大话题。金融市场的私密性有个明确的成果,限制了系统的风险。(为此,每个宣传绝对透明的人都应该思考。)在技术上,黑池交易与传统的证券交易所相比取得了不小的进步,只是速度在它们那儿不起作用,也没有彼此联网。这两方面让它们成为比这些互相联网的,因此传统上脆弱的证交所更坚实的替代性证券交易所。因此黑池交易通常是在一项买卖完成之后才公布价格,也没有流动过程。若有人不想完全驱逐高频交易,可能会采取简单的办法,但是,主机托管(Colocation)也不可能,高频交易商也得在计算中心的角落里安装其高效率计算机,不能在替代市场使用的相同房间。一个算法分配的订单(合同)通过较长的旅程抵达黑池之后,可能几毫秒就流逝掉了,其间希望得到的价格优势也同样流逝。在此领域只有算法交易商可能幸存,前提是他没有把赌注押在“快速”,而是他机器的人工智能上。智能化的交易算法和许多不同的投资策略,可能有效地对金融市场病态的单一栽培产生影响。较高程度的交易算法的产品多样化减少了系统风险。人们想说的实际上是一个金融市场参与者的简单教程,产品多样化方案是最值得信赖的。但是从这里开始它们不再能够超越“监听与监控”商业模式的智能机器。目前所有的人同样都要面对智能不断提高的机器,比如在股市、汽车和卧室里。所有瞬间产生快乐之物,如今在技术上都得到了加强——更糟糕的是,还受监控和联网。当我们畅想未来的日常生活时,可能不得不带些哲学意味地自问:人类是谁?
(1)德国信用保障机构(Schutzgemeinschaft für algemeine Kreditsicherung,简称Schufa),Schufa数据库中拥有德国6630万自然人以及430万企业法人的信用记录。数据库内的各种信用信息,包括个人基本信息、住址、银行账户信息、租房记录、犯罪及个人不良记录等。与此相对应,机构获得信用信息的来源也是方方面面,包括银行、金融机构、网络运营商、保险公司,甚至在特定情况下,个人也可成为信用评分的提供者。译者注。
(2)单作:在同一块土地上始终种植同一种作物。又译“单一种植”。译者注。
(3)Kensho技术有限责任公司,目前正在研发一种针对专业投资者的大规模数据处理分析平台。该平台将能取代现有的各大投行分析师们的工作,可以快速、大量地进行各种数据处理分析工作,并且能够实时地回答投资者所提出的复杂的金融问题。译者注。
(4)托宾税,指对现货外汇交易课征全球统一的交易税。该税种由美国经济学家,1981年诺贝尔经济学奖得主詹姆斯·托宾在1972年首次提出,他建议“往飞速运转的国际金融市场这一车轮中掷些沙子”。该税种的提出主要是为了缓解国际资金流动,尤其是短期投机性资金流动规模急剧膨胀造成的汇率不稳定。托宾税的特征是单一税率和全球性。译者注。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。