马尔可夫链
定量分析师、知识分子、股市高手,了解他们的人爱着他们。定量分析师、计量经济学家和交易员现在成了任何一家交易或投资公司的常见组成部分,他们坐在房间的角落里,周围是写满了代数式的白板,他们在对条件概率或空间状态高谈阔论!他们通常比其他人早来晚走。他们对数学的应用充满了激情。几十年来,在金融市场中使用定量分析技术已经成了确定的趋势,但是随着近年来套利基金板块的增长,这项技术的复杂程度也已经越来越高。套利基金和绝对回报基金都是“阿尔法追求者”(译注:阿尔法值的具体含义就是基金的实际收益超过它所承受风险对应的预期收益的部分,是与基金经理业绩直接相关的收益),许多研究都深入到金融市场数据的细枝末节,目的是获得从市场中抽取价值(钱)的优势。在他们所做的这些分析中,很多都是为了寻找套利机会,比如期权或指数的定价相对于相关资产或市场出现了失调,但是大量定量分析仍然集中于预期市场的方向,这些分析包括趋势跟随模型、区间交易模型、神经网络模型和遗传算法模型(像某种科学怪人一样可以“自我学习”)所做的分析。在世界各地的银行、套利基金和投资公司中有很多个定量分析小组,但是我所了解的,只有几个小组比较优秀。我认为苏格兰皇家银行(TheRoYa1BankofScot1and)中由皮特·埃格尔斯顿(PeteEgg1eston)领导的分析小组是最优秀的小组之一,因为他们成功地把所需的物理、数学和航天学技术与投资者和交易者在市场中所面临的问题融合在一起,目的是得出简单易懂的定量分析方案或备选方案。苏格兰皇家银行小组已经花了数年时间研究交易状态(即趋势和非趋势状态)的问题,他们采用的是一种定量分析方法,该方法以马尔可夫链的应用为基础。
本书比较多的是讲解交易状态的哲学,是比较简单、比较主观的交易状态分析。虽然我想花费较多的篇幅来介绍马尔可夫链的理论及它在金融市场中的应用,但那的确超出了本书的范围。我不想用几页算法和公式来让读者感到震惊,而只想用我与苏格兰皇家银行小组的访谈录来让读者领略一下这种方法背后的思想和分析过程,语言力求通俗,希望像我这样的非物理学家都能够理解。我极力推荐对交易状态分析的定量分析领域感兴趣的读者联系苏格兰皇家银行小组,以便获得更多相关信息。
马尔可夫链是以俄罗斯数学家安德烈·马尔可夫(AndreYMarkov,1856一1922)的名字命名的,它指的是一种具有马尔可夫特性的离散时间随机过程。马尔可夫特性指的是一种假设,即给定当前状态,未来状态将与历史状态无关。换句话说,当前状态描述完全捕捉到了可能影响该过程未来演变的所有信息。于是,给定当前状态的情况下,未来状态将与历史状态无关,意思是说,在过去发生的事件当中,没有什么事件会影响或决定未来的结果。当我们扔一枚硬币的时候,正面或反面朝上的概率总是50%,这与我们是否已经连续扔了1000次无关。这种思想就是历史结果不会影响未来结果。
条件独立意味着事件发生的独立概率仅受另一个事件发生的影响。举例说明,想一想某公司的两名员工,罗伯特和布鲁斯,他们住在同一座城市相对的两端。罗伯特坐火车去上班,而布鲁斯开车去上班。直觉上我们可能认为罗伯特上班迟到的概率和布鲁斯上班迟到的概率是彼此独立的。但是,如果铁路上出现了罢工,那么情况会怎么样呢突然之间,罗伯特上班迟到的概率受到(缺少火车)影响,但是布鲁斯工作迟到的概率也受到了影响(因为缺少火车,所以公路上出现了额外的交通量)。在给定铁路罢工概率的前提下,罗伯特和布鲁斯迟到的概率是条件独立的。
条件独立和马尔可夫链理论可以在许多真实世界的应用中找到。当我们听到录制的电话留言“您的来电对我们非常重要,请稍等”时,这一过程背后的“排队理论”(queuingtheorY)便是基于马尔可夫链。搜索引擎对互联网上的网页评级也是根据马尔可夫链,很多语言识别模型也用到马尔可夫链的理论。机遇赌博或博弈具有很强的马尔可夫链特性,乃至在音乐创作中也要使用这种算法。马尔可夫链就在我们周围,它就是苏格兰皇家银行交易状态模型建立的基础。下文便是笔者(MG)就他们的模型和应用,采访来自苏格兰皇家银行的特·埃格尔斯顿(PE)和西奥多·陈(TheodoreChen,TC)的谈话内容。这次电话采访是在2008年初做的。
MG:你们好,皮特和西奥多,你们是否可以谈一谈那项目的进展情况,你们设计的交易状态模型的起源,以及在你们看来,交易状态为什么很重要?
PE:我们是在2002;2003年开始这项工作的,我们这样做的起因是我们与许多使用动量模型的投资者的谈话。他们中有些人已经经历了某种程度的浮亏,他们正在想办法改进他们的动量模型。于是,他们与银行的交易手谈一些关于改进那些模型的想法,但是我们的观点是,他们不应该只是去努力找寻另一种最好的动量指标。我们的观点是,作为一种策略,动量当然有效,改进它的方法是努力找出它在什么时间有效,在什么时间看起来无效。我们都在观察市场的走势,实际上是在识别形态,你们肯定也看到市场中存在不同的状态。有一个非常清晰的画面,有时是一轮非常强的上升趋势,有时是剧烈振荡,有时是非常强劲的下降趋势,而有时市场处于高波动率状态,有时处于低波动率状态。但是,我们的秘诀是不去研究或寻找下一个最好的动量指标是什么。相反地,我们开始去分析一些思想,努力去辨识什么时间交易动量,什么时间不交易动量,这就使我们走上了分析状态的道路,实际上,马尔可夫链思想是我们研究的第一个思想。因此,我们没有在大量不同的领域中去寻找,当我们开始把很多东西放在一起来校准它,以使它辨识这些状态时,这一切便开始了,而它看起来真的有效。它看起来表现得相当优秀。一开始,有一个问题就是你不得不决定有多少种状态所以有一个需要预先决定的问题,如果你喜欢,那就是我们怎么看市场行为。但尽管如此,实际上我们认为在马尔可夫框架中,它看起来相当令人鼓舞。那一切实际上就是这样拉开序幕的。当初我们只是想改进动量交易模型,不过它已经迅速演变出更多的应用。
MG.当谈到交易状态的个数时,是比较有意思的,因为在此前关于状态的很多著作中,尤其是与马科维茨(MarkowitZ)[3]优化有关的著作中,提到多个状态。那么你是用一种二态环境研究它,你希望分析是趋势状态还是区间状态?
PE:是的,在这个马尔可夫过程中,我们有两个组成部分。其中一个是基于对价格的观察,我们有三个状态上升趋势、区间和下降趋势。然后,另一部分与上一部分是分离的,但是却都在同一个框架内,在只观察波动率时有一个二阶框架,我们分析的是高波动率和低波动率。我们选择两个状态的波动率的原因是,它已经得到了我们的期权交易者的支持,他们感觉波动率是处于两个状态中的一个。在很久以前,我们还与伦敦国王学院一起做过一些研究,观察价格数据的一些粒子滤波(partic1efi1tering),那看起来也表明在99%的时间里,外汇市场总存在两种不同的波动率状态。因此,那就是我们选择二态波动率模型的原因。(价格的)三态实际上是因为我们试图辨识强趋势的信号所造成的,显然我们在分析何时买入,何时卖出。我们的确强加了一个区间状态,因为我们希望尽量避开那些振荡的区间,因此那是一个更为实用的决定,而不是基于什么经验证据。
MG:不错,本质上你们有这样三个价格状态,两个波动率状态,但在这方面,该模型的实际细节是如何工作的呢?你们的模型怎样确定现在可能是趋势状态,或者现在可能是区间状态呢?
PE:基本上它是使用历史数据,显然所有这些分析都是使用历史数据。因此,选取一组历史数据,然后根据这段历史数据对我们的模型进行校准,从而确定这些交易状态中每种状态的均值和标准偏差,这也被称为转移概率
(transitionprobabi1ities)。转移概率指的是,如果今天是上升趋势,那么明天是区间、下降趋势或依然是上升趋势的概率是多少?现在,我们的模型所做的就是使用这段历史数据来计算出从一种状态向另一种状态转移的概率。我不知道西奥多是不是还要做一些补充。
TC:是的,我们是从1000天的历史数据开始的,它构成了我们的样本集(samp1eset)。我们为每个状态加上边界线,然后在这些边界内对每个状态的均值和标准偏差取样。然后我们根据这些取样的均值和标准偏差构造每种状态的概率分布。通过把我们的历史数据的时间序列映射到这些分布上,我们就得到了状态概率的时间序列。仅仅得到状态概率是不够的,接下来我们需要根据这些状态概率对状态本身进行取样。换句话说,我们随机产生盈利或价格,看一下它是落在上升、区间还是下降状态中,最后我们得到一个时间序列,看起来像是(1,2,2,3,2,2……),长度为1000天。这是我们的马尔可夫链,我们可以计算出上升趋势进入区间的次数。这形成了我们的转移概率,经过反馈后再提高我们的状态概率的准确性。在蒙特卡罗模拟(译注.蒙特卡罗方法,或称计算机随机模拟方法,是一种基于"随机数"的计算方法。源于美国在第二次世界大战研制原子弹的"曼哈顿计划",该计划的主持人之一数学家冯·诺伊曼用驰名世界的赌城摩纳哥MonteCar1o来命名这种方法,为它蒙上了一层神秘色彩)中,我们要对整个过程进行多次重复。获得均值、标准偏差和转移概率,构成了校准工作的第一步。最新数据点的状态将被视为我们的当前状态。随着我们把最新的数据点加入我们的样本集,我们可以每天对模型进行校准。
MG:低位是如何决定回溯窗口的长度的呢?
PE:我们已经观察了大量不同的事情,因此,当我们首次执行该模型时,我们的窗口是可扩展的,每个新的交易日我们都得到一组新的数据,我们将在扩展的窗口上对我们的模型进行重新校准。我们还使用过移动的窗口,实际上对大多数外汇数据,它都没有出现大的差别,参数相当稳定。我认为关键是需要保证窗口足够大,以便进行正确的校准,所以两年的数据可能不够,但四年的数据就够了。因此,使用四年的扩展窗口还是四年的滚动窗口,这都取决于你了。去年我们所做的测试看起来不那么灵敏,因为参数相当稳定。
MG:那么,你们的模型本质上最后只有一种输出结果,或者是趋势,或者是区间,对不对?
PE:它的输出是一个概率矩阵,基本上它会给出今天欧元兑美元汇率呈上涨趋势的概率,呈区间整理的概率和呈下跌趋势的概率。显然,它们的和为1,另外,你还得到了今天欧元兑美元汇率处于低波动率状态或高波动率状态的概率。这两个概率的和也是1。
MG:那么你们是如何把这两个输出结合在一起的呢?
PE:接下来我们构造交易信号的方法真的是非常简单,此前我们从未用更加系统化的方式来尝试这样做,因为我们认为在波动率和动量之间显然有一种关系。此时,我们这样做的方法是,比如说市场处于上升趋势的概率大于90%,且低波动率环境的概率也大于90%,那么我们就开始交易。我们将买进。基本上买入信号将保持到那两个概率中的任一个低于90%为止。如果那种情况发生,那么我们的交易就要了结。所以,基本上我们所做的就是在市场处于低波动率环境中的概率也非常高的情况下辨识趋势的高概率。
MG:是的,但是低波动率环境的概率,与趋势状态的概率计算是分离的,比如说与明天可能出现横盘的概率是分离的。
PE:是的,它是完全分离的。
MG:另外,欧元兑美元汇率明天横盘、上涨或下降的概率计算是基于过去1000天的蒙特卡罗模拟试验吗?
PE:是的,没错,是的。
MG.好的,谢谢!那么,这就是在你们的论文中谈到的波动率滤波器吗?也就是说,把高频波动率状态信息作为一重滤波器吗?
PE:是的,对那种波动率信息,或许值得一提的是,从提高该模型的性能的角度来看,它是非常重要的,2007年便是一个很棒的例子。我们通常发现,在趋势接近尾声时,我们看到日内波动率常常会升高。显然有很多人使用波动率滤波器,但他们通常是使用每天的收盘价或隐含波动率数据,等等。就日内波动率的增加而言,那往往不会捕捉到太多早期的警示信号,而我们所用的这种波动率滤波器是根据基于30分钟采样数据的24小时波动率数据计算得出的,所以我认为它的这种高频特性对帮助我们在趋势反转和下跌前离场是至关重要的。去年夏天可能是这方面最好的一个例子。当时我们做多新西兰元和澳元,这种高波动率的信号在7月25日到26日出现,我们恰好在混乱开始前了结了那些交易,一直到8月,市场的混乱状态仍在持续(在短短3周的时间里,两个外汇品种的跌幅都超过10%)。而且有趣的是,如果你观察一下隐含波动率,虽然隐含波动率在那些日子里略有波动,但是它们的波动不大,可能没有捕捉到上述信号。隐含波动率实际上在8月上旬才出现显著的运动,当时可能为时已晚。
MG:听起来棒极了。那么你使用的波动率是现实波动率,对吗?PE.是的,现实波动率使用30分钟数据,那看起来相当关键。MG.嗯,很有意思。许多传统技术分析都认为,在接近趋势尾部时,区间会变得越来越大,一直到趋势耗尽,波动率才略有降低,你们的工作显然是支持这种观点的,你们的分析肯定与传统技术分析有重叠的地方。使用实用性的状态转换模型,可能只是一个迅捷的想法。你们认为,不只是苏格兰皇家银行的状态转换模型,还有其他的状态型模型或方法最好是用在现货市场或期权市场上吗?
PE:是的,有趣的是,我认为那些方向信号适用于任何具有合理波动性的市场,我们已经在很多不同的市场上使用它,显然已经在外汇市场上使用过,包括发达国家的货币和新兴国家的货币。西奥多最近正忙于把它用于利率期货市场,我们打算在期货市场上另外做一些研究,我认为那是非常适用的。关于期权市场,在去年年底前我们也发表了一篇论文,利用这些不同状态的信息尝试交易波动率。那看起来非常振奋人心,因为它看起来在缴纳了交易费之后还有钱可赚,所以那很棒,当你结合包含大量非常好的多元化的现金策略来观察波动率策略时,对我来说就更感到鼓舞了。举例说明,我们的趋势模型在2006年相当安静,但是如果你使用该状态模型观察一下2006年的交易波动率,那么它表现得非常好。因此,在一个投资组合的基础上来分析它,那么作为一个整体策略它看起来将非常有意思。因此,我们实际上是根据自己感觉处于何种波动率状态,来买入或卖出波动率的。最后,我们刚刚所做的工作是,当该模型表明市场处于区间之中时,我们应该做双边不触及式障碍期权(doub1enotouchbarrieroptions)还是区间收益型的期权产品。我刚刚对那些情况做了历史回测,结果看起来非常振奋人心。当该模型告诉我们处于区间之中的概率为90%或更高时,我们一般会买双边障碍期权或双边不触及式期权,比如加上或减去5%。当那一区间的概率降低时,我们便了结出场,此时忽略了波动率信息,而那看起来也相当不错。
MG:这听起来很让人兴奋。我的最后一个问题是,除了你们刚才提到的之外,你们认为交易状态模型还有其他方面的应用吗?
PE:是的,我认为尝试在一个不错的多元化投资组合策略上运行是重要的,因为显然我们这样做的时候,外汇状态模型将有较长的时间没有交易可做。举例说明,2008年到目前为止,我们还没有产生一个交易信号,我们显然希望一直处于投资状态,因此我认为尝试不同的策略是非常重要的,这又回到什么方法有效,什么类型的策略在什么类型的市场条件下有效的问题上。因此,那就是我们为什么集中于两条道路的原因使用所有那些概率来交易波动率,同时做西奥多已经在做的事情,就是向其他类型的市场扩展,比如利率期货市场。我认为那是相当关键的。我认为其他几个领域也可能非常有趣,因为当时我们只在一元状态下进行研究,我们基本上分析的都是欧元兑美元汇率,我们研究的是欧元兑美元汇率是上涨、区间整理还是下跌,是处于高波动率状态,还是低波动率状态。去年,我们开始与牛津大学进行了少量的合作,合作项目被称为耦合马尔可夫模型时coup1edMarkovmode1s),目的是研究不同状态的独立性,也就是说,研究如果欧元兑美元汇率正在一轮上升趋势中,通常美元兑日元汇率是否也会表现出类似的走势。因此,人们通常只使用相关性等非独立的方法,但是我们正在考虑研究市场之间在状态或状态空间内的依赖性。那是我们相当感兴趣的内容,最终我们的模型将是多变量的,而不是像现在这样只有一个变量。因此那是相当复杂的,我认为还要做大量的工作,但我认为那是相当有意思的。与之相关的是这种试图把波动率状态和变化状态联系在一起的整个思想,那也是我们充满激情去研究的内容。另外,西奥多已经在做的工作实际上是使用这种状态模型把隐含波动率模型化。
MG:好吧,你们所描述的过程,实际上不是一个GARCH过程,而是一个判断波动率将在下个周期内上升、下降还是横盘运动的过程,对不对?
PE:是的。那看起来怎么样,西奥多,那需要校准吗?
TC:是的,它需要校准。我还没有对它做历史回测,但是显然我们需要调整我们交易时和不交易时的阈值。或者再有些时间,我们甚至不需要使用那三种状态,我们可能只关注两种状态,来观察情况的进展。
PE:另一点是,这是我们已经在研究的另外一些东西,观察相关性,因为我们也对它感兴趣。例如,我们知道在有些时间相关性被打破,或者有时市场都开始一起运动,并且保持密切相关,然而还有一些时间缺乏相关性,等等。我们的问题是,在市场中是否存在某种确定的状态相关性可供我们辨识?那是我们正在努力研究的内容。同样,我们还处于早期阶段,它也是非常复杂的,但是我认为,试着把那种现象模型化可能是相当有意思的。
MG:好的,祝你们好运。你们所讲的很多内容,尤其是在使用不同时间分形分析波动率变化或交易状态的内容,类似于一些比较传统的技术分析技术,因此令人振奋的是它们之间显然有一些交叉点。感谢你们花费宝贵的时间来回答我的问题。我真是受益匪浅。
图16.1为苏格兰皇家银行状态转换模型的运行结果。该图使用的是欧元兑美元汇率的走势图,左侧刻度指的是汇率,而右侧刻度指的是图中的一系列灰色实线和虚线从0到100%的值。图中所示为市场处于上升趋势状态(灰色实线)或下降趋势状态(灰色虚线)的概率。无论哪条线处于100%的水平,市场都应该正在经历相关的交易状态。反之,如果两条线都没有显示出高概率的上升或下降趋势状态,那么我们的结论是市场的交易状态是区间交易状态。
图16.1基于马尔可夫链的苏格兰皇家银行状态转换模型
资料来源:苏格兰皇家银行。
从图中我们可以看到,该模型在辨识市场中强劲、持续的上升或下降趋势方面效果非常好,同样,它在辨识极端区间交易期方面也表现不俗,比如2006年中期的那段区间。
这项研究最有趣的一个方面是它支持多时间分形方法分析的观点。苏格兰皇家银行模型使用高频波动率数据,然后应用于较低频率的模型,这与在一个时间分形中分析交易状态,但实际上使用低一级的时间分形在市场中交易是同样的逻辑。
赫斯特指数(HURSTEXPONENT)
最近的50多年里,科学界最令人振奋的发展便是混沌理论的出现。混沌理论认为,在第一眼看上去是随机数据的数据集合中,存在着潜在的自然秩序,而这种秩序主要表现在分形形态的出现。从这一点上看,它与艾略特波浪理论非常相似,实际上,应该把功劳归于艾略特波浪理论的创始人,还是现代混沌理论的思想家,是存在争议的。混沌理论是在与金融市场有关的时间分形的发现之上建立起来的。混沌理论的主要支持者之一是著名科学家伯努瓦·曼德勃罗(BenoitMande1brot),有记录表明,当他在1999年为《科学美国人》(ScientificAmerican)月刊撰文讨论与金融市场有关的混沌理论和时间分形分析时,他使用了一张程式化图表(未注明出处),该图表与艾略特在20世纪30年代首次使用的图表(见第8章的图8.1)非常相似。这仅仅是一个巧合吗?可能是吧。但是尽管艾略特波浪理论和混沌理论之间有着诸多的相似之处,但是混沌理论提供了一些非常有趣的研究成果,而这些结果是艾略特波浪理论没有讲到的。
混沌理论起源于气象学家爱德华·罗伦兹(EdwardLorenZ)在1960年所做的一项实验,当时,罗伦兹正在研究气象预测的问题。不过混沌理论的支柱理论之一是由一个名为哈罗德·埃德温·赫斯特(Haro1dEdwinHurst)的人在20世纪上半叶建立的。赫斯特是一名水文学专家,当时他正在忙于尼罗河(RiverNi1e)大坝项目。他担心水库控制的问题,即应该制定什么样的排水策略可以保证水库永远不会泛滥,也不会干枯。赫斯特一开始假设降水量是随机变化的,但是通过用水库水位在平均水位附近的波动幅度除以观察值的标准偏差来测试他的模型,他得出一个结论,自然系统遵循有偏的随机游走(biasedrandomwa1k),或者“有噪声的趋势”。从他的模型中得出的赫斯特指数(H)可以用来度量趋势的强弱和噪声水平,所以它可以用于任意的时间序列,来分析数据的持久性或非持久性水平。
图16.2为欧元兑美元汇率周线图,使用的是从1998年到2005年的周线分形。中间图表所示为使用25周的回溯期计算得出的赫斯特指数,当它高于0.50时,数据就被认为是持久的,但是当它低于0.50时,数据就被认为是非持久的。这种意义上的持久或非持久与趋势或区间交易并不完全相同,因为在H的严格定义和计算中,如果一个时间序列数据持续在一个价格区间内运动,那么将被认为是持久的。同样,肉眼看起来的趋势,在赫斯特指数中注定是非持久的,因为那些数据间没有显示出太多的关系。
图16.21998-2005年欧元兑美元汇率周线图
资料来源:彭博通讯社。彭博通讯社保留所有权利。经许可后转载。
尽管如此,实际上H在辨识趋势和区间交易状态方面表现得非常好。从图中我们可以看到,当欧元兑美元汇率在2000年、2001年,一直到2002年初的长期的对称三角形区间交易状态中交易时,H通常低于0.50。同时,当市场在1999年到2000年初和2002年到2003年初经历趋势状态时,H一般总是高于0.50。这些证据表明,当辨识市场中可能出现的交易状态时,赫斯特指数是一个非常有用的指标,可以加到我们的交易武器库中。
小结
至此,现有的交易状态分析方法和技术就全部讲完了。在第三部分,我们将再阐述一些分析交易状态的思想,它们可能会对分析师或交易者的整体投资过程带来帮助。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。