(一)金融高频数据的研究意义
从金融高频数据产生至今,对金融高频数据的分析一直是金融研究领域中一个备受瞩目的焦点。这可以归结为两个原因:一个是由于对金融高频数据本身所具有的特征值得关注。通常所指的交易数据,除了交易价格外,还包括与交易相连的询价和报价、交易数量、交易之间的时间间隔、相似资产的现价等等,因此,对于金融高频数据的分析,实质上是一个关于“以不同时间间隔观察到的、具有不规则强度、既有离散变量又有连续变量的”复杂多变量问题。这样如何从总体上来分析金融高频数据,又如何处理具体金融交易中高频数据的特殊性,便成为众多金融领域的从业者和研究者所面临的一个有趣而又富有挑战性的课题。
另一个是因为金融高频数据对理解市场的微观结构来说相当重要。对金融高频数据的逐步积累和了解,不仅转变了一些陈旧的研究理念,如以前认为短期的价格波动是不相关的噪音并且不值得去搜集,但现在我们知道高频数据中的这种波动恰恰包含着理解市场微观结构的重要信息;而且随着对金融高频数据统计特征认识的深化,也使先前一些关于如金融市场同类性、短期价格波动服从高斯随机游程的古典经济假定受到了质疑。不难看出,在探寻金融市场微观结构的过程中,需要对基础经济理论、研究方法和计量模型等进行不断的创新和完善,而金融高频数据及其分析的出现则正好为这些转变的实践提供了条件。
(二)金融高频数据分析已涉及的主要领域
尽管人们对金融高频数据分析研究的历史并不长,但是目前的发展状况却着实令人鼓舞。众多学科的研究者对此都表现出了极大的兴趣,分别从各自不同的角度对金融高频数据进行了探索和研究。已有研究所涉及的内容之广令人无法一一穷尽,所以我们在此以金融高频数据研究的四个主要分支为脉络,有所侧重地阐述一些具有代表性的研究内容。
第一个分支是关于金融高频数据库的研究。其中Robert Wood是创建研究市场微观机构(金融高频)数据库的先驱。在他的文章中,Wood(2000)不仅从对金融市场微观结构研究的初衷、对结构数据的基础检验、TAQ数据库的组织形式和特征等角度对金融高频数据库的发展历程做了介绍,而且还讨论了金融高频数据量(如NASDAQ报价数据等)的快速增长趋势以及这种数据量的增长趋势在市场结构研究中的应用问题。这些内容对于了解金融高频数据库的组织结构、形式和数据特征来说都是非常必要的。
第二个分支是关于金融高频数据分析应用于对市场微观结构分析的研究。在这个领域中,最初的文献是关于日内(intra day)收益与波动性时间序列的模式的研究,如Wood(1985),Harris(1986),Lockwood Linn(1990)以及McNish(1993)等是最早一批对NYSE高频交易数据进行研究的人,而Goodhart和Figliouli(1991)及Guillaume(1994)等人则是最早对外汇市场的高频交易数据进行研究的先驱。此后,便陆续不断地有许多文章对日内金融市场数据的行为特征做了更深入的研究。从Goodhart和O'Hara(1997)所做的有关研究文献纵览中可以看出,基于金融高频数据对市场微观结构所做的实证研究主要集中于以下几个方面:
(1)对金融市场交易数据观测时间间隔特征的研究;
(2)对交易数据如波动性、交易量与价格差额之间交互作用的研究;
(3)对价格差额的决定因素的研究;
(4)对金融高频数据的波动性及其记忆的研究;
(5)对促使价格变动的交易的研究;
(6)对收益、报价等交易数据中的自相关性以及收益、报价、交易与交易之间的横向相关关系的研究;
(7)对金融高频数据的季节性与非线性特征的研究;
(8)对金融市场的技术分析和市场效率的研究;
(9)对不同金融市场(如证券市场与衍生证券市场)之间联系的研究;等等。
最近几年,关于对市场微观结构的实证研究在深度和广度方面又有了新的进展,具体参见Madhvan(2000),Stoll(2003)以及Hasbrouck(2007)等等,其中尤其以对股票市场高频数据的分析最具代表性。主要有用高频交易数据对不同交易系统(如NYSE的公开喊价系统与NASDAQ的计算机交易系统)在价格发现中的效率进行比较;用高频交易数据对某一个特殊股票的报价与询价的动态性进行研究(如Hasbrouk,1999;Zhang,Russell and Tsay,2001);在一个订单驱动的股票市场(如台湾股票市场)中,高频交易数据被用于研究订单的动态性以及回答“是谁提供了市场的流动性”问题。此外还有Hol和Koopman(2002)用S&P500的高频数据对股票指数的波动性进行了预测研究;Bollerslev和Zhang(2003)将股票市场的高频交易数据应用于对因素定价模型(factor pricing models)中系统风险因素的计量和建模,对单个资产的积分波动率进行估计:Andeersen和Bollerslev(2003)首先提出已实现波动率(“RV”,Realized Volatility)作为积分波动率的一个估计,Zhang,Mykland&Ait-Sahalia(2005)给出的偏差矫正两比率(two scales)已实现波动率法估计(TSRV),Fan&Wang(2007)“WRV”(wavelet realized volatility),Xiu D.(2010)的“QMLE”(quasi-maximum likelihood estimation)方法;而针对多个资产建立积分波动率估计方法的研究主要有:Haysshi&Yoshida(2005)和Zhang(2011)基于不重叠区间“PT”(previous ticks)方法提出估计量资产的积分波动率矩阵方法,Wang&Zou(2010)使用高频数据在稀疏性的条件下首次提出了高维积分波动率矩阵的相合估计(“ARVM”,averaging realized volatility matrix),Tao&Wang(2013)提出了另一个高频金融数据积分波动率矩阵的相合估计(“MSRVM”,multiscale realized volatility matrix)等一系列相关研究。
第三个分支是关于金融高频数据分析中所使用的计量模型的研究。随着金融高频数据的不断增加,如何使用模型来恰当地描述这些数据就成为一个重要的问题。从计量经济学角度来看,金融高频数据的一个最显著特征是观测值以变动的、随机的时间间隔取得。该特征隐含着对我们所熟悉的、固定的、等值的时间间隔数据的偏离,也意味着原有的一些深受喜爱的模型,如关于波动性研究的GARCH模型、SV模型等将不再适用。与以往大多数的理论模型不同[2],近来计量模型研究的核心内容是交易间隔(intra trade duration)与交易特征值,如收益、询报价差额、交易量等之间的Granger因果关系。这些模型可以分为两大类:一类是关于交易间隔的模型,它们认为较长的时间间隔意味着缺少交易活动,也代表着一个没有新信息产生的时期,因此时间间隔行为的动态性中含有关于日内市场活动的有用信息。基于这种观念,Russell和Engle(1998)使用了与分析波动性的ARCH模型相似的概念,提出了一个ACD(autoregressive conditional duration)模型来描述(交易活跃的)股票交易间隔的发展过程。随后,Zhang、Russell和Tsay(2001)对ACD模型做了扩展,用于分析金融高频数据中的非线性和结构性间隙问题。Femades和Gramming(2006)提出了一族增广的ACD模型,AACD模型,AACD模型对条件久期过程提供更灵活的函数形式,在不同的情况下也包含更多的ACD模型。Meitz和Terasvirta(2006)提出了STCAD模型(smooth transition),模型的思想从GRACH模型中得到。
另一类是关于交易间隔对交易价格变化的影响的模型,被研究对象的离散性和研究者对于“无变化”的关注,使得对日内价格变化的建模变得困难了。Campbell、Lo和Mac Kinlay(1997)曾对相关文献中所提及的若干计量模型进行了讨论,其中有两个在选择解释变量方面具有优势的模型值得关注。一个是Hauseman、Lo和Mac Kinlay(1992)使用的规则概率模型(ordered probit model),它将交易的间隔作为一个影响逐秒价格变动概率的回归量,但是这个模型有其他的一些缺陷;第二个是Rydberg和Shephard(1998)及Mac Kinlay和Tsay(2000)的分解模型(decomposition model),作为一种替代方法,它将价格的变动分解为价格变动指数、价格运动方向和价格变动幅度(如果有价格变化)三个部分进行研究;这两个模型的主要区别是后者不需要对价格变化幅度做任何划分。相关的研究还有Ghysels和Jasiak(1998)使用了一个关于不定期取值的金融数据的ACD-GARCH模型,发现在交易间隔的时间序列与收益波动的时间序列的变动中存在因果关系,尤其是日内交易间隔会对收益波动中的意外事件有所反应。
第四个分支是关于金融高频数据统计特征的研究。在讨论金融高频数据如何应用的同时,对数据本身的统计特征也不能忽视。因为统计特征不仅是认识数据的基本依据,也是正确使用数据的首要前提。早期的研究表明,与低频金融数据(如月度数据)服从高斯分布的特征不同,金融高频数据是不稳定的,在较短期间内有着增长性的拖尾趋势(heavy tailed),并且数值具有离散性的特点。相比较而言,近期对金融高频数据的统计分析则更为深入和具体。如Jacquier、Polson和Rossi(1994,1995)的研究发现,S&P500指数的日收益数据具有非正态性;Jobson和Korkie(1980)的研究表明,在决定最优证券组合的输入变量的均值—方差模型中,方差—协方差/期望收益与最优组合的权重之间的映射是高度非线性的;Chopra和Ziemha(1993)对同样问题所做的研究指出,期望收益的估计误差所带来的危害通常是方差估计中同样误差的10倍,是协方差估计中同样误差的100倍。在这些研究的基础上,Nich Polson和Bernard Tew(2000)基于S&P500指数的数据建立了可变参数的证券组合框架,描述了对收益的多变量分布进行建模的几种方法,其中不仅利用了期望收益和方差—协方差矩阵的先验信息,并且在使用日收益数据进行估计时,给出了单个证券收益估计的上限和下限。还有Thomas和Patnaik(2002)的研究,他们用VR(variance ratio)检验对印度证券市场的证券价格之间的连续相关性做了分析,得出了在以5分钟为间隔的高频率数据基础上,所有股票都显示出了均值回归(mean reversion)趋势的结论。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。