您好,欢迎来到九壹网。
搜索
您的当前位置:首页股指期货中的高频数据分析

股指期货中的高频数据分析

来源:九壹网
中国科学技术大学硕士学位论文股指期货中的高频数据分析

姓名:刘念良申请学位级别:硕士专业:概率论与数理统计

指导教师:@2011-04-01

摘要

摘要

随着金融改革的深化及市场竞争的加剧,传统的基本面加技术面的投资分析方法受到了来自新方法的挑战。特别是在高频数据的分析与建模方面,传统的建模方法无法适应高频数据的高峰度、长相依等特征,在分析上存在困难。另一方面,高频数据中包含的微观金融结构,又对理解市场运作方式和机理至关重要。本文基于随机金融间期分析框架,使用密度预估的方法,比较了几种常见的金融间期模型,并使用沪深300股指期货的高频数据进行了实证分析。分析结果表明,在合适的基础分布上,简单直接的ACD即LOG-ACD模型就能得到较好的拟合结果。除此之外,在数据分析和模型验证的过程中,股指期货市场的微观金融结构也显现在我们面前。事实证明,基于随机间期模型的高频数据框架对我国的股指期货市场的分析是有效的,而这一特殊的市场,和以往的单边的,相对低流动性的其它金融市场也存在着很大的不同。 关键词:高频数据 密度预估 ACD模型 股指期货

I

Abstract

ABSTRACT

The instant development and intense competition of financial market has changed the traditional investment method of fundamental and technical analysis. More and more often we face the challenges from new method and data. Especially in the field of high frequency data analysis, traditional modeling method can hardly fit the characteristic of high frequency data. On the other hand, micro financial structural in these data is believed to be the key to explain the mechanism of market operation. In this paper we state and compare several autoregression conditional duration process using the DGT density forecast evaluation method on the market data from HS300 stock index futures. The analysis reveals that the straight forward models such as ACD and log-ACD can fit the data quiet well with a proper innovation distribution. And from these models, we can analyse the market from a different way.

Key Words:high frequency data analysis, DGT density evaluation, ACD model,

stock index futures

III

中国科学技术大学学位论文原创性声明

本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。

作者签名:___________ 签字日期:_______________

中国科学技术大学学位论文授权使用声明

作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入《中国学位论文全文数据库》等有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。

保密的学位论文在解密后也遵守此规定。 □公开 □保密(____年)

作者签名:_______________ 导师签名:_______________ 签字日期:_______________ 签字日期:_______________

第1章绪论

第1章 绪论

1.1 引言

长期以来,金融市场与统计科学的发展互相渗透,互相促进:统计科学为金融市场的精细分析、提供了理论和实践基础,使其可以不断推陈出新,开发出新的产品和市场策略;而金融市场的发展又不断向统计学提出新的研究课题。其中一个关键的方向就是金融时间序列的建模,以及相应的参数估计和预估问题。ARCH,GARCH等优秀的模型被用来对频度为月、日、小时、分钟的金融事件序列进行建模。围绕着这些模型的理论与实证研究也都得到了丰厚的成果。但是随着信息科学的不断进步,对更高频数据的分析需求进入了我们的视野。遗憾的是,高频数据的一些独有特性使传统的模型和分析方法变得不再适用。Engle与Russell在1998年提出了一种新的高频数据分析框架。在此框架下,许多新的理论结果被提出。但是各个理论间的优劣确很难单从模型本身加以评判,其一是因为各个模型的理论基础和结构组成可能有很大的不同,其二是因为模型是否合适还与其使用的范围或是市场情况息息相关。在欧美成熟市场上得到多次验证的模型,不一定适应发展中金融体的市场。在实证中比较各个模型的优劣,不仅是必要的,而且对理解模型和认识市场有着双重的意义。

在另一方面我国金融市场的飞速发展,不仅使统计量化分析称为可能,也在很大程度上成为必要。本文意图将国外传统的与今年提出关于高频数据的几种模型应用于刚推出的股指期货的高频数据之中,以检验各模型的适用性,并初步考察这个新兴市场的微观性质,为今后进一步的理论研究提供基础。

1.2 股指期货与其它金融衍生品

长期以来,我国的金融市场品种较为单一。以股票二级市场为代表,只有单方向做多,缺少做空机制。基于此,在经过了长期策划和准备,2010年4月16日,中国金融期货交易所终于正式推出了第一个股指期货产品。这一万众瞩目的举动被认为揭开了一个新时代的序幕,量化交易、统计套利等理论概念将更多的通过股指期货以及今后可能发行的其他金融衍生品而进入实战。这些产品的特点,也将越来越需要数理统计的知识,来进行定量的分析。

另一方面,作为一个新兴的产品,股指期货也受益于信息科技的日益发展,其行情发布速度由股票市场的几秒一次提升到了一秒几次。这就使得基于股指期

1

第1章绪论

货的高频数据分析称为可能。可以预见在不远的将来,将有更多更精细的金融衍生品不断进入市场,为高频数据分析的理论和实证研究提供新的动力。

1.3 研究方法与内容框架

1.3.1 研究方法

本文是在Engel等人在1998-2000年建立的金融微观模型的研究框架上,适用随机间期模型对沪深300股指期货的高频数据进行拟合和预测。并适用GDT的密度预估方法对不同模型的预测结果进行对比。其中还涉及Ljung-Box Q检验,密度函数核估计等相关统计工具。

本文的数据处理主要使用SAS完成,对于SAS中无法实现的特殊分布或模型,在MATLAB中进行计算。

1.3.2 内容框架

本文的内容框架如下:

第一章介绍了本文的研究背景和研究目的,提出了研究方法和内容框架。 第二章主要介绍概述了本文研究领域的大体状况及研究进展,以及在高频数据研究方面的主要问题和发展方向。

第三章主要介绍我国高频数据研究的实际应用背景,包括股指期货的基本知识,常见的股指期货套利方法和主要问题。股指期货高频数据的特点。

第四章为基于高频数据分析的股指期货统计套利提供必要的理论准备,包括GARCH模型,ACD模型,BGT密度预估方法等。

第五章对上海金融期货交易所的沪深300股指期货的数据进行了实证研究。运用各类随机金融间期模型对数据进行模拟和预测,并适用BGT密度预估准则来比较了模型的预测结果。最终结果表明几类随机金融间期模型的分析方法适用于我国沪深300股指期货价格的实际分析。

第七章是本文的总结和展望。

2

第2章文献综述

第2章 文献综述

在对于金融市场的微观结构的刻画中,许多研究认为:交易、价差以及指令响应扮演着相当重要的角色:从中我们可以了解到市场参与者的各种信息。因此,随着近年来电子技术的发展,高频和超高频数据(包括实时的交易记录,交易价格,成交量,买卖单以及成交延迟等)的可得为微观金融的实证研究开拓了一个全新的领域。在对数据进行合适的“细化”之后,我们几乎可以对任何感兴趣的事件进行界定和研究,并计算相关的间期。Engle和Russell在1997年发表的文章(Engle and Russell, 1997)中指出,价格间期与中间报价过程的实时波动率息息相关,从而成为期权定价的重要研究对象;而2001年Prigent, Renault和Scaillet(Prigent et al, 2001)指出,市场流动性及市场交易频度的相关信息会通过成交及成交量间期反应出来。因此,对此类金融间期的预测,成为微观金融结构研究中的关键问题。

对金融超高频数据以及相关的随机过程建模的框架,是由Engle和Russell在1998年(Engle and Russell, 1998)提出的,他们同时引入了所谓ACD模型(自回归条件间期模型)。这种模型结合了Lancaster在90年代初期提出的交易数据分析(Lancaster, 1990)以及Engle在80年代建立的ARCH模型(Engle, 1982)的特点。实际上,建立ACD模型和ARCH模型背后的动机确有相似之处:金融市场中的事件,以成交价或是中间价的变动为代表,具有普遍的非平稳性和聚集性的。在标准ACD模型之后,其变种也相继进入我们的视野,其中之一便是Bauwens和Giot在2000年提出的对数ACD模型(Bauwens et al, 2000)。此模型通过在间期和其延迟之间设立一种非线性的关系,特别适宜于验证需要在模型中加入潜变量的金融理论。同时,Lunde(Lunde, 1999)和Grammig(Grammig et al, 2000)考虑了将ACD模型中的残差由原来的指数和Weibull分布替换为更为一般的广义Gama和Burr分布。2001年,Zhang, Russell和Tsay在门限自回归模型的基础上引入了门限ACD模型(Zhang et al, 2001),以此来描述间期与潜变量之间的非线性联系以及市场结构的变动。另一方面,1998年Ghysels, Gourieroux 及Jasiak引入了随机波动率间期模型(SVD)(Ghysels et al, 1998),用一个动态双因子模型来刻画金融间期过程中均值和方差的共同变动。另一个动态单因子模型是Bauwens和Veredas在1999年提出的随机条件间期模型(SCD)(Bauwens et al, 1999)。由于这些模型提出的的背景均是为了描述金融市场高频数据下的间期变动过程,因此我们将他们统一归入“金融间期模型”。

与此同时,在进入高频甚至是超高频数据领域后,我们也发现了许多传统模

3

第2章文献综述

型难以描述的新现象,如价格离散取值。对价格离散性进行定量分析的模型还不多,其中包括Harris等人在1990等提出的Rounding Distance 模型,将离散价格处理为原来连续模型的一个上下限估计。还有其它一些对离散取值的处理办法,但关于这些模型的理论和实证研究同样匮乏。特别是各种不同模型对于不同市场的适用性还有待考证。

4

第3章文股指期货

第3章 股指期货

长期以来,我国的金融市场品种较为单一。以股票二级市场为代表,只有单方向做多,缺少做空机制。这样对金融市场的长期稳定有较多弊端。其一是容易引发过度投机和非理性操作:在股市上涨时,人们一拥而上,疯狂追高,因为只有涨得更高才有钱赚,即使股票价格已远偏离其实际价值仍不愿放手;在股市下跌时,又恐慌性地抛售,因为除了平仓之外没有其它办法可以对冲掉下跌风险。其二是交易策略单一,不利于形成健全的市场格局:由于无法有效对冲下行风险,可以实行的交易策略非常有限,大多数交易者都采用相同或相似的交易方式,这就会使市场的价格发现功能受到,交易的深度和流通性难以提高。其三是难以跟上国际金融产品的高速发展:股票,期货,期权等产品就如基本的积木,有了积木才能用不同的方式将其组合成丰富的产品,以满足不同对象的需求,在缺少基本积木的前提下,高级和复杂的产品就无从说起,经济发展中出现的新的特点和需求也无法得到满足。基于此,在经过了近十年的长时间策划和准备,2010年4月16日,中国金融期货交易所终于正式推出了第一个股指期货产品,以沪深300指数为标的进行交易。这一万众瞩目的举动被认为揭开了一个新时代的序幕,量化交易、统计套利等理论概念将更多的通过股指期货以及今后可能发行的其他金融衍生品而进入实战。这些产品的特点,也将越来越需要数理统计的知识,来进行定量的分析。

3.1 基本概念

3.1.1 远期合约与期货合约

期货(futures)合约的前身即为远期合约(forward contract)。远期合约最初只是商品生产方和收购方的简单约定。对他们双方来讲,商品在将来价格的不确定性都是一种无法接受的风险。如对于一个果农来说,他的苹果将在秋季上市,虽然按现在的价格来看他会赚钱,但他不清楚上市时的市场价格会不会有所波动。对他来说,能赚钱就是一个满意的结果,如果到时价格上涨,会使他赚更多,这样当然很好,但远比不上价格下跌所可能带来的亏损可怕,这样的亏损甚至可能阻止其第二年的生产;同样对苹果的买方水果商人,也有着类似的担忧。因此买卖双方会签署一份合约,规定在秋季苹果上市时,无论当时的市价是多少,他们都会以一个事先确定的合理价格和数量,由空头合约的持有者果农提供苹果,多

5

第3章文股指期货

头合约的持有者水果商将其买下。远期合约的一个主要功能就是套期保值,使其标的商品(如苹果)免受一定时期内价格波动的影响,锁定其价值带来的利润。

远期合约的一个最大的缺点就是其不具有流通性,如果市场上有很多果农和很多水果商,他们中每一个都要去寻找一个适合自己的交易对手签订合约,很多时候这是困难和高成本的。而由于各合约在标的物数量、质量,交割的时间、方式等方面各不相同,合约一旦签订也难以转让和变更。期货合约就是标准化的远期合约。一张期货合约有固定的标的物数量,会统一规定标的物的品质,交割的时间、方法,但并不固定其交割价,而是在统一的期货交易所按买卖方自愿报价,价格一致时自动成交的方式。这个成交价也就是买卖双方得到的期货合约的交割价。除了标准化之外,现金结算是期货有别于远期合约的另一大特色,以传统的到期后按进行实物交割的方式不同,现金结算是指到期时可以只提供交割价与现货当前价格的差价。对远期合约来说,如果1吨铜的交割价为3000元,而当时的现货价为3100元,合约的空头持有者就必须提供1吨铜然后得到3000元-或是等价地用3100元现买1吨铜来交割,并得到3000元,实际付出100元;而合约的空头持有者就必须付出3000元得到1吨铜-或是等价地用别人给他的100元加上自己的3000元去买1吨铜。这种等价性就让期货的多空双方可以只用现金交易差价,而省去了实物交割的麻烦。相似的道理,期货交易中还允许用一张反方向的合约来对冲掉之前建立的合约,同样只用支付两次合约的差价。现金结算和对冲机制的建立大大扩展了期货市场交易者的范畴,引入了投机者和套利者(他们手中一般只有现金,而没有标的的货物),这些人又反过来为套保者提供了交易机会和流通性,共同推动期货市场的健康发展。

3.1.2 现货:沪深300股票指数

与传统标的为某种实际商品的商品期货合约不同,金融期货合约的标的物一般是另一种金融产品,这一产品或者是可以实际交割的(如某一支股票),或者是只有一个名义价格而难以实际交割的(如汇率或是股票指数)。对于后者来说,将只有现金交割一种方式。但这并不影响其套期保值,对冲风险的功能,如汇率期货就可以用来对冲掉持有本币或外币时的汇率风险,而股指期货可以用来对冲掉的股票组合或是单一股票中的系统风险。这种标的于非实物商品的金融期货一般会规定所标的价格与合约面值之间的一个乘数,来起到商品期货中的标的物数量的作用。如沪深300股指期货的乘数为300,即沪深300指数每上涨/下跌一个点,一张合约的名义价值就会上涨/下跌300元,而当指数为3000点时,合约的名义价值就是3000×300=90万元。

无论其标的物是什么,期货的价格和功能都是与现货息息相关的。现在交易

6

第3章文股指期货

的金融期货暂时只有沪深300股指期货一种,其标的物为沪深300股票指数。沪深300指数2005年4月8日开始发布,现由中证指数有限公司(China Securities Index Co., Ltd)负责编制和维护。中证指数有限公司成立于2005年8月25日,是由上海证券交易所和深圳证券交易所共同出资发起设立的一家专业从事证券指数及指数衍生产品开发服务的公司。沪深300指数从上海和深圳证券市场中选取规模大、流动性好的300支股票作为样本,其中沪市有179只,深市121只,其指数样本覆盖了沪深市场六成左右的市值,具有良好的市场代表性。但与中证500等综合指数和其它一些中小盘指数相比,沪深300指数较偏向于大盘股。在指数编制时,采用了按流通股本分级靠档进行加权的方法。并会定期对指数成分股本身和成分股权重进行调整。沪深300指数以2004年12月31日作为基期,基期指数为1000点。之后某一时刻的指数按派许综合价格指数公式计算:

I

t

=

∑ii

PitWPi0W

iti0

⋅I

0

(3.1)

其中I0为基期指数值,一开始为1000点,It为报告期指数值,P与W分别为对应时期各成分股的价格和权重。其中权重取分级靠档后的流通股本。当遇到以下情况时,需要对公式的除数进行修正:

z 除权:凡有成分股配股或送股,在成分股除权基准日前修正指数,按照

新的股本与市值计算成份股调整市值。

修正后的调整市值=除权报价×除权后调整股本数+修正前调整市值(不含除权股票)

z 停牌:当某一成分股停牌时,取其停牌前收盘价计算即时指数,直至复

牌。

z 股本变动:凡有成分股发生其它股本变动(如增发,配股上市和内部职

工股上市引起的股本变化等),在样本股股本变动日之前修正指数。 修正后的调整市值=收盘价×变动后调整股本数+修正前调整市值(不含变动股票)

z 样本股调整:当指数样本股定期调整或临时调整生效时,在生效日之前

修正指数。

得到调整后股本后,按如下公式计算新除数:

修正前调整市值修正后调整市值

原除数新除数

并将调整时It的作为新基期的I0即可。注意在样本股除息时,沪深300指数不做修正,任其自然回落。

沪深300指数作为跨沪深两个市场的指数,通过上交所和深交所的卫星行情

7

第3章文股指期货

系统进行实时发布,这是交易所以外的其它指数编制机构无法获得的技术条件。也为利用沪深300指数进行的指数产品创新,形成在交易所上市交易的创新产品奠定了基础。此指数的发布频率是每两秒一次,且作为300只股票的综合,并没有自身的买卖报价过程,因此并不存在超高频数据的随机时间效应。

3.1.3 沪深300股指期货

沪深300股指期货作为国内金融期货的第一个产品,由中国金融期货交易所于2010年4月16日正式推出。分为当月,次月及随后两个季月共四个合约,当近月(M月)的合约到期后,M+2月的合约上市,如果M+2月已有合约,则M+8月的合约上市。

表3.1Q沪深300指数合约表 沪深300指数期货合约表

合约标的 合约乘数 报价单位

沪深300指数 每点300元 指数点

最小变动价位 0.2点 合约月份 交易时间

最后交易日交易时间 每日价格最大波动最低交易保证金 最后交易日 交割日期 交割方式

当月、下月及随后两个季月

上午:9:15-11:30,下午:13:00-15:15 上午:9:15-11:30,下午:13:00-15:00 上一个交易日结算价的±10% 合约价值的12%

合约到期月份的第三个周五,遇国家法定假日顺延同最后交易日 现金交割

交易代码 IF 上市交易所

中国金融期货交易所

沪深300股指期货的合约乘数为300,与国际类似股指期货相比,合约乘数

8

第3章文股指期货

偏大。这可能是从风险管控的角度来考虑的:上市初期较大的乘数可以提高入市的门槛,防止散户盲目投机。从股指期货的历史发展来看,大合约拆成乘数较低的迷你合约是一种趋势。较低的乘数能够吸引更多不同的投资者,使市场更有深度。相对股票而言,沪深300股指期货0.2的最小变动价位偏小(0.2:3000,相当于30元的股票最小变动单位是2厘),虽然保证了足够的市场宽度,但不可避免的造成市场深度的不足,使股指期货的价格波动性更强。

股指期货的行情发布频率大概为每秒2次左右,相比于股票或指数行情,更接近于超高频数据的特征。

除了以上简单合约表中规定的内容之外,股指期货还实行了保证金制度,逐日跟市制度,价格(涨跌停版),持仓限额制度,强制平仓制度,大户报告制度,结算担保金制度等。这些细则都有可能对股指期货的实际交易产生关键影响,但由于篇幅所限,本文不再赘述。

3.1.4 期货市场的参与者和存在意义

如前面所述,期货最基本的作用是套期保值。除此之外,股指期货还担负着价格发现功能。由于期货市场的成交更为容易,交易更为活跃,价格更为敏感,再加上期货本来就带有“对未来的预期”的意义,因此股指期货市场上形成的价格,通常会对现货市场具有一定的指引作用。在短期上看,在市场出现大幅度波动时,一般股指期货市场会领先现货市场几秒到几分钟不等;在长期上看,股指期货的价格暗示着今后一段时间的大盘走势:如果股指期货价格远高于现货价格,则表示大多数股指期货的交易者认为大盘会在到期前上涨,相反如果股指期货价格接近甚至低于现货价格,说明大多数股指期货交易者认为到期前大盘很可能下跌。在我国,股指期货提前于A股市场15分钟开始交易,并在A股收市后继续交易15分钟,这就从时间上强化了其价格发现和价格引导的功能。

但是,这一切功能的实现都必须建立在市场交投活跃,有效运作的前提下。而这一点与合理的市场参与者构成分不开。股指期货交易的参与者大体上可以分为三类:第一类是套保者,正是他们的需求导致了期货市场的形成,他们会用期货的多头或空头的头寸对冲掉自己持有现货或卖空现货的风险。典型的套保者一般会计算自己所持的现货会对应多少张期货合约,并按照所希望对冲掉的风险让现货与期货间的多空头寸尽量配平。开仓后他们一般以持仓为主,并在现货交割的同时平掉持有的期货头寸,或是在期货到期时进行展期。第二类是投机者,使用和股票投机类似的方式进入期货市场,他们一般会判断今后一段时间的价格走势,并在有利的方向建立净多头或空头的合约。对他们来说,期货的保证金制度相当于提供了5-10倍的资金杠杆,一旦他们判断正确,获利将远高于无杠杆交

9

第3章文股指期货

易,但判断错误的损失也是同样惊人。杠杆率的另一个好处是可以在很大程度上抵消手续费带来的影响,相对于合约的名义价值(90-100万),30-50元的单边手续费远远低于股票市场,使以前无法进行交易的细微价格变动(如万分之一的价格变动)也变得有利可图。这类交易者的交易频率可能会很高,一日之内就会做多个波段。他们很少持仓过夜,更少持仓超过一个月,因为期货和股票不同,到结算日时必然会被强制交割。第三类是套利者,他们在在行为上类似于套保者,但却是以买低卖高,套取市场中不合理的价差来赚取利润。如果说投机者像市场的润滑剂,给价格的充分波动提供动力,那套利者就像市场的橡皮绳,使价格对价值的背离不会太过于离谱。他们和套保者一起参与到市场内,才能充分实现期货市场的套期保值,价格发现和价格引导的作用。

3.1.5 数据特征

金融市场的一大作用是为实体经济提供支持。在很多地方,金融市场起到了合理定价,自发的资源分配,交换需求的作用。随着人类经济活动的不断深化和复杂化,对金融市场提出的要求也越来越高。与此同时,随着理论科学和电子科学的进步,我们对金融市场的研究也更加的透彻。高频数据分析就是其中一个典型的例子。高频数据的获取与信息科技的进步分不开,以股指为例,从最早的道琼斯指数每周在报纸公布,到每日公布在交易所报表,到由交易所实时地每五秒左右发布一次,到股指期货每秒发布多次,这是计算和通信效率与可靠信都极大提升后的结果。在另一方面,从前人们满足于分析长期的基本面,分析日线周线,但随着金融市场的日益发展,人们发现对其细微结构的精细分析也是必要的。当数据频度从天提高到小时、分钟和秒的时候,我们发现了许多与低频数据截然不同的特征;而进一步提升到以实际交易为频度时,对超高频数据的描述又更为复杂(Fama, 1965)。但正是这样复杂的数据结构,恰恰又可能成为解释价格波动率形成机理的关键(Engle and Russell, 1997)(Prigent et al, 2001)。

对沪深300股指期货来说,作为全新的金融衍生产品,其特性与国外成熟市场有所区别;但其上市不久,就体现出了很好的价格发现和市场调节作用。单以美国金融学家尤金·法玛在1965年提出的有效市场理论(EMH)的角度来说,股指期货市场比股票市场更为有效。但从高频数据分析的角度来说,其交易数据又有另一些特性。

3.1.6 波动率的日内变动和日历性

分钟数据与日数据的一个显著不同时,日内的波动率一般会出现一种开盘和

10

第3章文股指期货

收盘的时候高,盘中较低的下凸的形状。这一现象最早是由Wood等人在1985年发现的,之后又被更多人的研究所证实,并在1988年由Pfleiderer从理论上证明了其合理性。除了价格波动率之外,交易频率、买卖价差、成交量等常见变量的波动率也会在一日之中出现下凸的情况。而日历性指从周一到周五或是从月初到月末波动性出现的周期性变化,一般也是出现一种中间低两边高的下凸形态。相关的结果可见Andersen等人在1999年的文章(Andersen et al, 1999)。理论研究表明,除了与周期性的休市、假日等相关外,这一现象还与规律性的宏观数据发布有关。

3.1.7 高频价格序列的高峰度

在较低频的数据分析中,GARCH模型是常见的工具之一。它可以刻画一些峰度在100以下的随机变量,但如果峰度过高,使用GARCH模型就可能出现偏差。而Anderson与Bollerslev在1988年发表的实证表明,很多频度达到1分钟级别的高频数据具有100以上的峰度,而且峰度会随着频度的加大进一步上升。我们研究了股指期货市场的高频数据,也证实了这一结论。

3.1.8 高频价格序列的一阶负相关性

在日内交易的高频数据(分钟级以下)中,价格序列一般会表现出一阶的负相关性,特别是在一些跳点的附近。这一现象最先由Goodhart等人在1991年提出,Muthusuamy在1996年进一步证明了这种负相关性具有非线性的特征。对于股指期货来说,这一特征尤为明显,体现在日常交易中可以发现其价格会出现经常性的假突破和剧烈的反转。这一现象是在低频数据中看不到的。

3.1.9 超高频数据的随机时间效应

在低频数据和一般的高频数据中,数据发布的时间间隔是相等的,如周数据,月数据。或虽然可能不全部相等,但依然是确定的,如日数据和日内数据,由于存在周末休市和午间休市,相邻两个数据间的间隔可能会截然不同。但对于精确到秒甚至精确到每一次交易记录的超高频数据而言,这一特征不再成立。由于信息发布/接收系统的,同一时间发生的交易可能会在不同的时间收到,不同时间发生的交易也有可能会合并到一条记录中,即非同步性交易(Nonsynchronous Trade)。我们观察到的时间,不一定就是交易真正发生的时间,而是在真实的时间上附加上了随机扰动的结果。因此超高频数据的一个首要特征就是在一个不等间隔的随机间期中发生的交易数据。这种现象被称为随机交易间

11

第3章文股指期货

期(Stochastic Duration)。刻画这一现象是当今超高频数据分析中较为热门的方向之一。之前的定性研究(如Campbell等人在1997年发表的文章)表明,间期的变化可能与市场信息的发布有关,重大的怀消息或无消息都有可能导致间期的变长,间期的长短还可能反映了市场参与者中知情者的数量。总的来说,这类对随机间期的研究试图用间期的变化来解释较低频数据中买卖价差的形成以及价格对交易产生的影响的机理。比如认为随机间期效应与较低频数据中一阶滞后横截面和一阶资产组合收益率序列相关。

Engle等人在1998年发表的文章(Engle and Russell, 1998)可以认为是对随机间期效应建模的一个正式的开端。其中提出的自回归条件间期模型(Autoregressive Conditional Duration model, ACD)在超高频数据分析中的地位类似于ARCH/GARCH模型在低频数据分析中的地位。但对此模型的统计性质的研究只能算刚刚开始,基于ACD模型的实证研究也很少。

3.1.10 价格离散性的影响

超高频数据的另一大特征是价格取值的离散化。在较低频的数据中,由于价格变化较大,我们一般假定价格是一个连续取值的变量。而在精确到每一次交易的超高频数据中,价格在两次报价间只能取给定间隔的分立的值。这一给定的最小间隔被称为tick。如对中国股市而言,一tick一般是0.01¥;而NYSE股价的最小变动单位则是1/16$。最小变动单位对市场价格发现和市场运作机制等本质性的问题都有重要意义。一般认为更小的tick会对流动性带来直接的影响,使流动性的宽度变好的同时,不可避免地将使每一个tick上的深度减弱;进一步的分析表明,较小的tick可以降低买卖价差,促进市场竞争,对流动性的需求者有利。但对流动性的提供者,如做市商,过小的tick会打击他们的供给动机,对市场带来负面的影响。

对价格离散性进行定量分析的模型还不多,其中包括Harris等人在1990等提出的Rounding Distance 模型,将离散价格处理为原来连续模型的一个上下限估计。还有其它一些对离散取值的处理办法,但关于这些模型的理论和实证研究同样匮乏。

3.2 常见的股指期货套利方法

股指期货推出后,在其对冲功能的支持下,一种在过去很长一段时间内对股票投资者相对陌生的交易方法-套利,进入了我们的视野。所谓套利(Arbitrage),广义上讲就是利用一定的合理手段,从某一系统内无风险地获取超过其动用的资

12

第3章文股指期货

本成本的利润的行为。套利的可行性,一般来说建立在所谓的“一价律”(One Price Law)的基础上。即:价值相同的事物在不同环境下表现出来的价格也应相同。在真实市场上,由于金融工具,交易方式,市场结构,交易时间等等诸多因素的差异,“一价律”几乎总是遭到一定程度的背离。当背离的程度超出了合理的范围(视套利过程完成的难易程度而定),就可以通过“套利”来吃掉其中不合理的价差。注意这里的“不合理”是相对的。对投机者(其着眼点在于今后的走势)来说视合理的价格,对套利者(其着眼点在于当前的价差)来说可能就是不合理的。由于这种不合理常出现在标的统一价值的两个价格之间,因此买低价卖高价,并在这两个价格由于一价律的作用而趋于一致时做反向平仓,这种“一买一卖”成对出现的操作方式,就成为了套利行为的一大外部特征。

关于套利中另一点值得注意的是:虽然在套利的定义中包含了“无风险”的概念,但完全的“无风险”只在简化的理论模型中出现。现实中由于套利流程的复杂性和市场操作的不可预见性,这种“无风险”是相对的。有些人说套利是一种“低风险,低收益”的行为。其中的“低风险”即指相对于投机行为的低风险,另一点“低收益”我们在之后的篇幅中讨论。总之,量化风险是现代金融管理的目标之一;在股指期货套利这个特定的范围内,如何降低风险,扩大收益,也是本文试图讨论的课题。

相对于一般股票投资或投机而言,套利对理论和数据分析的需求更多也更为严格。这不仅表现在套利机会的出现需要对市场走势的精细分析上,也体现在实际套利过程对价格变动的敏感性以及对分析计算准确性核时效性的要求上。现阶段常见的利用股指期货的套利方法如期现套利、跨期套利等面对的都是高频的实时数据,都要求较强的实时数据处理能力以及对市场微观金融结构的较深理解。特别是在涉及到与价格间期、成交量间期相关的流动性的问题,这不仅关系到套利策略的收益,也与其中的风险息息相关。

3.2.1 期现套利

股指期货中的“期现套利”是指在股指期货(期)和能够替代指数(在现阶段中国股指期货市场,特指沪深300指数,下同)的某种投资组合(现)间实施的套利行为。一般来说期-现间存在一价差(用期货价格减现货价格表示),称为期差。如果卖此价差,即卖出一份股指期货,同时买入一份现货作为开仓,以相反的操作平仓,此过程被称为正向套利;反之以买此价差开仓,卖此价差平仓的过程被称为反向套利。一般在现货市场上先买入股票开仓,再卖出股票平仓是可行的,而反过来先融券卖出股票,再买入股票开仓是困难的(融券有重重:对象,数量,成本等)。因此反向套利一般难以实行(除非本身之前就正好持有

13

第3章文股指期货

套利所需的大量现货股票)。一般股指期货的期现套利以正向套利为主。

正向套利以卖出价差开仓,说明此时的期现价差高出合理的价差。如何确定此“合理价差”?首先:

理论价差(期–现) = (一份现货)到交割日的资金占用成本 即:

期货价格 = 现货价格 + 到交割日的资金占用成本

这个公式体现了(在完全没有市场波动的前提下),期货合约价理论上应比现货价高出一定量,即资金占用成本或称之为“时间价值”。具体来说,为了在交割日持有一份现货,可以通过:1,以现货价格买入一份现货,并持有到交割日;或2,建立一份期货多头合约(其理论现金流为0),把节约下来的钱存入银行(或进行其他投资),并在交割日取出,按期货合约价履约并得到一份现货。

这两种方式的现金流现值应该相等。关于此理式的更多讨论可见于期货/期权定价的资料。对于正向套利来说:

合理价差上限 = 理论价差 + 正向套利交易成本 其中,

正向套利交易成本 = 现货买入冲击成本 + 现货买入手续费 + 现货卖出冲击成本 + 现货卖出手续费 + 期货买入冲击成本 + 期货买入手续费 + 期货卖出冲击成本 + 期货卖出手续费 (或最后这行用期货交割手续费替代) 理论价差 = 资金占用成本

= 现货资金占用成本 + 期货资金占用成本 其中,

期货资金占用成本 = 期货保证金占用 + 期货风险准备金占用

如果实际价差超过了此合理价差上限,哪么就可以进行一次正向套利,在扣去交易成本和资金占用成本后仍有净利润。

注意:

1)正向套利之所以成立,是因为股指期货的“强制收敛”规则使交割日期货与现货间的“一价律”必然成立;

2)合理价差下限 = 理论价差–反向套利交易成本。但由于融券的困难,此反向套利难以实施,反向套利成本也难以计算。此合理价差下限只有有限的参考意义。在实际市场上,当价差超过或接近合理价差上限时,正向套利资金就会大量涌入卖此价差,最终使价差缩小至合理范围(甚至在更低的价差上,套保的资金就会卖出期货买入现货,也使价差缩小);相反,当价差低于合理价差下限,

14

第3章文股指期货

甚至出现负价差(称为期货贴水)时,并没有套利的力量使价差上升,因此在大多数时候,价差会在合理价差的下方运行。大多数具有较长历史,且没有有效的反向套利手段的股指期货市场都有这种现象。

3)实际计算时,常把各值“指数化”,如计算得出为对应一手期货空头合约,应买入的“一份”现货为某跟踪指数的ETF基金100万股,每股价格为1元,则现货的资金占用为100万元,若以5%的年利率计算,一个月的资金占用成本为0.41667万元,除以期货合约乘数300,可得对应的指数为13.点,即必须在一手套利交易中赚取14点,才能抵平其中的现货资金占用成本。

3.2.2 跨期套利

跨期套利一般是指在同一市场中同一标的不同结算日期合约间的价差交易。如近远期合约的牛市套利与熊市套利,以及涉及近、中、远三个合约的蝶式套利等。跨期套利的基本思想与期现套利一致,即“买低卖高”。但与期现套利相比,跨期套利具有明显的高流动性,高杠杆性。期交易标的与数量也容易确定,即近、远期合约一手对一手。但是,由于套利的难度降低,出现不合理跨期价差的可能性也更小,套利的利润空间更为狭窄,可能只有多次交易来放大低套利成本的优势才会有合理的收益。同时近、远期合约价差的无风险套利理论值更加难以确定,常常需要历史数据模型结合当日市场走势和个人经验进行判断。

3.2.3 跨市场套利

跨市场套利一般指在不同市场交易的同一标物的期货合约之间的价差交易,严格来说期现套利也是一种特殊的跨市场套利。对股指期货来说,新加坡等过的期货市场上早已出现了标的中国沪深300指数的金融衍生产品,这就给股指期货的跨市场套利提供了可能。与市场内套利相比,跨市场套利所需的数据准备,交易平台性能与实时交易能力更高,但可能存在的套利利润空间也更大。

3.2.4 结算套利和其它事件套利

结算套利指对应于期货合约到期交割这一特定事件的套利行为。对股指期货来说,最终交割价为结算前交易日最后两个交易小时内的每秒的收盘价的算术平均。在最后两个交易时间中,随着时间的推移,交割价中随机和未确定的成分越来越少,而确定的成分越来越多,结合对市场波动率的判断,完全可能制定出一套合理的套利交易策略。

出了结算交割事件之外,其他许多不特定的事件也可能产生套利机会,只要

15

第3章文股指期货

由基于同一个价值的不同价格间可能产生的各种差异存在,也就有套利的可能存在。

3.3 股指期货套利的主要风险

低风险是套利交易的特点,但那只是相对于投机交易而言,实际上在风险类别和风险特征上,套利交易与投机交易都有很大不同。

3.3.1 风险

从广义上讲,所有可能引起市场变动的宏观,都可能对套利交易带来风险。对不同的市场,不同的套利策略来说,可能引发风险的类型又各不相同。如对跨市场套利甚至是家套利来说,汇率以及相应的汇率风险,交易所交割方式的变动以及相应的交割风险都是息息相关的。,如郑州商品交易所2003年1 1月宣布硬麦仓库自2004年7月后放开交割,对当时已经在交易的WT409、WT411合约的持有者的影响就是直接的,如果有人当时进行远期套利操作,这就是意外的风险。如果不能对这些风险作出预先的准备,那就很难在风险实际发生时作出正确、及时和有效的应对,套利策略很可能就会遭到失败。

3.3.2 市场风险

套利操作与投机操作最大的不同就是其承担的市场风险相对较少,但这并不是说套利操作就完全没有市场风险。当套利组合的价格向着不利方向变动时,其持有者就在承担着损失的风险。如当期现价差过高时,套利者可能开仓进行期现间的正向套利,但如果此时期现价差进一步扩大,则套利者就会出现账面损失。

3.3.3 交易风险

在套利交易中,除了普通的由于冲击成本带来的交易费用外,还有一类必须注意的交易风险是单边成交。因为套利交易一般是同时进行多头和空头的开、平仓操作,当其中一边成交而另一边没有成交,或是两边成交不同步时,就会形成单边的净暴露。此时套利者的头寸完全暴露在市场的波动之下,很可能不仅无法得到预期的套利收益,还会遭受损失。这种无法按预订的时间和价格完成交易,在现货和期货的流动性差别较大时特别容易出现。为了应对此风险,我们一般会考虑到的预留的冲击成本;部分成交,补齐差额的方案;趋势判断下的交易;净暴露;实际冲击成本的估算等等因素。

16

第3章文股指期货

3.3.4 模型风险

无论是无风险套利还是统计套利,都是基于模型的交易策略。而模型在很大程度上是对现实世界的简化和提炼,在实际操作中,模型难免出现偏差。一个最显著的例子就是期现套利时现货交易组合与实际现货价格之间的跟踪误差,即所使用的投资组合与指数的实际收益率的偏差。如果事先没有考虑到这种风险,实际操作中又不及时修正,那么模型偏差带来的影响很可能吞噬掉套利交易带来的利益。如一日的跟踪误差可以达到1%之高。好在模型基本上对长期行为的模拟较好,而长期来看实际跟踪误差是每日跟踪误差的一个累积。

3.3.5 仓位风险

仓位风险或称资金风险,是指套利者在开仓入市后,在市场波动的影响下由于保证金、逐日跟市、最大持仓等制度及自身的资金投资期限、风控标准等等,可能无法完成预期投资操作的一种风险。跨市场套利中,一般会在一个市场出现账面收益,另一个市场出现账面亏损。而出现账面亏损的市场很可能要求套利者追加保证金,而套利者在还未平仓前是无法将获利市场的资金转移到亏损市场上来的。如果不预先对这种仓位的风险有所准备,那么就很可能面临着强制平仓的风险。

17

第4 章理论准备

第4章 理论准备

本章为后文进行股指期货高频数据的实证研究准备必要的预备知识。主要介绍了各种不同类型的随机金融间期模型(Stochastic Financial Duration Models)。并给出一种评价各模型优劣的统一方法:DGT密度预估方法。

4.1 随机金融间期模型

在接下来的部分,我们将从大体上回顾各种金融间期模型(4.2.1-4.2.5)。对每一类模型,我们将首先给出其模型定义,再给出其参数估计的方法以及用此模型预测的方法。

为了能够客观的比较下文中的各个金融间期模型,本文将类比Luc Bauwensa等人在2004年发表的文章(Bauwensa et al, 2004)中的流程,主要采用Diebold, Gunther和Tay在1998(Diebold et al, 1998)年建立的密度预估的方法,或被称为DGT的方法。此方法可追述到Rosenblatt在1952年发表的结果(Rosenblatt, 1952),它可以对各种互不相同的模型,按其预测效率进行比较,而不需要用户额外指定损失函数。此方法提出后曾多次被使用。

4.1.1 标准ACD模型

模型定义

最早的ACD模型由Engle和Russell在1998年提出,ER模型将间期xi描述为:

xi=ψiεi

(4.1)

这里εi是同分布随机变量,其期望为μ,这里Ε(xiHi)=ψiμ,其中ψi

为关于过去间期的线性函数,称之为条件间期函数。我们先看最简单的ACD(1,1)格式:

ψi=ω+αxi−1+βψi−1

证所有的ψi均为正。

(4.2)

其中ω>0,α≥0,β≥0。虽然这些参数的并非必须,但这样可以保对一个参数模型来说,我们需要一个可以用有限个参数来描述的随机变量εi。在1998年的文章中,ER考虑为了εi为Weibull分布在形态参数等于γ而尺度参数等于1时的特殊情况:指数分布。在指数分布的情况下,可以写出模型的拟似

19

第4 章理论准备

然方程,此时如果Ε(xiHi)被正确给定,则(ω,α,β)的拟极大似然估计具有相合与渐进正态性(在合适的正则化条件下)。当然,Weibull分布是这种情况的扩展,具有更广的适应性,而且可以允许非退化的风险函数。不过Weibull分布的风险函数必然是一个单调函数:若γ>1则单增,若γ<1则单减。但根据Bauwens和Veredas(1999)(Bauwens et al, 1999)以及Grammig和Maurer(2000)(Grammig et al, 2000)所指出的,许多金融间期的风险函数具有先递增再递减的性质。为了与此相适应,Grammig和Maurer建议将Weibull分布扩展为Burr分布,这样可以允许有峰的风险函数。与Weibull分布不同,Burr分布有两个形态参数,因此其散度和单调性之间没有一一对应的关系。另一个具有此性质的分布是广义Gamma分布。Lunde在1999年的文章(Lunde, 1999)中讨论了这一分布应用于ACD模型,即广义Gamma分布ACD模型。标准(指数分布)ACD与Weibull分布ACD是Burr分布ACD及广义Gamma分布ACD的特例。

参数估计及密度预估

ACD模型的参数估计,可由最大化其似然函数给出。其似然函数为n个密度函数f(xiψi−1)ψi−1的乘积,这里ψi由(6)式定义而f(⋅)是假定的随机变量分布:对标准ACD来说,是指数分布。对其它ACD模型,也可能是Weibull, Burr或广义Gamma分布。ACD模型的密度预估为给出所有过去信息后xi的条件密度函数,可写为:

f(xiψi−1)ψi−1

4.1.2 对数ACD模型

模型定义

Bauwens和Giot在2000年指出(Bauwens et al, 2000),如果金融市场的微观结构上具有多个解释变量,而当我们把这些解释变量以线性的形式加入ACD模型的条件间期函数时,就会出现问题。因为实际意义可能决定了一些变量的系数将为负数,这时我们对条件间期的估计就有可能为负,而这与间期的非负性矛盾。但我们又不能简单地规定解释变量的系数不能为负,因为这样实际上是直接去掉了那些本应加入模型的解释变量。为此,Bauwens和Giot引入了对数ACD模型,即将(5)式改写为:

xi=exp(ψi)εi

(4.3)

这样一来ψi即称为条件间期函数的对数。与标准ACD模型的区别在于,自回归等式是建立在条件间期函数的对数之上,而条件间期函数是ψi的幂。两种常见的自回归等式如下:

20

第4 章理论准备

ψi=ω+αlogxi−1+βψi−1

(4.4)

ψi=ω+αεi−1+βψi−1

(或者它们的特例)。

参数估计及密度预估

(4.5)

注意这里并没有对参数取值的正负作出规定来保证条件间期的非负性。而与标准ACD模型一样,随机变量εi的分布可以取为Burr分布或广义Gamma分布

对数ACD模型的参数估计及密度预估方法与标准ACD模型一样,只要使用变换后的条件间期函数exp(ψi)进行替换,并最大化似然函数,其结果为:

f(xi(exp(ψi))−1)(exp(ψi))−1

其中f(⋅)同样为随机变量εi的分布函数。

4.1.3 门限ACD模型

模型定义

在标准ACD模型中,条件均值的变动由单一的线性方程(6),(8)或(9)唯一刻画。但是Zhang等人在2001年的文章(Zhang et al, 2001)中考虑了更为复杂可变的情形(ZRT):他们的门限ACD模型(TACD)有一个分为三段的条件间期函数,每一段都可以有不同的线性部分和随机变量。在对数化版本的TACD模型中,条件间期函数的对数可以写成如下形式:

⎧ω1+α1logxi−1+β1ψi−1,if:0

ψi=⎨ω2+α2logxi−1+β2ψi−1,if:r1⎪ω+αlogx+βψ,if:r3i−13i−12⎩3

形如(7)式的模型基本方程依然不变。分段参数r1及r2确定了各区域的边界。建立形如(10)的分段函数的基本思想是很多交易或中间报价的过程可以分为缓慢,普通和快速三个阶段,而一个不分段的线性函数则容易对极短或极长的间期之后的条件期望作出错误的估计。ZRT对模型中随机变量εi采用了广义Gamma分布,但是其形态参数ν可以在不同的分段中取不同值,这样间期就在不同的分段中有了不同的分布。

参数估计

对于可以变动的r1及r2,我们使用逐点搜索最大化似然函数的方法来确定各参数的取值。在实际使用中,我们将使r1及r2在r221

第4 章理论准备

度逐点变动,并采用了形如(10)的以广义Gamma函数作为随机变量分布的对数化TACD模型。其它TACD模型可能采用其它的分布,也可能将(10)中的分段函数替换为(6)或者(9)中的形式。

密度预估

TACD模型的密度预估的方法与ACD和对数ACD模型一样。不过值得注意的是,由于分段的条件间期函数,TACD的密度预估过程中,使用的参数与上一次间期的长短是相关的,我们应该时刻注意应该使用分段函数中哪一段的参数。

4.1.4 随机条件间期模型(SCD)

模型定义

在1999年,Bauwens与Veredas提出一种新的金融间期模型(Bauwens et al, 1999),假设金融间期过程中由一个动态随机因子驱动。此潜因子联系着信息到来过程和新事件的发生。BV假设此因子服从如下一阶自回归方程:

ψi=ω+βψi−1+μi

们可以写出对数ACD模型相似的模型方程:

(4.7)

其中μi为正态分布,均值为0,方差为σ2。与前面其它模型一样,我

xi=exp(ψi)εi

参数估计

(4.8)

(11)和(12)合起来被称为SCD模型。这里需要假设随机过程{εi}与{μi}相互。随机变量εi可能的分布与ACD模型的情况一样。

相较于标准ACD模型,SCD模型的参数估计显得更为困难。潜因子的存在使参数的准确估值必须对随机变量μi进行积分。在对(12)中的xi取自然对数后,模型变成了一个线性空间下的状态模型,以lnεi和μi为其误差项。BV在lnεi为高斯分布时对参数作出了大概的估计,其中用到了Kalman滤波以及预测误差分解的技巧来进行拟极大似然估计。在随机变量为Weibull及Gamma分布时,BV提到仍有相似的结果。在本文中,我们主要使用Weibull作为其随机变量εi的分布。

密度预估

无论事先给定随机变量εi为何种分布,随机过程xi的条件分布是此分布与的条件对数正态分布exp(ψi)的混合。此混合分布即是SCD模型推出的一步预估分布。注意,虽然在对SCD模型进行参数估计的过程中,我们用到了近似密度,但对SCD模型的z-积分变换仍可以得到准确的值。此过程需要一个二维的数值积分:首先算出预估密度(对μi进行积分),再算出变换之后的z。

22

第4 章理论准备

4.1.5 随机波动率间期模型(SVD)

模型定义

在之前讨论的标准ACD与对数ACD模型中,都隐式地假设了相对于间期过程的高阶矩的变动,其均值变动占了主要地位。但Ghysels等人(GGJ)在1998年发表的文章中提出了不同的看法。他们认为这一假设了对金融间期进行建模的可能性。因此他们引入了一个更为通用的模型,通过一个非线性的双因子模型来描述了间期均值及方差的共同变动。因为其第二个因子是为了描述方差的变动,这一模型也被称为随机波动率模型(SVD)。这一模型首先假设了间期序列独列地服从一个指数分布序列除以一个Gamma分布序列:

Ui

xi=

aVi

(4.9)

这里Ui与Vi为相互的随机变量,分别服从gamma(1,1)(即指数分布)与gamma(b,b)分布。(13)式可以改写为包含高斯因子的形式:

H(1,F1i)xi=

aH(b,F2i)(4.10)

这里F1i与F2i是的标准正态变量,而H(b,F2i)=G(b,ϕ(F)),其中G(b,⋅)是gamma(b,b)分布的分位数函数,ϕ(⋅)是标准正态分布的累计分布函数。GGJ通过这两个高斯因子,将此统计模型应用于描述间期的变动。对随机过程

Fi=(F1i,F2i)T,我们着重研究其二元VAR形式。Fi的边缘分布必为N2(0,1)。这保证了xi的边缘分布一定有指数分布除以Gamma分布的形式。反映在第一阶的VAR方程上,我们有:

Fi=ΛFi−1+μi

VAR这可以由Σ=I−ΛΛT得到。

参数估计

(4.11)

这里μi是一个正态白噪声列,其斜方差矩阵为Σ(Λ)且Var(Fi)=I。对一阶

由于模型中非线性动态潜因子的存在,SVD模型的参数很难作出准确的估计。但另一方面,SVD模型又易于采用模拟的方法。这使我们倾向于采用基于模拟技术的参数估计方法,如Gourieroux于Monfort于1996年发表的文章(Gourie′roux et al, 1996)。而SVD模型属于非线性动态因子模型,这类模型的参数在Gourieroux与Jasiak在2001年的文章(Gourie′roux et al, 2001)中有简便的基于模拟的估计。具体来说分两步完成:首先,我们可以发现xi的边缘分布是一个Pareto

23

第4 章理论准备

分布,其有两个参数a和b,密度函数如下:

abb+1

f(xi)=

(axi+b)b+1

(4.12)

因此,我们可以用拟极大似然的方法直接得到a与b的估计值。其次,参数阵Λ可由模拟矩的方法给出,此方法可见Gourieroux等1999年的文章(Gourie′roux et al, 1999)。在我们实际使用中,我们假设xi与xi2的自相关系数最多到相邻的7

个变量,且假设Λ为一个对角阵。

密度预估

和参数估计类似,由于模型结构上的复杂性,SVD模型的密度预估必须通过数值模拟来完成。为了得到密度预估以及相应的积分变换序列,我们必须从过去的观测间期中推断出相应的因子状态。在知道模型参数(或是其相合估计)的前提下,我们可以模拟出未来因子状态的条件分布。这样我们就能使用SVD模型将因子状态对应为间期的估计。也就是说,我们可以从模拟出的因子状态中倒推出间期的条件分布,也即是我们感兴趣的预估密度。此模拟出的预估密度可产生我们所需的积分变换序列z。如果模拟的次数足够多,那么我们就可以得到足够精确的密度预估和相应的积分变换序列。但是,如果我们要用此方法进行长期的一步预测,可能会需要大量的计算时间,因为每一步都需要重复此模拟过程。

我们将上面的模型总结为下表:

表4.1 Q金融间期模型

12 3 45 6 78 9 1011 12 13名称 BurrACDGeneralized Gamma ACD Weibull ACD ExponentialACDBurr log-ACD(第一类) Generalized Gama log-ACD (第一类)WeibulllogACD(第二类)Burr log-ACD(第二类) Generalized Gama log-ACD (第二类)WeibulllogACD(第二类)Generalized Gamma threshold log-ACD (第Stochastic volatility durationWeibullSCD缩写BACDGGACDWACDEACDBLACD1GGLACD1WLACD2BLACD2GGLACD2WLACD2TACDSVDWSCD定义式 (5)+(6)(5)+(6) (5)+(6) (5)+(6)(7)+(8) (7)+(8) (7)+(8)(7)+(9) (7)+(9) (7)+(9)(7)+(10) (14)+(15) (7),(11),(12)24

第4 章理论准备

4.2 DGT密度预估方法

4.2.1 DGT密度预估方法

一个“密度预估”是对所关心的随机变量的下一次观测的密度函数的估计。在本文中,此随机变量一般是指成交事件、成交量或成交价格的间期。密度预估一般可由模型推出,但也可能是由一个观测者给出的主观分布。在实际环境下,预估密度一般是在最近一次事件的信息(以及之前发生事件的所有信息)已知后给出的条件密度。

DGT方法的基本思想非常直观。在本文中我们采取如下记号:设一有序间期列为xi,i=1,...,n;记fi(xiHi)序列;pi(xiHi){}n

i=1

为由金融间期模型给出的一步预估密度函数

{}n

i=1

为生成xi的真实条件密度序列(同样由金融间期模型给出);

Hi表示由之前的xi带来的条件信息。DGT的结论显示正确的预估密度(即等于真实密度的估计)将弱优于所有其它的估计。即在期望损失最小的意义下,无论观测者选择何种损失函数,等于真实密度的估计都会是最佳估计。也就是说与真实密度的相近程度将是评判一个估计优劣的标准,即判断是否有:

{f(x

i

i

Hi)}n

i=1

=pi(xiHi)ni=1

{}n

i=1

(4.12)

但是,作为真实密度,pi(xiHi){}对我们来说是不可知的。幸运的是,如

下关于密度函数的积分变换可以帮我们绕过这个难题:

zi=∫

xi

−∞

fi(u)du

(4.13)

Rosenblatt在1952年的文章中指出,在(1)的原假设下,此积分变换的结果为均匀分布U(0,1)。DGT扩展了此结论,给出在(1)的原假设下,序列xi在预估fi(xiHi){}n

i=1

下的相应积分变换序列zi的分布应同分布于均匀分布。这

就为一个实际的预估序列或模型的检验提供了方法。

因此,本文将沿用DGT的方法,并着重给出各模型对应z序列的自相关图表和直方图。传统的检验结果也将一并给出,但正如DGT曾提到的,即使传统检验拒绝了原假设,这对比较各模型的优劣也并未提供多少有用的信息。而z序

25

第4 章理论准备

列的自相关图表可能显示出模型在刻画间期变动性上的不足。较强的自相关性一般与模型未检测到的均值漂移有关;除了自相关图表外,我们还可以使用Ljung-Box的Q统计量或是Brock, Dechert, Scheinkman和LeBaron在1996年提出的方法(Brock et al, 1996)来检验z序列,以此来验证原假设导致的同分布结论是否成立。同时,从z序列的经验分布直方图上我们可以清晰的看出其与均匀分布的差距。这种直观的检验方式一般可以从中发现模型失效的原因。比如说一个高耸的直方图通常暗示预估分布相对于真实分布来说过于集中(轻尾),而实际上忽略了真实分布的尾部。这是用基于正态分布的模型来估计金融中常见的重尾分布时常遇到的问题。与此相反,一个“U”形的直方图通常表示模型产生的预测常常不及或超出了的真实分布。z直方图的置信限和一个简单的假设检验可由如下的事实导出:在原假设(i.i.d于均匀分布)下,z直方图的高度应服从二项分布:

⎛n⎞ni

p(ni)=⎜⎟p(1−p)n−ni

⎝ni⎠

(4.14)

其中n为总样本量,ni是落在第i个直方块中的观测数量,而p=1/m,m为直方块的总数量。我们可以使用Pearson的拟和优度检验统计量(自由度为m-1):

2

(n−np)

χ2=∑i

npi=1

m

(4.15)

来检验原假设是否成立。

DGT方法的一大有点就是其适用性广泛,以及对特定模型预测效果的直观展示。在此文中,我们将利用此方法,对不同的模型进行相互间比较。更重要的是,此方法并不要求实际产生数据的分布是时间不变的。实际上,真实分布序列

{p(xH)}i

i

i

n

i=1

可以随其时间下标i而有各种参数或结构上的变动,而密度预估序

ni=1

列fi(xiHi){}应反映这些变动。当然,密度估计的方法也有一定的缺陷:首先,

此方法的直观性较强(这也是其优点之一),可能并不能满足所有的使用者;其次,DGT方法并没有考虑到模型估计参数的不稳定性——但对本文的目的来说,此缺陷并非致命,因为金融间期模型所普遍使用的高频数据具有极大的样本量,此时参数估计的不稳定性相对会被削弱。

26

第5章实证分析

第5章 实证分析

5.1 数据

此次实证分析使用的数据为2010年4月22日到2010年11月10日所有在中金所交易的沪深300股指期货合约的相关数据(以及相对应的沪深300指数)。股指期货上市半年来,其市场特征初步稳定,但相关的研究还几乎没有。按采集频率,这些数据分为五分钟,一分钟和秒级别的超高频数据(超高频数据从2010年8月23日到2010年11月10日)。数据是从期货公司的行情-交易端口采集,而此端口的得到的实际是由期货公司中转的中金所发布的实时行情和成交信息。据实际操作验证,此端口数据可信度较高,延迟在0.5秒以内。(即从交易端口下单-从行情端口看到下单成交-从交易端口得到成交回报的延迟一般在0.5秒以内)。但在超高频数据中,仍然存在明显的非同步性交易(Nonsynchronous Trade)现象。如同一次成交的信息可能会分步达到,而两次相近的交易的信息可能会同时达到。

按照中金所的相关规章,同一时间会有四支不同的股指期货合约在市场上交易,按到期日不同分为近月合约,远月合约,近季合约和远季合约。原始数据涉及的合约有IF1005, IF1006, IF1007, IF1008, IF1009, IF1010, IF1011, FI1012, IF1103和IF1106。随着时间的推移,近月合约到期交割后远月合约就自动变为近月合约继续交易。一般来说近、远月合约的交易量和交易特征会有较大的差异,而各个时间段的近月合约之间存在较大相似性。因此在数据处理时,会先选出各时段的近、远月合约分别进行处理。

5.2 描述统计

5.2.1 间期的分布

在各种金融间期中,我们将着重考察其中最常见的三种:交易间期,价格间期和成交量间期。其中交易间期指观测的相邻两次交易之间的时间间隔,Engle和Russell在1998年的文章(Engle and Russell, 1998)中曾用ACD模型来描述交易间期,其条件风险函数是对即时交易活跃程度的一种度量。价格间期是指使成交价出现一定变动的两次交易间的间隔时间。这里的“变动”一般是指价格的最小

27

第5章实证分分析 变动动单位,对股股指期货来来说为0.2点。点按Englle和Russeell的观点,价格间期刻刻画了买买卖方询价价过程的即时时波动性。成成交量间期期是指使累计计成交变动动超过一定单单位的两两次交易间的时间间隔隔,这里取累累计成交增增长超过5手。手由于成成交量间期描描述了完完成特定成成交量所需要要的时间,因此是对流流动性的一种种直观的刻刻画。三种金金融间期期中,价格格间期由于和和定价过程程密切相关而而格外受到到人们的关注注。 我们考察察的对象为所所有近月合合约数据组合合在一起后后形成连续序序列,称为近近月连续续或近月合合约;以及所所有远月合约约数据组合合在一起后形形成的连续续序列,价格格间期又又显得尤为重要,因为为。称为远月月连续或远远月合约。相相对于这两两个合约,近近季合约约和远季合合约成交非常常稀少,市市场关注度很很低,暂时时不列入考虑虑。 由图X可以看出,可间隔间期的的分布集中中在较小的刻刻度上,但但具有一定的的重尾特特征,在较大大值上仍有有一些分布。在对其取取对数后,可以看到其可其分布近似于于正态分分布,但并不完全相同同,其一个显显著的特征征是极高的峰度。对交交易间期,价价格间期期和成交量量间期都是如如此,而交易易间期的峰峰度更是达到了130以以上。这是较较低频数数据中没有有的现象。对对近远期合合约的价格间间期与近期期合约的成交交量间期来来说,都有有一定的“双峰”性,这可能与与交易活跃与与不活跃时时段的不同交交易特征有有关。这些些性质可能能暗示着LOOG-ACD以及以TACD模型是合理模理的选择之一一。 图5.1远月合约价格远格间期分布图图 28 第5章实证分分析 图5.2远月月合约价格间间期对数分布布图 图5.3 近远远月合约交易易间期对数分布图 图5.4 近远远月合约价格格间期对数分布图 29 第5章实证分析

图5.5 近远月合约成交量间期对数分布图

5.2.2 价格间期的日内效应和日历效应

为了研究间期变动的日内效应和日历效应,我们对近月合约的交易时间分段。其日内交易时间为上午9:15到11:30,下午13:00到15:15,每15分钟分成1段,记为AM1-AM9, PM1-PM9 ,共18段。各段的间期均值和标准差如下:

21.81.61.41.210.80.60.40.20

AM1AM2AM3AM4AM5AM6AM7AM8AM9PM1PM2PM3PM4PM5PM6PM7PM8PM9avgDstdD

图5.6近月合约价格间期的日内效应

从图中可以看出,近月价格间期的均值和标准差存在明显的日内效应,分为上午和下午交易时间,上午开盘时较高,然后一路走低,到中午收盘时达到最低,下午开盘时又较高,中间较低,然后在下午收盘前重新走高。下午和全天大体上都呈现出一种下凸的格局。

30

第5章实证分析

109876543210

AM1AM2AM3AM4AM5AM6AM7AM8AM9PM1PM2PM3PM4PM5PM6PM7PM8PM9avgDstdD

图5.7远月合约价格间期的日内效应

远月价格间期的的日内效应与近月的类似,但是可以看出远月的价格间期明显长于近月。表明远月的交易不如近月交易活跃。

如果我们在同时考虑价格间期日内效应和一周内的日历效应,我们可以得到下图:

1.81.61.41.210.80.60.40.20

1

2

3

4

5

avgDstdD

图5.8近月合约价格间期均值的周日历效应

从图中可以看出,在剔除了交割日之后,近期合约的价格间期的周内日历效应并不明显。

31

第5章实证分析

76543210

AM1AM2AM3AM4AM5AM6AM7AM8AM9PM1PM2PM3PM4PM5PM6PM7PM8PM9

周一周二周三周四周五

图5.9远月合约价格间期均值的日内和周日历效应

远月合约的周日历效应有别于近月,主要体现在周三周四的间期远低于周初和周末。出现了典型的U型走势。

由于期货合约存在每月的交割日,因此可以预计其数据将对月存在周期性,我们将某一品种成为近月合约开始记为第一天,一直到其交割日的一个月的价格间期数据展示如下图。

从图中可以看出,对近月合约来说,其价格间期特征在月中的大多数时候较为平稳,但在到期前一到二天,价格间期突然增大,表示大多数交易者已经将注意力转移到下月的合约上。而远月合约正好相反,随着上月合约到期日的临近,远月合约的价格间期不断缩短,在上月合约到期前一到二天达到了近月合约的平均水平。这与交割日前的普遍的展期行为相匹配。

43.532.521.510.50

1234510111215161718192223242526

avgDstdD

图5.10近月合约价格间期的月日历效应

32

第5章实证分析

16141210820

1234510111215161718192223242526

avgDstdD

图5.11远月合约价格间期的月日历效应

由于数据中日内效应与日历效应的存在,我们引入了diurnal标准化的程序。确切的讲,我们有:

Xi=xiφ(ti)

其中Xi为观测到的序列,xi为真实序列,φ(ti)为周期性调整。φ(ti)估计为平滑后的分段均值。在之后的分析中,我们都将使用调整后的标准化序列xi,仍简称为间期序列。

5.2.3 价格间期序列的自相关性

在进行随机金融间期模型的估计之前,我们先来看一下间期序列的自相关性。明显各序列都有较强的自相关性和长相依性。其lag-50以上的Ljung-Box Q统计量依然显著的拒绝了原假设(P<0.01)。从总体上看,远期合约的各个间期序列的自相关系数都高于近期合约。而ACF函数表现出从一开始的高点缓慢下降的趋势。值得注意的是近期合约的价格间期序列,与其它间期序列不同,这一间期序列的ACF一开始就处于较低的水平,而且基本保持不变。

从各个间期的自相关性来看,使用带有自回归的模型方程可能是合适的,如GARCH,ACD等等。

33

第5章实证分析

0.350.30.250.2

近月价格间期

0.150.10.050

14710131619222528313437404349

远月价格间期

图5.12近远期合约价格间期序列的自相关函数

0.70.60.50.4近月成交量间期0.30.20.1014710131619222528313437404349远月成交量间期0.150.10.050147101316192225283134374043490.350.30.250.2近月交易间期远月交易间期 图5.13交易间期和成交量间期序列的自相关函数

5.3 间期模型的DGT密度预估

5.3.1 检验说明

对标准化后的数据,我们将用前面介绍的几种模型和估计方法进行估计。并对估计的结果使用DGT密度一股的方法进行验证。具体来讲,我们将把数据分为两部分,前三分之二为训练样本,用来对模型的参数进行估计;后三分之一为检验数据。参数估计的方法如前所述。对样本内数据和样本外数据,我们都可以用确定了参数的模型进行一步预估,然后按DGT的方法计算相应的积分变换后的z。如果我们的模型基本是正确的,各个积分变换后的z应该i.i.d.地服从U(0,1)的均匀分布。

对近、远期合约的交易、价格和成交量间期序列,我们都使用了表4.1中模型1-10进行估计(对于SVD与SCD模型来说,Luc Bauwensa等人在2004年发

34

第5章实证分析

表的文章(Bauwensa et al, 2004)中认为其采用的Pareto分布的假设对高频数据的间期来说是不合适的,特别是有着尖耸形态的间期分布),并计算了相应的z值。和许多其它研究金融间期模型的文献一样,所有的自回归模型中我们都取了1阶的自回归。除此之外,我们还加入了标准poisson过程以及GARCH模型这两个金融事件序列中的基本模型作为参考。虽然相对来说比较简单,许多关于金融微观结构的理论研究中都隐式地假设了具有类似的结构,如Easley等人在1996年发表的文章(Easley et al, 1996)。在本章中我们计算出了各个模型对于各个间期序列在样本外检验时对应的z的同分布于U(0,1)的检验p值,以及对z及z方的15阶自相关Ljung-Box Q统计量的p值。为了区分这些模型的表现,我们将各模型的检验进行了直观的排序:我们首先对通过了Ljung-Box Q检验(5%置信度)的模型按照其对U(0,1)的Person拟合优度检验的p值进行排序。在对没有通过Ljung-Box Q检验的模型,也按拟合优度进行排序。由于对交易间期序列进行估计的模型的拟合优度p值都非常小,我们对通过了1%置信度的Ljung-Box Q检验的模型按其两个Q统计量的p值的平均值进行从大到小的排序。

5.3.2 积分变换序列z的自相关性

0.150.10.0501‐0.05‐0.1‐0.15‐0.235791113151719212325POISONGARCHBACD‐0.05‐0.1‐0.1501357911131517192123250.150.10.05GGACDWACD

0.150.10.0501‐0.05‐0.1‐0.15‐0.235791113151719212325BLACD1GGLACD10.150.10.0501‐0.05‐0.1‐0.1535791113151719212325WACD2GGLACD2

图5.14交易间期样本内数据z-序列的自相关函数

35

第5章实证分析

0.150.10.050‐0.05‐0.1‐0.15‐0.2‐0.251357911131517192123250.150.10.05POISONGARCHBACD‐0.05‐0.1‐0.150135791113151719212325GGACDWACD

0.150.10.0501‐0.05‐0.1‐0.1535791113151719212325BLACD1GGLACD10.150.10.0501‐0.05‐0.1‐0.1535791113151719212325WACD2GGLACD2

图5.15价格间期样本内数据z-序列的自相关函数

从由积分变换序列z及z方生成的Q统计量的p值来看,ACD模型成功的描述了金融间期序列的微观动态结构。但作为比较基准的Poisson过程,确表现的很差。对于随机金融间期模型来说这是一个很重要的结果,因为Poisson过程是许多关于金融微观结构的理论文章的基础。远期合约的成交量间期序列的样本外检验结果显示,所有的模型都被Ljung-Box检验所拒绝,而同时各个ACD模型的样本内检验结果却能够通过,这似乎暗示着样本内数据与样本外数据有着某种结构上的变点。虽然我们期望TACD模型能够在描述具有结构变化的过程中有所优势,但实际上TACD模型在这一序列的样本外数据上也表现很差,并未优于简单的ACD或LOG-ACD模型。与之相反,在一些估计相对成功的序列上(如近期合约的交易间期),TACD模型的表现反而不如简单的LOG-ACD模型。从排序结果来看,大体上过,使用广义GAMMA分布的ACD与LOG-ACD模型在z与z方的Q检验中的结果最好。

图5.15的自回归曲线更进一步说明了这一结果,由GGLACD和BACD模型生成的积分变换序列z的自回归函数很少超过置信区间(-0.07,0.07)。实际上,从z序列的性上讲,各个模型都表现的很好,即使是基于简单的指数分布的ACD与LOG-ACD模型也并没有得到比复杂模型更差的结果。虽然我们在模型中只使用了类此ARMA(1,1)这样简单的结构,但它们都很好的描述了间期序列的动态相关性。当然,标准的POISSON分布无法得到这样的结果。

5.3.3 积分变换序列z的均匀性

36

第5章实证分析

对于许多实际应用,如期权定价(Prigent et al, 2001)或是金融市场的微观结构研究(Bauwens et al, 2000)来说,价格间期代表着最有实际意义的一种金融间期过程。通过这次实证分析,我们可以发现一些随机间期模型可以很好的描述这一过程。有趣的是,并不是那些有着最复杂结构的模型才有较好的表现,反而是更直接的模型进入了我们的视野。如以广义GAMMA和BURR分布为基础的ACD和LOG-ACD模型。它们对应的积分变换z序列的关于均匀分布的拟合优度检验无法被拒绝。与之相对的,以标准指数分布或是WEIBULL分布为基础的ACD模型的显著性却没有这么好。它们有着同样的ACD模型结构,唯一不同的就是有着不同的基础分布。从这点可以看出基础分布对整个模型的重要性。相对于有着合适基础分布的LOG-ACD模型来说,那些结构更为复杂的模型,如SVD或TACD,表现反而更差。

POISON0.080.070.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951GARCH0.070.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951BACD0.070.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951GGACD0.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951WACD0.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951BLACD10.070.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.95137

第5章实证分析

GGLACD10.070.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951WACD20.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951GGLACD20.070.060.050.040.030.020.0100.050.10.150.20.250.30.350.40.450.50.550.60.650.70.750.80.850.90.951

图5.16价格间期样本外数据z-序列的直方图

从图5.16可以看出,对POISSON模型以及基于指数分布或WEIBULL分布的ACD模型来说,它们对应的z序列与正态分布最大的背离来自于观测太少地落入其分布的左侧,这说明它们相对于真实分布的左侧更为重尾。与此同时,那些次小的区间(第五到第六个直方)中有太多的观测落入,可能代表对应分位数间密度估计过轻。值得注意的一点是在所有的ACD模型中,基于WEIBULL分布的ACD模型表现相对最差,这很可能是因为对WEIBULL分布的形态参数γ的估计总是比1小,使在x趋向于0时其密度趋向于无穷。这就使在非常小的区间段,相对于密度函数的预估,总是不可能有足够多的观测实际发生。从这些直方图中我们看出,作为一个好的ACD模型的基础分布,其一大特征就是在较小的值上有较大的密度,但在非常小的值上的密度不能太大。而广义GAMMA分布,BURR分布都具有此项特征。

另一个好消息是LOG-ACD模型与线性ACD模型相比并不表现更差,有时还表现的好一些。这对于关于金融微观结构的研究意义重大,因为LOG-ACD模型中可以相对自由地添加新的自变量,而不必对其系数有非负的。

38

第6章结论与展望

第6章 结论与展望

6.1 本文结论

本文介绍了一种关于金融高频数据的新的研究框架:随机间期模型以及此框架下的几种各不相同的模型。在将这些模型应用于股指期货高频数据实证分析的过程中,我们使用了密度预估的方法,对这些模型间进行了横向比较。从直观的比较结果显示,其中相对简单和直接的模型反而有较好的预测效果。而模型的优劣也与其基础分布息息相关。通过对估计结果的细致分析,我们指出适宜于高频数据的基础分布所需具有的特征。除此之外,在数据分析和模型验证的过程中,股指期货市场的微观金融结构也显现在我们面前。事实证明,基于随机间期模型的高频数据框架对我国的股指期货市场的分析是有效的,而这一特殊的市场,和以往的单边的,相对低流动性的其它金融市场也存在着很大的不同。

本文虽是将高频数据分析的方法应用于我国的股指期货市场,但其思想具有普适性,同样可以应用于如股票、债券等其它金融市场。随着我国金融改革的进一步深化,相信在不久的将来相关监管部门将会推出更多创新性和市场性的金融产品和金融衍生产品。届时,高频数据分析和其它统计分析方法将继续在我国金融市场中大放异彩。

6.2 研究展望

本文使用了密度预估的方法,对各种随机间期模型间进行了横向比较,但这只是高频数据分析的最初一步。经过实证研究,我们认为还有以下几点值得关注:

1)本文使用的几个模型相对而言结构比较简单,虽然其中一些模型的模拟结果还不错,但不排除需要更复杂模型更准确描述的市场结构。在模型的种类和深度上,还可以继续进一步深挖。

2)本文虽然使用金融间期模型对股指期货的微观金融结构有了一个初步的刻画,但其背后的机理还需要进一步研究。最终我们希望通过精细的模型刻画,寻找市场运作的模式,如买卖价差的形成,成交价的变动,波动率的形成等等。

3)除了理论上的研究外,一个合适的微观模型还能在实际应中帮助我们寻找更精细和优化的投资交易策略。从理论研究到投资策略再到实战操作,还有很

长的一段路要走。

39

参考文献

参考文献 

胡心瀚,叶五一,缪柏其(2010). 基于Copula-ACD模型的股票连涨和连跌收益率

风险分析[J]. 系统工程理论与实践. Vol. 30, No. 2. Feb., 2010.

Andersen. T. and Bollerslev. T. , Diebold. F. And Lebys.P. , 1999, The Distribution of Ex change Rate Volatility,working paper, NBER.

Bauwens, L., & Veredas, D. (1999). The stochastic conditionalduration model: A latent factor model for the analysis of financialdurations, CORE Discussion Paper 9958, University ofLouvain. Forthcoming in Journal of Econometrics (2003). Bauwens, L., & Giot, P. (2000). The logarithmic ACD model: Anapplication to the bid-ask quote process of three NYSE stocks.Annales d’Economie et de Statistique, 60, 117–149.

Brock, W. A., Dechert, W. D., Scheinkman, J. A., & LeBaron, B.(1996). A test for independence based on the correlation dimension.Econometric Reviews, 15, 197–235.

Diebold, F. X., Gunther, T. A., & Tay, A. S. (1998). Evaluatingdensity forecasts with applications to financial risk management.International Economic Review, 39, 863– 883.

Engle, R. F. (1982). Autoregressive conditional heteroskedasticitywith estimates of

the variance of United Kingdom inflation.Econometrica, 50, 987–1007.

Engle, R. F., & Russell, J. R. (1997). Forecasting the frequency of changes in quoted foreign exchange prices with the autoregressive conditional duration model. Journal of Empirical Finance, 4, 187– 212.

Engle R. F.; Jeffrey R Russell, 1998, Autoregressive conditional duration: A new model for irregularly spaced transaction data, Econometrica; Sep 1998; 66, 5; ABI/INFORM Global, pg. 1127

Easley, D., Kiefer, N., O’Hara, M., & Paperman, J. P. (1996).Liquidity, information and infrequently traded stocks. Journalof Finance, 51, 1405–1436.

Fama EF.The behavior of stock market prices. Journal of Business, 1965,38:43_45 Ghysels, E., Gourieroux, C., & Jasiak, J. (1998). Stochastic volatility duration models.

In Olsen, et al. (Eds.), High FrequencyData in Finance II: Proceedings, Zurich. Journal of Econometrics,Forthcoming in the Journal of Econometrics 2003. Gourieroux, C., & Monfort, A. (1996). Simulation-based econometric methods. Oxford: Oxford Univ. Press.

41

参考文献

Gourieroux, C., & Jasiak, J. (2001). Dynamic factor models. Econometric Reviews, 20(4), 385– 424.

Gourieroux, C., Jasiak, J., & Le Fol, G. (1999). Intraday market activity. Journal of Financial Markets, 2, 193–226.

Grammig, J., & Maurer, K. -O. (2000). Non-monotonic hazardfunctions and the autoregressive conditional duration model.The Econometrics Journal, 3, 16–38. Lancaster, T. (1990). The econometric analysis of transition data.Cambridge: Cambridge Univ. Press.

Luc Bauwensa, Pierre Giotb, Joachim Grammigc, David Veredasd, A comparison of financial duration models via density forecasts,International Journal of Forecasting 20 (2004) 5– 609

Lunde, A. (1999). A generalized gamma autoregressive conditionalduration model. Aalborg University.

Prigent, J. -L., Renault, E., & Scaillet, O. (2001). An autoregressiveconditional binomial option pricing model. In Geman, Madan,Pliska, & Vorst (Eds.), Selected Papers from the First WorldCongress of the Bachelier Finance Society (pp. 353– 373). Heidelberg:Springer.

Prigent, J. -L., Renault, E., & Scaillet, O. (2001). An autoregressiveconditional binomial option pricing model. In Geman, Madan,Pliska, & Vorst (Eds.), Selected Papers from the First WorldCongress of the Bachelier Finance Society (pp. 353– 373). Heidelberg:Springer.

Rosenblatt, R. F. (1952). Remarks on a multivariate transformation.Annals of Mathematical Statistics, 23, 470–472.

Zhang, M. Y., Russell, J., & Tsay, R. S. (2001). A nonlinearautoregressive conditional duration model with applications tofinancial transaction data. Journal of Econometrics, 104,179– 207.

42

股指期货中的高频数据分析

作者:

学位授予单位:

刘念良

中国科学技术大学

本文链接:http://d.g.wanfangdata.com.cn/Thesis_D142036.aspx

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- 91gzw.com 版权所有 湘ICP备2023023988号-2

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务