[提要] 本文使用日内高频数据对PGARCH模型进行估计:根据日内高频数据构造的波动率代表,探究PGARCH波动率模型的拟极大似然估计(QMLE)及其渐近分布。模拟研究和实证分析表明:基于高频数据的QMLE可以减小参数估计的方差,有效地提高估计效率。
关键词:PGARCH;QMLE;渐近正态性;高频数据
中图分类号:F83 文献标识码:A
收录日期:2023年3月24日
引言
波动率作为衡量标的资产价格波动程度的指标,是金融学中的重要概念。准确衡量和预测波动率的大小一直是金融市场的一个热点问题。在传统经济学中,期权定价理论假设了波动率是一个常数,Engle(1982)提出的自回归条件异方差(ARCH)模型则打破了该假设。在此基础上,为了解决ARCH模型参数限制多和估计困难的问题,Bollerslev(1986)提出了广义自回归条件方差(GARCH)模型。此后,越来越多的GARCH族模型广泛应用于风险管理、资产配置和投资策略等方面。例如,毛春元和余家华(2013)基于TGARCH模型对中国石油天然气集团公司股票收益率进行了风险度量。Coenraad和Sven(2017)将GJR-GARCH模型和EGARCH模型应用于南非TOP40指数的期权定价。Nugroho(2019)应用GARCH-M模型对道琼工业指数的时变波动率进行了建模。本文中讨论的PGARCH模型,既是对GARCH模型在幂次项上的变形,也是由Hwang(2004)提出的PTGARCH(1,1)模型的一种特殊情况。PGARCH模型增加了波动率的幂次项是一个待估参数的设定,具体模型如下:
rn=σnzn (1)
σ2δn=ω+αr2δn-1+βσ2δn-1 (2)
其中,待估参数δ>0,ω>0,α>0,β>0。 rn表示某标的资产第n天的日收益率。σn表示第n天的波动率,用于衡量资产波动大小,是一个非负的不可观测的变量。{zn}是一组期望为0、方差为1的独立同分布的随机序列,且zn独立于σs(s<n)。
随着互联网技术的快速发展,高频数据在金融业和其他领域有着广泛的应用。为了提高参数估计精度,Visser(2011)利用高频数据来研究基于波动率代表的GARCH模型的拟极大似然估计(QMLE),这为如何使用日内高频数据对波动率建模提供了新途径。Fan(2017)将日内数据植入周期GARCH模型用于季节性波动研究和建模。Podobnik(2004)使用一分钟频率的高频数据来对ARCH-GARCH模型建模。基于上述研究,本文将运用高频数据来构造波动率代表从而对PGARCH模型进行QMLE估计,同时探究参数估计的精度是否有所提升。
一、PGARCH模型分析
(一)尺度模型。日频的PGARCH模型是一个离散的随机模型,记录了每日的波动率和收益率数据。为了植入高频数据,需要建立一个连续的日内收益过程,参考Visser(2011)构建尺度模型:首先将交易日的交易时间单位化到区间[0,1]上,u记为交易时间,u∈[0,1];接着把模型(1)中的离散日收益过程拓展为连续的日内收益过程Rn(u),记录每天的日内收益率;从模型(1)、模型(2),得到以下尺度模型:
Rn(u)=σnZn(u),0≤u≤1 (3)
σ2δn=ω+αr2δn-1+βσ2δn-1 (4)
可以看出,整合了高频信息的尺度模型(3)~(4)保留了日频PGARCH模型(1)~(2)相似的结构形式,并且当u=1,Rn(1)=rn,Zn(1)=zn,尺度模型即转化为了日频模型(1)~(2)。Zn(u)依然是期望为0的、方差为1的独立同分布的随机变量,并独立于σs(s<n)。
(二)波动率代表。为了更好地估计参数,需要进一步加工日内高频数据。一种可行的方法是引入波动率代表。波动率代表是关于日内高频数据的一元函数,常见的波动率代表有已实现波动率和日内价格极差。一般来说,波动率代表是非负的且满足正齐性,即存在非零常数α和日内收益率Rn(u)满足:
H(αRn(u))=αH(Rn(u)),α>0 (5)
考虑到每个交易日的波动率是唯一确定的,可以视为常数,则由波动率代表的正齐性及尺度模型(3)和模型(4)得:
Hn=H(Rn(u))=H(σnZn(u))=σnH(Zn(u)) (6)
设μ=■,将其带入式(6)得:
Hn=σnH(Zn(u))=σn×μ■=σ*nZ*n (7)
那么,整合了高频信息的波动率代表模型可以写为:
Hn=σ*nZ*n (8)
σ■■=ω*+α*r■■+β*σ■■ (9)
其中,μ>0,Z*n是经过标准化的独立同分布的随机序列, E(Z*2n)=1。比较模型(1)~(2)和模型 (8)~(9),二者有着相似的结构形式。前者恰好是后者的一个特例,当Hn=|rn|时,模型(8)~(9)可以写成模型(1)~(2)的形式。前者的待估参数为θ=(δ,ω,α,β)′,后者的待估参数为θ*=(δ*,ω*,α*,β*)′ ,二者之间有以下数量关系:
ω*=ωμ2δ,α*=αμ2δ,β*=β,δ*=δ (10)
二、参数估计
(一)拟极大似然估计。在进行模型(8)~(9)的估计前,记其参数真值为θ*0=(δ*0,ω*0,α*0,β*0)′ 。参考Pan(2008)和Visser(2011),对模型(8)~(9)采用拟极大似然估计,得到的拟条件对数似然函数及估计量(QLME)分别如下:
LN=■ln(θ*)=■-■log(σ*2n(θ*))+■ (11)
■*=arg maxLn(θ*) (12)
根据Pan(2008),为了证明QMLE估计具有一致性和渐近正态性,需要做出以下基本假设:
1、Z*n服从非退化的对称分布,且存在某些△>0使得E|Zn|△
<+∞和对于任何的μ>0有■n-μP{Z*2n≤n}。
2、参数空间Θ是R4上的紧凑子集,θ*是Θ的内点。对于所有的θ*∈Θ,都有李雅普诺夫指数γ(θ*)<0。
3、E(Z*2n)=1,且EZ*4n<∞。
由此可得■*的渐近分布:
■(■*0-θ*0)■N(0,∑*),N→∞ (13)
其中,∑*=A-10B0A-10,且矩阵A0和B0内的元素如下所示:
(A0)i,j=E(■) (14)
(B0)i,j=E(■■) (15)
进一步计算似然函数对待估参数的一阶偏导和二阶偏导:
■=■=■■-■■ (16)
■=■=■■■+■(■) (17)
由于Z*n与σ*n独立,E(Z*2n)=1,结合式(8),矩阵A0和B0内的元素为:
(A0)i,j=E(■)=E(■■■) (18)
(B0)i,,j=E[■■]=Var(Z*2n)E(■■■) (19)
从而,渐近方差阵∑*=A-10B0A-10=Var(Z*2n)G(θ*0)-1。计算矩阵G-1中需要的参数偏导:
σ■■=ω*+α*r■■+β*σ■■=■+α*■β*i-1r■■ (20)
■=e■[-■+■],■=■ (21)
■=■,
■=■ (22)
上式中,Cn=■+α*■β■r■■,kn=α*■β■r■■lnr2n-i。
记参数■*=(■*,■*,■*,■*)′的渐近方差为(σ*2δ,σ*2ω,σ*2α,σ*2β,)′,那么模型(3)~(4)的参数■=(■,■,■,■)′的渐近分布分别为:■(■-δ0)■(0,σ*2δ),■(■-ω0)■(0,■),■(■-α0)■(0,■),■(■-β0)■(0,σ*2β)。
(二)日频参数θ=(δ,ω,α,β)′的估计。由QMLE方法估计得到PGARCH模型参数的估计值■*=(■*,■*,■*,■*)′,结合公式(10),即可得到θ的估计。此时,需要计算μ。由等式σ*n=σnμ可得μ的一个估计量:
■=■■■*n/■n (23)
其中,■*n表示经高频数据估算得到的波动率估计值,■n表示Hn=|rn|时得到的波动率估计值。
使用不同的波动率代表,估计得到的参数精度是有所差异的。针对这种情况,Visser(2011)提供了一个估计效率的判别策略:估计方法的好坏由模型的残差项Z*2n决定,当残差项方差越小,参数估计的方差也越小,估计越有效。而Z*2n方差大小与MH值的大小成正比关系。
Var(Z*2n)=E(Z*2n-E(Z*2n))2
=E(Z*4n)-1=■-1 (24)
考虑到σ*n和Z*n的独立性,则有:
E(Hn)=E(σnH(Zn(u)))=E(σn)E(H(Zn(u))) (25)
显然,c=E(σ4n)/[E(σ2n)]2是一个常数,当我们通过乘以常数c并省略1来变换方差方程(24)时,我们可以如下导出MH统计量:
MH=■ (26)
由于式(24)和式(26)成正比关系,寻找参数的渐近方差最小的问题就就转换为最小的统计量MH问题。此时,MH值越小,估计精度越高,估计越有效。
三、模拟研究
在本节中,通过模拟研究来检验该方法的实用性:首先对PGARCH模型进行建模,接着对该模型采用QMLE估计,最后将估计得到的参数结果分别从偏差(Bias)、标准差(SD)和MH统计量的均值(Mean.MH)的角度来评估QMLE估计的效果。上述实验重复1,000次。为了达到模拟的效果,需要模拟日内的标准化随机过程Zn(u),这里使用平稳的Ornstein-Uhlenbeck过程建模:
dΓn(u)=-φ(Γn(u)-uΓ)du+σΓdB(2)n(u) (27)
dZn(u)=-exp(Γn(u))dB(1)n(u),u∈[0,1] (28)
其中,φ=■,σr=■,μr=-■。两个布朗运动B(2)n和B(1)n是不相关的。Zn(0)=0,Γn(0)从平稳分布N(μr,σ2T)中随机产生。u∈[0,1],日内的交易时间[0,1]被划分为等份的240个区间,每个等分区间对应交易日的1分钟频率交易数据,每5个等分区间对应交易日的5分钟频率的交易数据。以此类推,得到离散化的日内标准过程Zn(u)。进一步的,方程(4)中的参数真值设为θ0=(0.8,0.2,0.3,0.55)′。接着考虑不同频率的波动率代表,本文选择了频率为5分钟、10分钟、15五分钟、30分钟的已实现波动率和日收益率的波动率代表,分别记为RV5、RV10、RV15、RV30、|rn|。以十分钟的已实现波动率为例,其计算公式为:
Hn=RV10=[■(Rn(ui×10)-Rn(u(i-1)×10))]■ (29)
其中,设置初值Rn(0)=0,日频的PGARCH模型则对应波动率代表Hn=|rn|。在模拟中,样本量分别设置为500天、1,000天和1,500天。于是在一次模拟中MH的估计值如下:
■=(■■H4n)/(■■H2n)2=N■H4n/(■H2n)2 (30)
模拟结果展示在表1。从表1可以看出,在同一样本量下,与|rn|相比,通过高频的波动率代表RV估计得到的参数偏差和标准差明显变小,但采用不同的高频RV估计得到的参数偏差和标准差差异不大,无明显变化规律。比较不同的Mean.MH,通过RV计算的Mean.MH值也都比|rn|小。而随着样本量的增大,相同高频的RV估计的参数偏差和标准差也逐渐减小,这符合一致性和渐近正态性的性质,MH均值的减小也说明随着样本量的增加估计精度提高。表1中,样本量N=500时,Mean.MH最小值出现在RV10的情况下,这说明此时的估计最有效。表1中样本量N=1000时,Mean.MH最小值出现在RV5的情况下,这说明此时的估计最有效。参数估计的标准差最小时,与之对应的Mean.MH值也最小,说明上一节讨论的最优波动率代表评判标准是合理的。综合来看,引入的高频信息并不是越多估计效果越好,但引入了高频信息的已实现波动率(RV)比日频信息的|rn|的估计效果好,高频数据的使用使得PGARCH模型的估计精度有所提高。(表1)
四、实证分析
在本节中,将上述方法应用到实例,数据源是2008年4月28日到 2013年6月23日的沪深300指数。数据包含1分钟间隔的收盘价格信息,每天共241个观测值,一共包含1,272个交易日。记价格序列{Pn(u),u∈[0,1],n=1,2,…,1272},定义第n天u时刻的日内对数收益率为:
Rn(u)=[logPn(u)-logPn-1(u)]×100 (31)
应用QMLE方法,采用不同频率的已实现波动率对PGARCH的估计结果如表2所示。表2展示了由不同频率的RV和|rn|估计得到的参数值和残差项方差。由表2可知,残差项方差最小的结果是基于RV15的结果。根据表2,对比基于|rn|和基于RV15的拟合得到的PGARCH模型。(表2)
波动率代表为日收益率|rn|时,拟合的PGARCH模型为:
σ3.4565n=0.0522+0.0157r3.4565n-1+0.9433σ3.4565n-1 (32)
波动率代表为15分钟收益率时,拟合的PGARCH模型为:
σ3.127n=0.0558+0.0522r3.127n-1+0.8905σ3.127n-1 (33)
图1刻画了基于|rn|估计的波动率和基于RV15估算的波动率代表的时序图。可以看出,二者的走势相同,整体上15分钟的波动率比日频的波动率更小,但在峰值二者相差不大。这说明涵盖了高频信息的波动率既能敏锐地捕捉波动率的急剧变化,也能稳定地刻画出波动率相对平缓时期的特征。(图1)
结语
在本文中,我们通过波动率代表将高频数据嵌入日频的PGARCH模型,并对模型进行QMLE估计,给出估计参数的渐近分布。模拟研究和实证分析证明,引入高频信息有助于提高PGARCH模型的估计精度。
(作者单位:广州大学经济与统计学院)
主要参考文献:
[1]Robert F.Engle.Autoregressive Conditional Heteroscedasticity with
Estimates of the Variance of United Kingdom Inflation[J].Econometrica,1982.50(04).
[2]Bollerslev Tim.Generalized autoregressive conditional
heteroskedasticity[J].Journal
of Econometrics,1986.31(03).
[3]Chunyuan Mao,Jiahua Yu.Empirical Analysis on
CNPC Stock Risk Measurement of Returns Ratio Based on TGARCH Model[J].Statistical and Application,2013.02(03).
[4]Coenraad C.A.Labuschagne1,Sven T.von
Boetticher.The GJR-GARCH and EGARCH option pricing models which incorporate the
Piterbarg methodology[C].International
Conference on Economics,Finance and Statistics (ICEFS 2017).Atlantis Press,2017(06).
[5]D B Nugroho,D Kurniawati,L P Panjaitan,Z Kholil,B Susanto,L R Sasongko. Empirical
performance of GARCH,GARCH-M,GJR-GARCH
and log-GARCH models for returns volatility[J].Journal of Physics: Conference Series,2019.
[6]S.Y.Hwang,I.V.Basawa.Stationarity and moment
structure for Box-Cox transformed threshold GARCH(1,1) processes[J].Statistics & Probability,2004.
[7]Visser,Marcel P.GARCH Parameter Estimation
Using High-Frequency Data[J].Journal
of Financial Econometrics,2011.09(01).
[8]S.Y.Hwanga,I.V.Basawa.Estimation and tests
for power-transformed and threshold GARCH models[J].Journal of Econometrics,2008.142(01).
|