首页 期刊简介 最新目录 过往期刊 在线投稿 欢迎订阅 访客留言 联系我们
新版网站改版了,欢迎提出建议。
访客留言
邮箱:
留言:
  
联系我们

合作经济与科技杂志社

地址:石家庄市建设南大街21号

邮编:050011

电话:0311-86049879
友情链接
·中国知网 ·万方数据
·北京超星 ·重庆维普
金融/投资
基于马尔可夫链的股票价格波动预测
第671期 作者:□文/刘致谦 时间:2021/12/16 16:03:29 浏览:767次
[提要] 本文首先对股票价格历史数据进行预处理和分析;其次对预处理后的数据进行马氏性检验,结果显示数据符合马氏性,然后建立马尔可夫链模型;最后通过计算概率转移矩阵得出概率转移向量,进而达到对股票价格波动率区间的预测。预测结果显示:在正常情况下,用此模型预测的股票价格波动率区间与实际数据在短期内预测结果保持一致,但随着时间的推移预测结果稍有偏差。此外,马尔可夫链模型适用于短期的股票价格波动率预测,并且对以往数据依赖性极大。
关键词:股票价格;马尔可夫链;预测;概率转移矩阵
中图分类号:F222 文献标识码:A
收录日期:2021年8月4日
一、前言
股票作为金融市场最重要的金融工具之一,预测其价格波动及用何种方法进行预测一直都是金融领域研究的焦点问题之一。股票市场是一个数据非常庞大且非常复杂的非线性系统,对其进行预测十分困难,部分学者认为股市预测不可行。但是,仍然有许多国内外学者和投资者采用不同的预测方法得到较好的预测结果。
多年来,相关研究者提出了各种预测方法,早期大部分学者主要采用回归分析法、自回归模型、移动平均自回归模型、差分自回归移动平均模型、VAR(向量自回归模型)等方法进行股票价格预测。但由于股票价格波动的剧烈性、非线性以及数据噪声的影响,导致这些方法无法准确地描述和刻画股票价格变化的内在规律。因此,为了改进传统线性模型的缺陷,更好地进行股票价格预测,又衍生出ARCH模型、GARCH模型、模糊神经网络、BP神经网络、随机森林、支持向量机和极限学习机等方法,预测精度有了较大程度的提高。
Sneha Soni首次提出将分类回归树、线性判别分析和二次判别分析三种有监督机器学习算法结合起来对印度股市数据进行分类,分别以二叉树、线性曲面和二次曲面的形式给出股市数据的简单解释。Saeed Al-Salkhadi首次将多项式分类器应用于股票价格预测。Qinglan Ye提出了一种改进小波神经网络的方法。马健等利用改进型误差函数的复值BP模型来对股票的价格进行预测。张贵生等提出了一种基于近邻互信息特征选择的SVM-GARCH预测模型。邓晶针对股票预测问题,通过对不同股票进行股价涨跌的实验发现,在多个纯技术指标下,参数优化后的随机森林对股票的预测模型相对更具有可靠性。包振山主要针对LSTM模型的输出模块进行了改进,最终获取下一刻股票的涨跌信号。
总之,研究股票价格的方法各种各样,总结出来有三类:基于统计学方法的股票价格波动预测模型、机器学习预测模型和基于随机过程的预测模型。以统计原理为基础的预测模型主要有回归分析法、自回归模型、移动平均自回归模型、差分自回归移动平均模型、向量自回归模型、GARCH模型、Logit模型、Bayes方法、支持向量机等,许多学者基于该类模型发表了文章。此外,机器学习预测模型也被学者们广泛研究,而机器学习预测模型主要以神经网络预测模型为代表。在基于随机过程的预测模型中,马尔可夫预测引起学者们的重视。
二、马尔可夫链模型的理论基础
(一)马尔可夫链的定义。随机过程{Xn,n=0,1,2,…}称为Markov链,若它只取有限或可列个值,并且对任意n≥0,及任意状态i,j,i0,i1,…,in-1,有:
P{Xn+1=jXn=i,Xn-1=in-1,…,X1=i1,X0=i0}
=P{Xn+1=jXn=i} (1)
式中,Xn=i表示过程在时刻n处于状态i,称{0,1,2,…}为该过程的状态空间,记为S。式(1)刻画了Markov链的特性,称为Markov性。对Markov链,给定过去的状态X0,X1,…,Xn-1及现在的状态Xn,将来的状态Xn+1的条件分布与过去的状态独立,只依赖于现在的状态。
称式(1)中的条件概率P{Xn+1=jXn=i}为Markov链{Xn,n=0,1,2,…}的一步转移概率,记为Pij,它代表处于状态i的过程下一步转移到状态j的概率。
一般情况下,转移概率与状态i,j和时刻n有关。
当Markov链的转移概率pij=P{Xn+1=jXn=i}只与状态i,j有关,而与n无关时,称为时齐Markov链。
将pij(i,j∈S)排成一个矩阵形式,令:
p=(pij)=■
称p为转移概率矩阵,一般简称为转移矩阵。由于概率是非负的,且过程必须转移到某种状态,所以容易看出pij(i,j∈S)有性质:
(1)pij≥0,i,j∈S;(2)■pij=1,?坌i∈S。
记初始状态概率向量为π(0),第n期状态概率向量为π(n),π(n)=π(0)pn。
由以上定义可以总结出马尔可夫过程有3个特点:离散性、随机性、无后效性。
(二)n步转移概率
定义:称条件概率
pij(n )=P{Xm+n=jXm=i},i,j∈S;m≥0;n≥1 (2)
为Markov链的n步转移概率,相应地称p(n )=(pij(n ))为n步转移概率矩阵。
当n=1时,pij(1 )=pij,P(1 )=P,此外规定:
pij(0 )=0,i≠j1,i=j (3)
显然,n步转移概率pij(n )是指系统从状态i经过n步后转移到状态j的概率,它对中间n-1步转移经过的状态无要求。
由C-K方程可知:Pn=P·P(n-1 )=P·P·P(n-2 )=…=Pn (4)
(三)马氏性检验。在建立马尔科夫链模型时,首先需要思考的就是被研究的数据是否符合马尔可夫过程。所以,在做预测之前,首先需要对数据进行“马氏性”检验。如果没有对数据进行“马氏性”检验,那么得出的结论就不是客观的,预测的结果也不是科学的。
马氏性检验定理:假设被研究的时间序列值可能包含m个状态,用fij表示时间序列,x1,x2,…,xn中从原来的状态i转移到状态j的频数,i,j∈S。将转移频数矩阵的第j列与各行各列的总和相除所得的数值记为“边际概率”,为p.j,即:
p.j=■
则统计量χ2=2■■fijlog■以自由度为(m-1)2的χ2分布为极限分布,其中pij=■。且给定显著性水平α,若χ2>χ2α((m-1)2),则认为{xi}是符合马氏性这一特征的,反之则不符合。
三、股票价格预测
本文以招商银行股票价格为例,通过马尔可夫链模型对在网易财经网上搜集到的数据进行分析,预测股票价格走势。此次研究收集从2020年9月2日~2020年11月5日的41个时间序列数据,进行每日收盘价格波动状态预测,单位:元/股。
(一)基于马尔可夫链的股票每日收盘价格波动状态预测
1、对价格时间序列数据分类。对股票每日收盘价格增长率进行有序聚类法分析处理,可将41组数据分为[-10%,-2%)、[-2%,-1%)、[-1%,0%)、[0%,1%)、[1%,2%)、[2%,10%)6个状态空间,用 S1、S2、“S3、S4、S5、S6表示这6种状态,如表1所示。(表1)
2、建立股票每日收盘价格波动状态转移矩阵。根据表1得出价格增长率状态转移情况,如表2所示。(表2)
由表2可得,状态转移频数矩阵fij和状态转移概率矩阵pij,如下所示:
fij=■
pij=■
3、马氏性检验。由状态转移概率矩阵pij得到边际转移概率值,分别为:p.1=1/13,p.2=145/182,p.3=5297/2730,p.4=881/455,p.5=291/910,p.6=2539/2730。(表3)
给定显著性水平α=0.05,查χ2分布表可得分位点χ2α((m-1)2)=χ2α(25)=37.652。因为χ2=52.284>χ2α(25),所以招商银行股票价格时间序列满足马氏性。
4、预测股票价格区间。首先根据式(4)C-K方程,求出2,3,4,5,6阶状态转移概率矩阵,然后通过从各阶状态转移矩阵计算出相应的状态转移向量,进而达到对股票价格增长率状态的预测。
P(2 )=■
P(3 )=■
P(4 )=■
P(5 )=■
P(6 )=■
2020年11月5日,招商银行股票价格增长率为-0.33%处于区间[-1%,0%),所以属于状态S3,初始状态向量定义为π(0)=(0 0 1 0 0 0)。则一步概率转移向量为π(1)=π(0)P=(0 0 0.4 0.2 0.1 0.3),由此可以预测出2020年11月6日的价格增长率处于状态S3,预测概率为40%,即对应的区间为[-1%,0%),实际增长率为-0.72%,处于区间[-1%,0%),预测比较准确。下面,可由两步转移概率向量π(2)=π(0)P2=(0.015 0.074 0.249 0.337 0.098 0.227)预测出2020年11月9日(7日、8日为周末市场没有交易)的价格增长率所处的状态为S4,则对应的状态区间为[0%,1%),实际增长率为1.29%,虽然没有预测在准确的区间内,但是实际增长率很靠近预测区间,差距不大,有参考价值。同理,可根据π(3)、π(4)、π(5)、π(6)预测出对应的状态区间如表4所示。(表4、表5)
(二)股票价格波动预测结果分析。招商银行股票价格波动预测结果表明,对短期的股票价格波动率预测是相当准确的,随着预测日的增加预测结果与实际稍有差别,预测的结果与真实结果虽然不在同一个状态,但是都是呈增长状态,例如根据两步转移概率向量预测,招商银行2020年11月9日的股票增长率属于状态S4,也就是意味着增长区间为[0%,1%),而实际增长率为1.29%,属于区间[1%,2%),预测状态与状态不符,但是1.29%很接近1%,所以预测的结果有一定的参考意义。但是在预测日超过5天的情况下,预测基本无效。股票价格波动是非线性的,金融环境的微小改变就可能导致股票价格的大范围波动。预测不准确的原因主要有两个方面:一方面是国家颁布的货币政策和财政政策;另一方面是由突发事件造成的,例如受新冠肺炎疫情影响,各航空公司股票价格连续大跌。
四、结论
利用马尔可夫链建模分析股票价格走势情况,结果表明用马尔可夫链预测受历史数据影响较大,对短期股票价格变化更适合运用马尔可夫链来预测,准确率也相对较高,随着时间的增加预测结果虽然有时候不太准确,但是与真实状态偏离不太多,也有参考价值。然而,股票的价格存在太多不确定因素,受国家政策、自然灾害影响,还有投机者情绪影响等。由此可知,马尔科夫链模型适合于稳定的、波动较小的、短期的指标值序列的预测,并且还能得到相对较好的结果;而对于受环境影响和变化范围比较大的、长期性的指标值序列,如果用马尔科夫链模型来预测其状态变化,那么结果就有点差强人意了。
(作者单位:西安财经大学统计学院)

主要参考文献:
[1]Sneha Soni,Shailendra Shrivastava.Classification of Indian Stock Market Data Using Machine Learning Algorithms[J].International Journal on Computer Science and Engineering,2010.02(09).
[2]Saeed Al-Salkhadi,Hazim El-Baz,Khaled Assaleh.Predicting Stock Prices Using Polynomial Classifiers:The Case of Dubai Financial Market[J].Journal of Intelligent Learning Systems and Applications,2011.03(02).
[3]Qinglan Ye,Lianxin Wei.The Prediction of Stock Price Based on Improved Wavelet Neural Network[J].Open Journal of Applied Sciences,2015.05(04).
[4]马健,盛魁,董辉.基于改进型误差函数的复值BP神经网络对股票价格的预测研究[J].长春师范大学学报,2018.37(06).
[5]张贵生,张信东.基于近邻互信息的SVM-GARCH股票价格预测模型研究[J].中国管理科学,2016.24(09).
[6]邓晶,李路.参数优化随机森林在股票预测中的应用[J].软件,2020.41(01).
[7]包振山,郭俊南,谢源,张文博.基于LSTM-GA的股票价格涨跌预测模型[J].计算机科学,2020.47(S1).
[8]阎春宁,刘瑞辉,张欢欢.基于马尔可夫链改进股市的预测精度[J].统计与决策,2016(08).
[9]陈嘉晋,李登明.马尔科夫链模型对股价短期变动趋势的研究——以伊利集团为例[J].经济研究导刊,2019(10).
[10]王增民,王开珏.基于灰色加权马尔可夫链的移动通信市场预测[J].数学的实践与认识,2012.42(22).

 
版权所有:合作经济与科技杂志社 备案号:冀ICP备12020543号
您是本站第 32499521 位访客