[提要] 本文研究简单金融市场下两个投资者的时间一致均值-方差投资组合博弈问题。投资者投资于包含一种无风险资产和两种风险资产的金融市场,风险股票价格服从几何布朗运动,并且两种风险资产之间是相关的。每个投资者选择最优投资组合策略,使得均值-方差最优化。利用动态规划原理,给出相应的检验定理,分别得到两个投资者的最优投资策略和最优值函数的显式表达式。
关键词:几何布朗运动;均值-方差;推广的HJB方程;投资组合;随机微分博弈
中图分类号:F83 文献标识码:A
收录日期:2017年6月16日
一、引言
策略选择问题是金融学研究的一个热点之一。Markowitz最早提出利用数学方法解决此类问题,并给出求解框架。当投资者的目标收益给定时,利用方差描述其风险,形成均值-方差投资组合选择问题。由于Markowitz模型是静态的一阶模型,在现代金融理论中虽然占据重要地位,但仍具有局限性,因为在实际金融市场中,投资者的投资策略可能会随着时间变化而发生变化,因此需要对连续时间模型下的最优投资策略选择问题进行研究。在连续时间问题上,Merton做出了重要贡献。Browne提出连续时间模型下两个投资者之间的零和微分投资组合博弈问题,他们有着不同但相关的投资机会。Chiu与Li和Xie等研究在连续时间情况下进行资产-债务的均值-方差投资组合选择问题。Basak和Chabakauri对金融市场中只有一个股票和一个投资者的情形给出最优值函数和最优投资策略。本文研究金融市场中有两个投资者和三种资产的时间一致均值-方差投资组合博弈问题。
二、模型建立
考虑一个连续时间的简单金融市场由三种资产组成,一个无风险资产和两个风险股票资产。市场中的两个投资者,A和B,可以对无风险资产进行自由投资。但是,对于风险资产,投资者A只能对第一个风险资产进行投资,而投资者B只能对第二个风险资产进行投资。两个投资者的投资期限为T=[0,T],T∈(0,∞),并假设金融市场是无摩擦的,即交易中没有交易费用和交易税,资产是无穷可分的。两个投资者的目标是寻找最优投资策略使两个人的总财富最大化,且在一定风险厌恶情况下减少财富波动。假设一个完备的域流概率空间(?赘,F,P),P是真实概率,F:={F(t);t∈[0,T]}满足通常条件,即F右连续,P完备。用B表示无风险资产的价格,其动态价格过程如下:
dB(t)=rB(t)dt,B0=1 (1)
其中,r为无风险利率,r>0。
令{Wti,t∈T},i=1,2表示(?赘,F,P)上的两个相关的标准布朗运动,相关系数为?籽,即E[Wt1,Wt2]=?籽t,假设?籽2<1。两个风险资产的价格过程Sti服从几何布朗运动,即Sti满足:
dSti=?滋iStidt+?滓iStidWti,S0i=s0i,i=1,2 (2)
其中,?滋i>r为该资产的期望回报率,?滓i为该资产的波动率。
?坌t∈T,令?仔1(t)为投资者A的投资策略,即在时刻t投资到风险资产S1的财富值,其余财富则投资到无风险资产货币市场。令X(?仔1,t)表示投资者A在t时刻的财富值,投资策略为{?仔1(t),t∈T},初始时刻财富X(0)=x0。
在概率测度P下,投资者A的财富动态过程满足随机微分方程:
dX(?仔1,t)=[rX(?仔1,t)+(?滋1-r)?仔1(t)]dt+?滓1?仔1(t)dWt1 (3)
我们以相同方法考虑投资者B的财富过程,X(?仔2,t)表示投资者B在时刻t的财富值,投资策略为{?仔2(t),t∈T},初始时刻财富Y(0)=y0。此时,投资者B的财富动态过程满足随机微分方程:
dY(?仔2,t)=[rY(?仔2,t)+(?滋2-r)?仔2(t)]dt+?滓2?仔2(t)dWt2 (4)
定义1 对投资者A来说,投资策略{?仔1(t),t∈T}称为可行的,如果满足下列条件:
1、{?仔1(t),t∈T}为G循序可测且cadlag(即右连左极)的;
2、E[■?仔■■(t)dt]<∞;
3、关于{?仔1(t),t∈T}的随机微分方程(3)有唯一强解。
令∏1表示投资者A的所有可行投资策略,∏2表示投资者B的所有可行投资策略。
在模型中,?仔1(·)>X(?仔1,·)或?仔2(·)>X(?仔2,·)是允许的,这表示投资者在利用杠杆从货币市场借钱购买股票。
投资者A和B的总财富Z■为:
Z■(t)=X(?仔1,t)+Y(?仔2,t)
利用Ito公式,可得到:
dZ■(t)=[rZ■(t)+(?滋1-r)?仔1(t)+(?滋2-r)?仔2(t)]dt+?滓1?仔1(t)dWt1+?滓2?仔2(t)dWt2 (5)
Z■(0)=z0=x0+y0 (6)
三、目标函数
投资者的目标函数可表述为:
E[Z(T,?仔1,?仔2)]-■Var[Z(T,?仔1,?仔2)] (7)
其中,?仔1∈∏1,?仔2∈∏2,?酌为投资者提前设定的风险厌恶参数。
对固定的时刻t,t∈T,定义Z(T,?仔1,?仔2)=z,对所有的可行投资策略,将问题P■■,P■■分别表述为最大化下列式子:
Et,z[Z(T,?仔1,?仔2)]-■Vart,z[Z(T,?仔1,?仔2)] (8)
Et,z[Z(T,?仔1,?仔2)]-■Vart,z[Z(T,?仔1,?仔2)] (9)
下标t,z表示初始条件。在很多随机控制问题中会涉及到时间一致性问题,时间一致性是指,如果一个控制策略在整个时间区间是最优的,那么它在每一个子区间都是最优的。对通常的时间一致性问题,处理方法是用Bellman最优化准则。而时间不一致的,是我们可以找到最优策略?仔1*,?仔2*,并且运用在区间[0,t],?仔1*,?仔2*并不是问题P■■,P■■的最优策略。针对这种时间不一致问题,可在博弈理论框架下进行研究,将每一个投资者在不同时刻看作不同的博弈者,投资者在每一时刻都有其策略选择,不同时刻的值函数不依赖其之前时刻的策略,由此得到的策略及值函数便是时间一致的。这样对每一个时间不一致问题都存在一个相关的时间一致问题,使得时间一致问题的最优控制和最优值函数和时间不一致问题的最优均衡控制和最优值函数等价。
投资者的目标是找到可行的时间一致的投资策略?仔1*,?仔2*,最大化下列式子:
V■■(t,z)=Et,z[Z(T,?仔1,?仔2)]-■Vart,z[Z(T,?仔1,?仔2)] (10)
V■■(t,z)=Et,z[Z(T,?仔1,?仔2)]-■Vart,z[Z(T,?仔1,?仔2)] (11)
我们就是要找到最优的纳什均衡时间一致投资策略?仔1*,?仔2*,和值函数V1(t,z)、V2(t,z),使得:
V1(t,z)=V■■(t,z)=■V■■(t,z) (12)
V2(t,z)=V■■(t,z)=■V■■(t,z) (13)
纳什均衡策略的定义如下:
定义2 对于博弈问题(5)、(6),损益函数(12)、(13),可行策略组(?仔1*,?仔2*)称为纳什均衡的,如果满足下面的不等式:
V■■(t,z)≥V■■(t,z) (14)
V■■(t,z)≥V■■(t,z) (15)
其中,?仔1∈∏1,?仔2∈∏2,那么,纳什均衡可行策略?仔1*,?仔2*即为最优投资组合策略。
四、模型求解
问题(12)和(13)的解满足下面的检验定理。
定理1(检验定理) 假设定义在[0,T]×R上的函数F1(t,z)、F2(t,z)、G1(t,z)、G2(t,z)、H1(t,z)、H2(t,z)关于t连续可微,关于x二次连续可微。如果F1、F2、G1、G2、H1、H2满足以下推广的HJB方程:
■{F1t+[rz■(t)+(?滋1-r)?仔1(t)+(?滋2-r)?仔2*(t)]F1z+■[?滓12?仔12(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1(t)?仔2*(t)]F1zz-■[?滓12?仔12(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1(t)?仔2*(t)]G1z2}=0 (16)
F1(T,z)=z (17)
G1t+[rz■(t)+(?滋1-r)?仔1*(t)+(?滋2-r)?仔2*(t)]G1z+■[?滓12?仔1*2(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1*(t)?仔2*(t)]G1zz=0 (18)
G1(T,z)=z (19)
H1t+[rz■(t)+(?滋1-r)?仔1*(t)+(?滋2-r)?仔2*(t)]H1z+■[?滓12?仔1*2(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1*(t)?仔2*(t)]H1zz=0 (20)
H1(T,z)=z2 (21)
■{F2t+[rz■(t)+(?滋1-r)?仔1*(t)+(?滋2-r)?仔2(t)]F2z+■[?滓12?仔1*2(t)+?滓22?仔22(t)+2?籽?滓1?滓2?仔1*(t)?仔2(t)]F2zz-■[?滓12?仔1*2(t)+?滓22?仔22(t)+2?籽?滓1?滓2?仔1*(t)?仔2(t)]G2z2}=0 (22)
F2(T,z)=z (23)
G2t+[rz■(t)+(?滋1-r)?仔1*(t)+(?滋2-r)?仔2*(t)]G2z+■[?滓12?仔1*2(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1*(t)?仔2*(t)]G2zz=0 (24)
G2(T,z)=z (25)
H2t+[rz■(t)+(?滋1-r)?仔1*(t)+(?滋2-r)?仔2*(t)]H2z+■[?滓12?仔1*2(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1*(t)?仔2*(t)]H2zz=0 (26)
H2(T,z)=z2 (27)
且
?仔1*=arg■{F1t+[rz■(t)+(?滋1-r)?仔1(t)+(?滋2-r)?仔2*(t)]F1z+■[?滓12?仔12(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1(t)?仔2*(t)]F1zz-■[?滓12?仔12(t)+?滓22?仔2*2(t)+2?籽?滓1?滓2?仔1(t)?仔2*(t)]G1z2} (28)
?仔2*=arg■{F2t+[rz■(t)+(?滋1-r)?仔1*(t)+(?滋2-r)?仔2(t)]F2z+■[?滓12?仔1*2(t)+?滓22?仔22(t)+2?籽?滓1?滓2?仔1*(t)?仔2(t)]F2zz-■[?滓12?仔1*2(t)+?滓22?仔22(t)+2?籽?滓1?滓2?仔1*(t)?仔2(t)]G2z2} (29)
那么,V1(t,z)=F1(t,z),G1(t,z)=Et,z[Z(T,?仔1*,?仔2*),H1(t,z)=Et,z[Z2(T,?仔1*,?仔2*)] (30)
V2(t,z)=F2(t,z),G2(t,z)=Et,z[Z(T,?仔1*,?仔2*),H2(t,z)=Et,z[Z2(T,?仔1*,?仔2*)] (31)
因此,(?仔1*,?仔2*)为时间一致可行投资策略。
证明:该定理的证明过程可参考Kryger和Steffensen中定理1的证明,此处省略。
如果(16)有解,F1满足F1z≥0,F1zz≤0,那么根据(28)、(16)的一阶可导条件得到投资者A的最优投资策略?仔1*(t)如下:
?仔1*(t)=
■ (32)
根据(22)和(29)可得投资者B的最优投资策略?仔2*(t)如下:
?仔2*(t)=
■ (33)
联立方程(32)和(33),可得:
?仔1*(t)=
■(34)
?仔2*(t)=
■(35)
考虑到盈余动态的结构,以及边界条件(17)和(23),可对相关函数形式做如下猜想:
F1(t,z)=A(t)z+■ (36)
F2(t,z)=C(t)z+■ (37)
G1(t,z)=m(t)z+■ (38)
G2(t,z)=p(t)z+■ (39)
及边界条件:
A(T)=C(T)=m(T)=p(T)=1 (40)
B(T)=D(T)=n(T)=q(T)=1 (41)
将相关函数的一阶二阶偏导数代入(34)和(35),可得:
?仔1*(t)=
■ (42)
?仔2*(t)=
■ (43)
将(42)和(43)及F1、G1、F2、G2的相关导数代入到(16)、(18)、(22)和(24),化简整理,并考虑到边界条件(40)和(41),可求解得:
A(t)=C(t)=m(t)=p(t)=er(T-t) (44)
B(t)={■-■-■[■]2-■[■]2+?籽■·■}(T-t) (45)
D(t)={■-■-■[■]2-■[■]2+?籽■·■}(T-t) (46)
n(t)=[■-■](T-t) (47)
q(t)=[■-■](T-t) (48)
基于以上讨论,我们可得到下面的定理:
定理2 在风险股票价格服从几何布朗运动条件下,对于两个投资者的时间一致均值-方差投资策略选择问题,最优时间一致投资策略为:
?仔1*(t)=■e-r(T-t) (49)
和?仔2*(t)=■e-r(T-t) (50)
均衡值函数为:
V1(t,z)=zer(T-t)+■ (51)
V2(t,z)=zer(T-t)+■ (52)
其中,B(t)、D(t)分别由(45)和(46)给出。
从(49)和(50),可看出,投资者A的最优投资策略不仅依赖于他自己的风险厌恶参数?酌1,而且依赖投资者B的风险厌恶参数?酌2;投资者B的最优投资策略同样依赖于这两个风险厌恶参数?酌1,?酌2。投资者A的值函数依赖B的风险厌恶参数?酌2,投资者B的值函数也依赖A的风险厌恶参数?酌1。
(作者单位:郑州大学西亚斯国际学院文理学院)
主要参考文献:
[1]Markowitz,H.Protfolio selection.Finance,1952.7.
[2]Merton,R.C.Life-time
portfolio selection under uncertainty:the
continuous-time case.The Review of Economics and
Statistics,1969.
[3]Merton,R.C.Optimal
consumption and portfolio rules in a continuous-time model.Journal of
Economical Theory,1971.3.
[4]Chiu,M.C.,Li,D.Continuous-time mean-variance
optimization of assets and liabilities.Insurance:Mathematics
and Economics,2006.39.
[5]Xie,S.X.,Li,Z.F.,Wang,S.Y.Continuous-time portfolio selection with liability:Mean-variance model and stochastic LQ approach.Insurance:Mathematic and Economics,2008.42.
[6]Bjork,T.and
A.Murgoci.A general theory of Markovian time inconsistent stochastic control
problems.Working Paper,Stockholm School of Economics,2010.
[7]Kryger,E.and
Steffensen,M.Some solvable portfolio problems with
quadratic and collective objective.Working paper,http://ssrn,com,2011.
|