[提要] 本文从研发动力角度,利用博弈论模型分析虚拟现实关键共性技术研发动力系统中企业、高校和科研院所以及政府间的利益关系,明确虚拟现实关键共性技术研发内、外部动力发挥的阻碍原因。
关键词:虚拟现实;共性技术;动力机制
基金项目:重庆市职业教育学会科研课题(编号:2022ZJXH431082);重庆市沙坪坝区决策咨询与管理创新项目(编号:Jcd202103)
中图分类号:F224.32;F27 文献标识码:A
收录日期:2022年12月14日
虚拟现实产业是中国经济发展新时期的重要产业方向和技术领域,具有非常广阔的应用前景。研发虚拟现实关键共性技术对推动新一代信息技术与制造技术融合发展,贯彻落实《中国制造2025》重要工作部署有重要意义。然而,虚拟现实关键共性技术的研发具有研发投入大、周期长、经济效益低等特点,容易陷入研发市场失灵的困境。因此,研究多主体合作下的虚拟现实关键共性技术研发问题,对于推动国家创新驱动发展有重要的理论和实践意义。
一、虚拟现实关键共性技术研发的三方博弈模型
虚拟现实关键共性技术研发的内外部动力来源于多个方面,然而关键共性技术研发存在的外部性是削弱这些力量的重要因素。虚拟现实技术创新战略联盟内部成员既有资金充足的企业,也有技术力量强大的高校和科研院所。因此,联盟组织内部成员进行合作研发是消除外部性的有效手段,但由于在合作研发的动力系统中,企业与企业、学校和科研院所、政府间存在着博弈行为,各个主体理性行为的存在是实现关键共性技术合作研发的重要阻碍。因此,对系统中三方主体博弈行为进行分析,推进行业关键共性技术的合作研发有效性。
(一)无政府状态下企业与高校和科研院所间的博弈。在无政府参与状态下,企业与高校和科研院所之间是否进行关键共性技术合作研发的博弈属于“囚徒困境”问题。进行关键共性技术合作研发要投入较大的成本,而企业、高校和科研院所作为一个理性主体,在无政府状态下,它的行为存在着不确定性,会因为信任而选择合作行为或是因为自私而选择背叛行为。因此,博弈模型建立在以下几个假设条件下:
假设1:博弈主体为企业与高校和科研院所,两者是理性主体,每个主体都有选择“合作”和选择“背叛”两种决策行为
假设2:双方选择最优策略时,以对手的可能策略预测为参考
假设3:双方在选择“合作”策略时,所需要投入的成本(人力、物力、技术和资源等要素)折算为货币c,若是选择“背叛”策略,则投入成本为0。由于投入较大,短期内收益不明显,因此各主体收益比不合作时减少c,即,r<r-c
1、支付矩阵(表1)
由支付矩阵可知,企业与高校和科研院所间的博弈一共出现四种情形:
情形一:当企业选择“合作”时,高校和科研院所也选择“合作”,则企业、高校和科研院所的收益为rE-c,rS-c。
情形二:当企业选择“背叛”,高校和科研院所依然选择“合作”时,则企业获得收益为rE,高校和科研院所获得收益rS-c,(rS-c)<rE,选择“背叛”策略比选择“合作”策略企业的收益要高,高校和科研院所利润受损。
情形三:同情形二,仅有企业选择“合作”策略,那么企业获得收益为rE-c,高校和科研院所获得收益为rS,(rE-c)<rS,选择“背叛”策略的高校和科研院所比选择“合作”策略时的收益要高。
情形四:当两者都选择“背叛”策略时,他们的收益分别是rE和rS。
2、策略选择。当企业选择“合作”策略时,高校和科研院所有两种策略,“合作”或“背叛”,“合作”时则与企业一样,获得平均收益,但选择“背叛”策略时,高校和科研院所就会获得高于平均收益的利润。因此,选择“背叛”策略是高校和科研院所的最优策略。
当企业选择“背叛”策略时,高校和科研院所将不会改变策略,继续选择“背叛”,因为选择“背叛”会获得行业的正常收益水平,选择“合作”策略则会获得比平均收益水平低的利润。因此,无论企业选择何种策略,高校和科研院所的策略都选择“背叛”策略以获得超额收益或避免低收益。同样的,无论高校和科研院所选择何种策略,企业都选择“背叛”。此时,博弈的纳什均衡为:(背叛,背叛),博弈的双方陷入“囚徒困境”的状态。
3、结论。在无政府状态下,企业与高校和科研院所间关于是否进行合作研发博弈的纳什均衡是都会选择“背叛”策略。这种情况形成的主要原因是,选择“背叛”的主体可利用信息不对称的条件“搭便车”,这将使得博弈向(背叛,背叛)的结果演化。
(二)无政府参与下企业与企业间的博弈。两企业间关于是否进行关键共性技术合作研发的博弈同样属于“囚徒困境”问题。选择合作研发需要投入较大的成本,而企业作为一个追逐利益最大化的理性主体,当政府规制行为不存在时,企业间在是否进行合作研发的问题上就存在博弈。博弈模型建立在以下假设条件上:
假设1:博弈主体为两个企业,企业主体是理性的,都可自由选择是否进行合作研发
假设2:双方选择自己最优策略时,可以对手的可能策略作为参考
假设3:企业选择合作研发后,研发周期较长,投入成本较大,短期收益不明显,利润降低,即(p1-c1)<(p2-c2)
1、支付矩阵(表2)
两个企业间的博弈同样出现四种情形:
情形一:两个企业都选择“合作”策略,则两个企业所得到的收益都是p1-c1,是合作研发情况下正常的行业利润。
情形二:若企业A选择“背叛”策略,企业B依然选择“合作”策略,则企业A获得收益为p2-c2,企业B获得收益为p1-c1,(p1-c1)<(p2-c2),选择“背叛”策略的企业获得了更高的收益,选择“合作”策略的企业利润受损,低于行业正常的平均收益。
情形三:与情形二相同,仅有企业A选择“合作”策略,企业B选择“背叛”策略,那么企业A利润受损。
情形四:两个企业都选择“背叛”策略,那么利润都为p2-c2。
2、策略选择。当企业A选择“合作”策略时,企业B有两种选择,“合作”或者“背叛”,“合作”时收益和企业A一样,当选择“背叛”时,则会获得高于行业平均水平的收益。因此,选择“背叛”策略是企业B的最优策略。
当企业A选择“背叛”策略时,企业B不会改变策略,将继续“背叛”,因为此时可以获得行业正常的收益。因此,无论企业A选择何种策略,企业B的最优策略是“背叛”,以获得超额利润或者避免收益受损。同样的,无论企业B选择何种策略,企业A的最优策略都是“背叛”。此时,博弈的纳什均衡为:(背叛,背叛),博弈双方处于“囚徒困境”的状态。
3、结论。在无政府参与状态下,两个企业关于是否进行合作研发博弈的纳什均衡是双方都选择“背叛”。双方策略选择行为受到竞争方的影响,会改变最初的策略,向(背叛,背叛)的结果演化。
(三)政府参与下企业与高校和科研院所间的博弈。由上述研究可知,在无政府参与状态下,企业与企业间、企业与高校和科研院所间都没有充分的动力开展关键共性技术合作研发。因此,为了引导企业、高校和科研院所能够实现生产、研发方式的转变,解决市场中“搭便车”与信息不对称的问题,政府需要进入企业、高校和科研院所间的博弈,通过政府干预,帮助企业、高校和科研院所走出“囚徒困境”的局面。
政府干预的手段是给选择“合作”策略的企业、高校和科研院所补贴t,给选择“背叛”策略的企业、高校和科研院所实施惩罚f。补贴和惩罚都将直接影响企业、高校和科研院所的收益。在政府参与状态下,企业与高校和科研院所间的博弈模型基于以下假设:
假设1:企业或者高校和科研院所选择“合作”策略后,两者收益会减少d
假设2:政府的补贴和惩罚具有一定的约束力,企业、高校和科研院所需要根据政府制定的规则调整自己的策略,但是两者均以利润最大化为决策目标
1、支付矩阵(表3)
由支付矩阵可知,政府参与状态下企业与高校和科研院所间的博弈一共有四种情形:
情形一:企业与高校和科研院所都响应政府号召,两者均选择“合作”策略,则两者的收益都在原有利润的基础上,减少一个合作成本,增加一个合作补贴,即企业与高校和科研院所最终获得的收益分别为rE-d+t,rS-d+t。
情形二:企业选择“背叛”策略,高校和科研院所选择“合作”策略,那么高校和科研院所的收益与情形一相比不变,企业的收益则变为rE-f,即在原有收益下减去一个背叛的惩罚。
情形三:与情形二类似,只是角色互换,企业选择“合作”,高校和科研院所选择“背叛”。那么,企业的收益为rE-d+t,高校和科研院所的收益为rS-f。
情形四:两者都选择“背叛”策略,则两者都会受到惩罚,即收益分别为rE-f,rS-f。
2、策略选择。两者均选择合作策略时,政府补贴大于选择背叛时的收益,此时政府参与是有效的;当双方选择背叛时,政府惩罚的力度小于选择背叛时的收益,那么此时,政府参与是无效的。
3、结论。政府参与下企业与高校和科研院所间博弈的纳什均衡与f+t的大小有关,当政府管制力度越大,即政府对于合作研发的鼓励程度越大,给予的补贴越高,则企业或者高校和科研院所就越有选择“合作”策略的动力。
(四)政府参与下企业与企业间的博弈。在同样的条件下,政府参与状态下企业与企业间的博弈结果与企业与高校和科研院所间博弈结果相同。即,政府参与下企业与企业间博弈的纳什均衡与f+t的大小有关,当政府管制力度越大,即政府对于合作研发的鼓励程度越大,给予的补贴越高,则企业就越有选择“合作”策略的动力。
(五)政府参与下企业、高校和科研院所与政府间的博弈。政府虽然可以对企业、高校和科研院所进行监管,为推动关键共性技术合作研发实行激励或者约束政策,但政策的制定与执行需要人力、物力、资金的支持,因此政府也需要根据其监管成本的大小决定是否实行监管。所以,企业、高校和科研院所与政府间也存在着博弈的行为,他们之间的博弈模型需要满足以下假设条件:
假设1:企业、高校和科研院所有“合作”与“背叛”两种策略,政府有“监管”与“不监管”两种策略,双方均为追求利益最大化的理性主体
假设2:企业、高校和科研院所与政府间互不清楚双方可能采取的策略,但清楚对方的收益函数
1、支付矩阵(表4)
从表4可知,政府与企业、高校和科研院所间的博弈支付有四种情形:
情形一:政府实施“监管”策略,企业与高校和科研院所选择“合作”策略,那么企业与高校和科研院所获得正常的行业平均收益r(E,S)-d,政府的监管成本为-g。
情形二:政府选择“监管”,企业与高校和科研院所选择“背叛”策略。那么,政府对其进行罚款f,同时也付出监管成本-g,政府最终收益为f-g,企业与高校和科研院所利润为r(E,S)-f。
情形三:政府选择“不监管”,企业、高校和科研院所选择“合作”。此时,政府收益0,企业、高校和科研院所收益为r(E,S)-d。
情形四:政府“不监管”,企业、高校和科研院所“背叛”,则企业收益为r(E,S),政府收益为0。
2、策略选择。在政府参与状态下,政府与企业、高校和科研院所间不存在纯策略纳什均衡。当政府选择“监管”策略时,因为r(E,S)-d>r(E,S)-f,企业、高校和科研院所会选择“合作”策略;当政府选择“不监管”策略时,因为r(E,S)-d<r(E,S),企业会选择“背叛”策略。若企业、高校和科研院所先行,政府随后做出决策,也同样不存在纳什均衡。因此,可以通过对企业、高校和科研院所和政府行为赋概率,利用混合策略博弈来寻求均衡解。
3、混合策略均衡。假设政府对企业、高校和科研院所采取抽查的方式,即企业、高校和科研院所被“查处”的概率为x(x∈[1,0]),企业、高校和科研院所选择“合作”策略的概率为y(y∈[1,0])。π1为政府的期望收益,π2为企业的期望收益,因此政府与企业、高校和科研院所的目标函数如式(1)、式(2)所示:
■π1=x[y(-g)+(1-y)(f-g)]+(1-x)[0×y+0×(1-y)]=x(1-y)(f-g)-x×y×g (1)
■π2=y[x(r(E,S)-d)+(1-x)(r(E,S)-d)]+(1-y)[x(r(E,S)-f)+(1-x) r(E,S)]=y(r(E,S)-d)+(1-y)(r(E,S)-x×f) (2)
将式(1)、式(2)分别对x、y求偏导,并令其等于0,得到均衡解:
■=(1-y)(f-g)-y×g=0?圯y=■ (3)
■=x×f-d=0?圯x=■ (4)
4、结论。混合策略博弈的均衡解为{■,■},其中y与f成正比,也就是当政府惩罚力度越高时,企业、高校和科研院所选择“合作”的策略可能性就越大;当x在0到均衡解之间时,企业、高校和科研院所会选择“背叛”策略,当x在均衡解到1之间时,企业、高校和科研院所会选择“合作”策略。
二、结论
利用博弈论模型分析了虚拟现实关键共性技术研发动力系统中企业、高校和科研院所以及政府间的利益关系,明确了虚拟现实关键共性技术研发内、外部动力发挥的阻碍原因。通过对无政府参与下的企业与企业、企业与高校和科研院所的简单博弈分析,得出由于信息不对称现象的存在,导致企业、高校和科研院所对待关键共性技术研发多采用“搭便车”的方式,受益企业、高校和科研院所往往选择不合作研发关键共性技术。因此,关键共性技术研发的外部成本内部化就需要政府的介入,通过政府管控的方法进行调整。在政府参与情形下,分析了企业与企业、企业与高校和科研院所以及企业、高校和科研院所与政府的博弈关系,得出政府监管下,关键共性技术合作研发是能够走出“囚徒困境”的。
(作者单位:重庆青年职业技术学院经济管理学院)
主要参考文献:
[1]郑月龙,杨柏,王琳.产业共性技术研发行为演化及多重失灵研究[J].科研管理,2019.40(05).
[2]马永红,刘海礁,柳清.产业共性技术产学研协同研发策略的微分博弈研究制[J].中国管理科学,2019.27(12).
[3]吴金希,闫亭豫.发展国家战略科技力量要高度重视产业共性技术研究院建设[J].科技导刊,2021.39(04).
[4]郑月龙,秦国静,白春光,刘思漫.产业共性技术研发失灵类型、演化及影响机制[J].系统工程,2021.39(05).
|