[提要] 本文基于不完全信息和有限理性假设,构建合作激励机制下“医疗机构-企业-政府”三方医疗废物逆向供应链博弈模型,利用演化博弈复制动态方法,分析各利益主体的行为关系及最优稳定策略选择。
关键词:医疗逆向供应链;演化博弈;激励
中图分类号:F259.22 文献标识码:A
收录日期:2022年3月17日
2020年,新冠肺炎疫情大规模爆发,医疗废物急剧增加。据生态环境部数据显示,截至2020年3月14日,全国医疗废物处置能力为6,058.8t/d,相比疫情前的4,902.8t/d增加了1,156.0t/d,激增的医疗废弃物使大量本可重新回到生产序列的资源被浪费,同时引起了严重的环境问题。
目前,我国已初步构建医疗废物逆向供应链,但实施效果还未达到预期,究其原因是在医疗废物逆向供应链中主体的异质性、对政府依赖严重,使得各主体间难以形成协同发展。因此,根据医疗废物在循环经济中的特点,深入分析其各主体的行为与策略选择,设计合理的合作激励机制,对于确定各主体的权利与责任边界,实现医疗废物逆向供应链良性发展,具有一定的实践价值。
一、文献综述
现有关于医疗逆向供应链的研究主要聚焦在医疗废弃物网络设计优化、研究收集点的选址规划及废弃物的运输规划等方面。赵佳虹和凌雅婷基于疫情环境下,设计时变“环境-人口”风险度量模型,建立风险最小和成本最小的多目标选址-分配模型。贺政纲等为实现全面覆盖医疗废物产生源,提出医疗废物三层回收网络结构,构建三层回收网络优化模型。蒲松等认为回收需求为固定值的医疗废弃物回收路径优化模型与实际需求不匹配,在两种不确定性集合的基础上,建立了以总成本最小为目标、带时间窗的、变化单位运营成本的医疗废弃物回收路径鲁棒优化模型。值得注意的是,对于医疗废物逆向供应链博弈行为的研究较少。刘婷对三个主体(政府、药品生产企业和消费者)的行为和收益做出分析,建立了基于不完全信息和有限理性假设下的三方博弈模型,但其仅将政府政策作为调控激励,并未考虑其他成员之间的合作激励。鉴于此,本文运用演化博弈分析方法,设计企业和医疗机构的合作机制,给出医疗废物逆向物流良性发展视域下的策略选择。
二、医疗废物逆向供应链三方博弈模型
激励机制设计需要考虑利益相关者的收益,医疗废物逆向供应链的利益主体包括医疗机构、企业和政府。
医疗机构是医疗废物产生的源头,为逆向供应链输入基础价值,其承担医疗废物的分类、收集和与企业交接的职责。企业是医疗废物逆向供应链建设的主力军,其职能不仅涵盖医疗废物回收和处置,还包括激励医疗机构参与逆向供应链。政府作为整体环境的维护者,是医疗废物逆向供应链建设的主要推力,通过法律法规和市场监管对各方利益相关者调节,以实现公共利益和经济利益的对立统一。
三、医疗逆向供应链博弈主体策略分析
(一)模型假设
1、利益主体均为有限理性,博弈方会在过程中学习,通过试错来调整自身策略以达到利益均衡。
2、只有医疗机构和企业同时合作参与废物处理,双方才能获取合作收益I,并实现整体社会经济效益R。
(二)策略分析。医疗机构考虑经济收益,有两种策略行为:与企业合作参与(称“合作”),或违规外流牟取暴利(称“不合作”)。企业考虑市场收益和社会责任,有两种策略行为:激励医疗机构参与实施医疗废物的运输和再处置(称“激励实施”),或仅参与运输但不进行处理(称“不激励实施”)。政府考虑社会和经济效益,有两种策略行为:有效监督其他主体是否实施医疗逆向物流处置,并给予相应奖惩(称“全面监管”),或因管理成本等未实施合理监管(称“部分监管”)。三方在不同诉求下选取的策略有所不同,相互制约、相互影响,具体参数及解释如表1所示。(表1)
医疗机构合作参与逆向供应链的概率、企业激励医疗机构参与逆向供应链的概率、政府有效监管的概率分别用表示x、y、z表示,概率区间为[0,1]。
根据以上假设及三方策略的依存性,利用博弈收益矩阵建立演化模型,如表2所示。(表2)
(三)博弈均衡模型求解。在医疗废物逆向供应链中,各主体策略的变化是博弈分析的核心,而变化速度是关键。因此,需分别构造参与主体的复制动态方程,描述各主体策略被选择的频率。
1、医疗机构收益期望函数与复制动态方程。根据表2分析可知,医疗机构选择合作策略的期望收益Ux1为:
Ux1=z·[y·(E1+I+S1-C1)+(1-y)·(E1+S1-C1)]+(1-z)·[y·(E1+I-C1)+(1-y)·(E1-C1)] (1)
医疗机构选择非合作策略的期望收益Ux2为:
Ux2=z·[y·(E2-P1)+(1-y)·(E2-P1)]+(1-z)·[y·E2+(1-y)·E2] (2)
根据相关理论研究,医疗机构复制动态方程如下:
f(x)=■=x·(1-x)·(z·S1+y·I+E1-C1-E2+z·P1) (3)
2、企业的复制动态方程。根据表2分析可知,企业策略选择的复制动态方程为:
f(y)=■=y·(1-y)·[z·(S2+P2)+x·I+(E3-C2)-(E4-C3)] (4)
3、政府的复制动态方程。根据表2和政府复制动态方程计算可知,政府策略选择的复制动态方程为:
f(z)=■=z·(1-z)·[P1+P2-C4-x·(S1+P1)-y·(S2+P2)] (5)
(四)博弈均衡稳定性分析
1、医疗机构稳定性分析
(1)当z*=■时,F(x)=0,医疗机构任意决策都处于稳定水平,x的稳定值取决于初始状态,由机构责任、环境等综合影响。
(2)相反,上述等式不成立时,x=0、x=1是医疗机构的演化稳定策略,这时要分情况进行讨论。
情况1:当C1+E2-y·I-E1>0,企业激励实施概率小于临界值,由于演化稳定策略要求F'(x)<0,首先当0<z<■时:①C1+E2-y·I-E1>S1+P1时, F'(x=0)<0,故x=0是其演化稳定策略,企业激励实施的概率和政府建立监管体系的概率均低于临界值,且医疗机构参与合作的期望收益低于违规流出的收益,说明此时处于无序状态,医疗机构选择不参与;②C1+E2-y·I-E1<S1+P1时, F'(x=0)<0,故x=0是其演化稳定策略,此时医疗机构参与的预期收益虽大于违规处理收益,但受企业合作行为及政府监管影响,理性的医疗机构认为企业激励实施和政府建立监管体系的概率均低于临界值,难以获取政府补贴,选择不参与。其次当C1+E2-y·I-E1<S1+P1,且■<z<1时,F'(x=1)<0,故x=1是其演化稳定策略,此时E1+y·I+S1-C1>E2-P1,医疗机构合作的预期收益大于违规处理收益,虽然企业激励实施的概率低于临界值,但政府监管概率高于临界值,医疗机构选择参与合作。
情况2:当C1+E2-y·I-E1<0时,企业激励实施概率大于临界值,此时只有z>■,F'(x=1)<0,故x=1是其演化稳定策略,此时医疗机构合作的预期收益大于违规处理收益,同时政府和企业参与的概率均大于临界值,政府支持力度大,企业足够重视,由此形成循环经济的良性发展。
2、企业稳定性分析
(1)当z*=■时,F(y)=0,企业任意决策都处于稳定水平,y的稳定值取决于初始状态,由外部等综合因素影响。
(2)相反,上述等式不成立时,y=0、y=1是企业的演化稳定策略,此时分情况分析企业决策。
情况1:当-x·I-E3+C2+E4-C3>0 时,医疗机构参与逆向供应链的概率小于临界值,令■<0,首先当S2+P2>-x·I+C2-E3+E4-C3时:①0<z<■时,F'(y=0)<0,故y=0是其演化稳定策略,虽然企业激励实施的期望收益高于不激励的收益,但医疗机构合作意愿小且政府监管概率低,企业无法获取政府补贴和与医疗机构的合作收益,选择不实施;②■<z<1时,F'(y=1)<0,故y=1是其演化稳定策略,虽然此时医疗机构合作概率低,但受政府监管的引导,企业不实施的违规成本上升,选择激励实施。其次当S2+P2<-x·I+C2-E3+E4-C3且z<■时,F'(y=0)<0,故y=0是其演化稳定策略,企业激励实施的期望收益低于不激励实施的收益,且医疗机构合作意愿小、政府监管概率低,加上逆向物流成本多为隐性成本,使其成本远高于正向成本,相关数据显示,逆向物流成本是正向物流成本的9倍,企业资金压力大,选择不实施。
情况2:当-x·I-E3+C2+E4-C3<0时,医疗机构参与合作的概率大于临界值,仅有z>■,F'(y=1)<0,故y=1是其演化稳定策略,此时激励实施的期望收益大于不激励的收益,同时医疗机构参与合作的概率较高并受到政府监管,企业选择激励实施。
3、政府稳定性分析
(1)当y*=■时,此时F(z)=0,政府任意决策都处于稳定水平,z的稳定值取决于初始状态,由外部综合因素影响。
(2)相反,上述等式不成立时,z=0、z=1是政府的演化稳定策略,在此约束条件下有两种具体情况,依据不同情况分析政府的决策。
情况1:当P1+P2-C4-x·(S1+P1)>0时 ,此时医疗机构合作参与概率小于临界值,令■<0,首先当S2+P2>x·P1+P2-C4-x·(S1+P1)时:①0<y<■时,F'(z=1)<0,故z=1是其演化稳定策略,此时医疗机构、企业参与的概率均低于临界值,政府须引导其他主体认识到医疗逆向供应链合作的重要性,建立有效的奖惩制度,此时政府选择全面监督;②当■<y<1时,F'(z=0)<0,故z=0是其演化稳定策略,此时医疗机构合作概率低,但企业参与度较高,政府选择部分监督。
情况2:当P1+P2-C4-x·(S1+P1)<0时,仅有■<y<1,医疗机构、企业参与的概率均大于临界值,此时,F'(z=0)<0,z=0是政府的演化稳定策略,此时各方积极参与,处于良性循环,考虑到成本,政府选择部分监督。
四、结论及建议
当医疗机构或企业参与/激励实施医疗逆向供应链的预期收益低于不参与/激励实施,不论其他主体如何决策,医疗机构和企业均会选择退出逆向供应链。本文重点分析医疗机构和企业参与的收益大于不参与情况下的均衡状态。当医疗机构和企业参与合作的预期收益高于不参与时,初始情况落在不同的空间内可得不同均衡状态,如表3所示。(表3)
结合不同利益主体的动态趋势可得:x*=0,y*=0,z*=1和x*=1,y*=1,z*=0是逆向物流博弈系统中演变稳定策略(ESS)。当初始情况落在其他区域时,由于各方利益主体策略的微小改变也会收敛到上述两个稳定策略点。
(0,0,1)是一个相对稳策略,此时各方决策行为分别是不合作、激励实施、全面监督,此时,企业将逆向供应链仅看作废品回收,医疗机构对医疗废物的环境危害认识不足,企业和医疗机构的参与度低,致使逆向供应链体系滞后,即便是政府积极干预,逆向供应链的实施仍十分困难。因此,为了发展我国医疗回收逆向物流,政府应采取强有力的政策,使医疗机构和环保企业的参与度提高,只有这样,才能使医疗废物的逆向物流实现“跃迁”。
(1,1,1)是一个过渡策略,此时各方决策行为分别是合作、激励实施、全面监督,此时,政府大力推动直接影响医疗逆向物流运作的积极性,明确主体责任划分,清晰交易费用分摊和利益分配,合适的激励惩罚政策才能促使医疗机构和企业参与医疗逆向物流。
(1,1,0)是一个相对稳策略,此时各方决策行为分别是合作、激励实施、部分监督,长期来看,医疗机构和企业最终会在无政府干预下实现积极参与,当企业参与意愿达到较高水平后,都会达到(1,1,0)的均衡状态。由此可见,企业是逆向物流中的主体,如何激发企业在医疗逆向物流的核心推动力是值得思考的问题。 (通讯作者:董进全)
(作者单位:内蒙古工业大学)
主要参考文献:
[1]赵佳虹,凌雅婷.新冠疫情下医疗废物管理的选址-分配优化[J].交通科技与经济,2020.22(06).
[2]贺政纲,刘沙.考虑有回收中转站的医疗废物三层回收网络优化研究[J].科技管理研究,2016.36(22).
[3]蒲松,夏嫦.城市医疗废弃物回收路径的鲁棒优化模型[J].系统工程,2018.36(06).
[4]刘婷.基于三方进化博弈的药品回收逆向物流分析[J].物流科技,2014.37(02).
[5]鲜军.产村融合行为主体合作机制的演化博弈研究[J/OL].价格理论与实践,2021-12-27.
[6]Kaynak R,Kolu pek,Akgün A
E.The Role of Reverse Logistics in the Concept of Logistics Centers[J].Procedia-Social and Behavioral Sciences,2014.109(02).
|