政府奖惩机制与电子废弃物联合回收演化博弈分析

2022-04-29 13:02宋作玲史欣

物流技术 2022年3期

宋作玲史欣

[摘要]在制造商、零售商、回收商等企业联合回收模式下，联合回收联盟根据政府的激励奖惩机制权衡自己的成本与绩效。探讨了政府进行补贴和惩罚策略对于联合回收行为的影响，运用演化博弈的方法进行数学建模和数值仿真。仿真结果表明：两种情况下达到稳定状态，一种是绿色回收收益多于传统回收收益时，另一种是惩罚监管成本与补贴激励成本之差小于被惩罚的损失时。其余情况下，联合回收主体是否选择绿色回收由政府采取何种激励机制的概率决定。通过博弈分析可以为政府监管机制选取以及联合回收行为决策提供依据。

[关键词]政府奖惩机制;电子废弃物;联合回收;演化博弈

[中图分类号]F252.19 [文献标识码]A [文章编号]1005-152X（2022）03-0058-05

Evolutionary Game Analysis of Government Reward and Punishment Mechanism in E-waste Joint Recycling

SONG Zuoling1，2， SHI Xin3

（1. College of Transportation， Shandong University of Science & Technology， Qingdao 266590;2. College of Economics & Management， Shandong University of Science & Technology， Qingdao 266590;3. College of Transportation Engineering， Dalian Maritime University， Dalian 116026， China）

Abstract： The paper pointed out that under the joint recycling setup involving the alliance made up of the manufacturer， retailer， and recycler， etc.， the joint recycling alliance would weigh its own costs and performance according to the reward and punishment mechanism of the government. Then， it discussed how government subsidy or punishment would impact the joint recycling behavior， and used the evolutionary game method for mathematical modeling and numerical simulation. The simulation result indicated that equilibrium could be reached in two scenarios： one being when the green recovery return was more than the traditional recovery return; the other being when the difference between the punishment regulatory cost and the subsidy incentive cost was less than the loss from punishment. In other cases， whether thejoint recycling subjects chose green recovery was determined by the probability of the incentive or punitive measures taken by the government. The game analysis in this paper could provide reference for the selection of government supervision mechanism and the decision making onjoint recycling behaviors.

Keywords： government reward and punishment; e-waste;joint recycling; evolutionary game

0 引言

2020年，習近平主席在联合国大会上宣布了中国的低碳目标，在2030年前实现碳达峰，2060年实现碳中和，充分显示了中国政府参与环境治理的决心。作为工业门类最多的制造大国，在制造业开展碳中和目标对于整体目标达成尤为重要。

政府环境战略目标、社会环境意识提高、环境和社会事故频发等促使生产企业责任延伸的实践，制造商作为焦点企业与供应链上下游参与者以及利益相关方协同，以实现经济、环境、社会综合绩效提升。据《中国废弃电子产品循环经济潜力报告》显示，2030年我国电子废弃量将超过2700万t，对环境破坏严重，因此，通过回收利用产生价值增值、节能降耗势在必行。

使用关键词或摘要“回收”“政府”“博弈”检索核心期刊、EI、CSSCI共查询出269篇，主要集中于闭环供应链、逆向物流等领域，侧重研究政府补贴、激励机制对于电子废弃物、废旧家电、电池、共享单车的回收渠道、机制、定价策略等的影响。

已有研究从制造商和零售商、回收商视角或者政府监管和制造商回收废弃电子视角的博弈分析较多[1-3]，少有文献从政府奖惩和联合回收视角进行博弈行为分析。联合回收作为回收主体和渠道的一种有效方式，应该作为博弈主体进行分析，是对制造商和零售商、回收商联盟模式的拓展分析，并且将政府环境规制引入供应链可持续治理。同时，考虑绿色回收产生的社会效益，进而找到促进回收逆向供应链的驱动机制。

回收联盟采用技术创新、基础设施布局、绿色研发、分类拆解等方式实现电子废弃物的有效循环利用[4]。为了解决回收联盟回收意愿低、绿色回收开发成本大、回收率低、回收利润低等问题，政府可以对采取綠色回收的回收供应链联盟给予一定的补贴，同时政府对于没有有效履行延伸责任的供应链联盟收取一定的环境污染处罚[5-6]。然而，政府监管也存在一定难度和监管成本。因此，权衡环境治理成本、监管成本、环境治理效益也是政府参与供应链治理的问题之一。

综上，本文构建了包括回收联盟和政府两方的博弈模型，进行模型仿真并得出结论和建议。

1 模型假设与参数设置

假设博弈双方仅具有有限理性，则：

（1）策略集合。政府对于回收联盟治理的策略集记为 S1=（补贴，罚款）;回收联盟是否实施绿色回收的策略集记为S2=（绿色回收，传统回收）。

（2）局中人行为策略采取的比例。假设政府实施激励机制的概率为X，则政府采取惩罚机制的概率为 1-X;联合回收主体选择绿色回收的概率为Y，则其选择不分类回收的概率为1-Y。

（3）参数假设及含义。联合回收商选择“绿色回收”时的收益为Pg;联合回收商采用“传统回收”方式得到的收益为Pt;回收联盟选择“绿色回收”时的可持续收益为 Sg;联合回收商实施“绿色回收”的成本为 Cg;联合回收商采用传统回收方式的成本为 Ct;若联合回收商主动选择绿色回收，政府将给予一定的补贴，补贴系数为α，补贴程度为R;联合回收商采用传统回收方式受到政府惩罚的风险系数为β;联合回收商采用传统回收方式受到政府惩罚的损失为F。从政府层面，回收商选择“绿色回收”时带来的环境与社会效益为Eg;政府采取激励或惩罚措施需要一定的人力物力，选择激励治理方式时监管成本为Cr，不包括给予企业联盟的补贴部分，选择惩罚治理方式时监管成本为Cf;回收商选择沿用“传统回收”进行废弃电子产品的回收处理工作时，必将造成环境的破坏，由此政府进行环境污染及社会治理费用为Ce。政府和回收联盟采取不同策略的收益见表1。

2 处理企业与回收中心之间的演化博弈模型构建

假设政府选择“补贴”策略的期望收益为 G1，选择“罚款”策略的期望收益为G2，平均收益记为E（G）;回收商选择“绿色回收”的期望收益为R1，选择“传统回收”的期望收益为R2，平均收益记为E（R）。根据上述假设和收益矩阵表1，可知政府对回收商实施补贴激励机制的期望收益为：

政府采取惩罚机制的期望收益为：

则政府采取混合策略，即采取补贴激励策略与惩罚策略的平均期望收益为：

根据演化博弈原理，可得政府策略的复制动态方程：

同理，联合回收主体选择绿色回收的期望收益为：

联合回收主体选择传统回收的期望收益为：

则联合回收主体采取混合策略的平均期望收益为：

求得联合回收主体的复制动态方程，进而构建出政府—联合回收主体演化博弈的复制动态方程组为：

在实际情况中，政府与联合回收主体的最优策略选择不可能一次性完成，需要不断进行演化博弈来优化方案。在双方博弈过程中，若联合回收主体自觉选择绿色回收废弃电子产品，则政府为了社会经济均衡发展会减弱对其的激励与约束机制。反过来，当联合回收主体沿用传统回收方式时，政府就会加大激励与约束机制的实施力度。因此，为了使研究结果更适用于现实生活，要对局中人策略进行稳定性分析。利用 Friedman 提出的局部稳定性分析法，通过构建Jacobian矩阵来分析各均衡状态的稳定性。

令 FX= ，FY= ，根据演化稳定策略的性质与微分方程稳定性定理可知，当时，该点所对应的策略集为稳定策略。

对方程组求导得：

解得：

情形一：联合回收主体采取策略的演化稳定性分析。

（1）当X=X0时，等式F（Y）=0恒成立，则区间内任意 Y 点均处于稳定状态。

（2）当X>X0时，有Y=0 >0 ，Y=1 <0 ，

因此Y=1是稳定演化策略，联合回收主体在此情况下选择“绿色回收”。

（3）当X<X0时，有Y=0 <0 ，Y=1 >0 ，

因此Y=0是稳定演化策略，联合回收主体选择“传统回收”。

综上，当联合回收主体选择绿色回收废弃电子产品付出的成本小于该方式下获得的收益时，无论政府是否实施激励与约束机制，有限理性联合回收主体都会选择绿色回收;当联合回收主体选择绿色回收废弃电子产品付出的成本大于该方式下获得的收益时，则联合回收主体对于回收方式的选择依赖于政府实施激励与约束机制给其带来利益还是损失。

情形二：政府采取策略的演化稳定性分析。

（1）当Y=Y0时，等式F（X）=0恒成立，则区间内任意X点均处于稳定状态。

（2）当 Y>Y0时，有X =0 <0 ，X =1 >0 ，

因此X=0是稳定演化策略，政府在此情况下选择“惩罚”。

（3）当 Y<Y0时，有X =0 >0 ，X =1 <0 ，

因此X=1是稳定演化策略，政府在此情况下选择“补贴”。

综上，当政府实施惩罚机制的成本与采取补贴激励措施的成本之和低于联合回收主体被惩罚的损失时，无论联合回收主体是否选择绿色回收废弃电子产品，有限理性的政府都会选择实施惩罚机制;当政府实施惩罚机制的成本与采取补贴激励措施的成本之和高于联合回收主体被惩罚的损失时，有限理性的政府策略的选择取决于回收商对于回收手段的选择。

情形三：双方混合策略的演化稳定性分析。

依据动态系统复制方程式，可以得出当0≤X0≤1，0≤Y0≤1时，总共有五个复制动态均衡点，分别为（0，0）、（1，0）、（1，1）、（0，1）、（X0，Y0）。对于由微分方程描述的动态演化，其均衡点的稳定性一般通過雅克比矩阵分析，该系统的雅克比矩阵为：

将五个复制动态均衡点带入，同时满足det（J）>0和 tr（J）<0的点是渐进稳定的，对应着一个演化博弈。五个点的特征根见表2。

根据表2可知该复制动态方程组有四个鞍点和一个中心点，因此当政府与联合回收主体的策略集为（X0，Y0）时，系统才能达到稳定。

3 模型仿真

根据博弈情境进行参数赋值，运用Matlab软件进行模型仿真。

3.1 回收收益对于策略行为的影响

当绿色回收收益大于传统回收收益，即 Pg>Pt 时，设置仿真1 数值为 Pg=5，Pt=4，Sg=1，Cg=2.5，Ct=1，α=0.5，β=0.5，F=1，R=4，Cf=2，Cr=1，Ce=1，则政府与联合回收主体混合策略动态演化如图1所示。