惩罚机制下城市居民垃圾投放行为策略研究

2021-07-17 12:45张蓓佳

经济与管理 2021年4期

张蓓佳

(安徽大学管理学院,安徽合肥 230601)

一、引言

随着经济增长速度和城市化进程的加快,中国城市垃圾产生数量日益增多。2018 年全国200 个大、中城市的生活垃圾产生量为21 147.3 万吨,较之2013 年261 个大、中城市的生活垃圾产生量增加了4 998.5 万吨[1-2]。大量垃圾直接焚烧和填埋所带来的环境污染和资源浪费问题逐渐影响了人们的生活质量,进一步成为影响生产生活的限制性因素[3]。为了解决垃圾处理所带来的社会环境问题,需要全面推进垃圾分类工作。垃圾分类是科学处理的前提,也是城市垃圾治理的新方向。自2017 年起,“生活垃圾分类”已连续4 年(2017—2020 年)出现在政府工作报告中；2017 年3 月,国家发改委、住建部联合发布《生活垃圾分类制度实施方案》,给出垃圾强制分类的要求,将46 个重点城市列为垃圾分类的试点城市；2019 年更是推出《关于在全国地级及以上城市全面开展生活垃圾分类工作的通知》,确定到2025 年底前全国地级及以上城市要基本建成“生活垃圾分类”处理系统。由此可见,“生活垃圾分类”已被提至国家战略层面,得到各级政府的高度重视。

分类投放是垃圾分类的首要环节,居民作为垃圾分类投放的重要实施主体,其投放行为选择会直接影响垃圾分类的效果。然而目前在“生活垃圾分类”的试点城市中,居民垃圾分类参与率依然较低[4],例如,对宁波居民进行垃圾分类情况调查,发现实际参与垃圾分类行为的居民比例仅为13%[5]。如何提高居民垃圾分类投放的积极性,促进居民自觉进行垃圾分类,已成为许多城市生活垃圾综合管理中亟待解决的关键问题。通过构建演化博弈模型,探索不同类型的惩罚机制对城市居民垃圾投放策略选择的影响,在理论层面上揭示惩罚机制对居民垃圾投放行为策略选择的影响机理,在应用层面上为政府更好地促进居民分类投放提供参考建议。

二、研究综述

(一)垃圾分类投放的内涵界定

关于垃圾分类投放的内涵,许多学者都作出了界定。曲英等[6]将垃圾分类投放定义为城市居民将生活垃圾按照规定的类别分类收集,并投放到指定地点的行为；Jank et al.[7]认为,垃圾分类投放就是根据不同的分类标准,将城市固体废弃物中的可回收垃圾和可填埋垃圾从源头分离；Geller et al.[8]给出的概念更为具体,即垃圾分类投放是垃圾分类过程的第一个环节,是居民和家庭要把垃圾按照规定的类别分类收集,比如,把玻璃、报纸、塑料等不同垃圾分装到不同垃圾袋里,并分门别类地投放到指定地点的行为。这些概念虽然在表述上并不完全一致,但具有共通性,存在相似的关键词,包括:城市居民、规定的类别、分类收集、指定投放等。可见,学者们主要是从投放主体、分类标准和执行过程三个部分来定义垃圾分类投放行为的。其中,投放主体主要是指城市居民,投放标准即规定的类别,执行过程包含分类收集和指定投放两个环节。

(二)居民垃圾分类投放行为影响因素

学术界主要从影响居民垃圾分类投放行为的因素入手研究如何提升居民垃圾分类投放的积极性,逐渐形成了两种研究视角:一种是从居民个体出发,强调居民的行为策略选择是个人的“主动选择”,从而分析居民垃圾分类投放行为产生的心理过程,从社会心理学角度探索影响行为的因素；另一种是从外部环境出发,认为居民的行为是由独立于个人的外部整体环境所决定的,是一种“被动选择”,因此从情境理论角度去探索影响居民垃圾分类投放行为的因素。

在诸多研究中,用于研究社会心理学因素的最常用理论是计划行为理论,例如,Ari et al.[9]就运用该理论研究了态度、感知行为控制、主观规范和行为意愿对垃圾分类投放行为产生的影响。为了进一步优化计划行为理论的预测与解释力度,更多学者在该理论基础上进行了因素扩展,这些因素包括道德规范、知识感知、习惯、信任等。Razali et al.[10]认为,计划行为理论主要着眼于自身利益和理性选择,但低估了道德规范的影响,因此在模型中引入了道德规范因素,探索它与垃圾分类投放行为之间的关系；Wang et al.[11]在考虑了道德规范因素的基础上又加入了对所拥有知识的感知,认为个人如果感知自己所拥有的垃圾分类知识越多则越可能采取分类投放行为；Knickmeyer[12]将分类投放的习惯和对垃圾分类收集单位的信任列为重要的影响因素。

影响垃圾分类投放行为的外部情境因素包括宣传教育、分类设施与服务、激励措施等,在中国这些情境因素的提供主体主要是政府。Liu et al.[13]指出,通过宣传教育能够让居民认识到垃圾的危害以及垃圾分类的必要性,改变其环境价值观和对垃圾分类的态度,从而影响分类投放行为；孟小燕[4]为了探索设施与行为的关系,用经济成本收益、分类设施的便利性、时间花费等指标来解释和度量垃圾分类设施与服务,指出相较于环境知识和宣传教育,垃圾分类设施与服务对居民行为的综合影响最大；鲁先锋[14]认为,垃圾分类投放管理中的市场诱导性激励和强制性惩罚措施都会对分类投放行为产生良性作用；陈绍军等[5]发现从不同的激励措施对分类投放行为的影响上看,惩罚措施大于奖惩并重,而奖励措施对分类行为的影响并不显著。

从对现有文献的梳理来看,影响居民垃圾分类投放行为的因素包括两大类:社会心理学因素和情境因素。虽然在关于情境因素的研究中,已有文献探讨了惩罚机制对居民垃圾投放行为的影响,但仅在惩罚力度固定不变的基础上展开,并未考虑当惩罚力度随着居民垃圾投放行为和政府监管行为变动的情况。实际上惩罚力度随着居民行为变化的动态惩罚机制已广泛应用于新能源汽车推广[15]、废旧产品回收[16]、公共项目承包[17]等领域,并被证明更加符合实际情况且政策效果更佳。因此,本文运用演化博弈论方法,构建居民分类投放行为和政府监管行为之间的博弈模型,分别研究静态惩罚机制、关联居民行为的动态惩罚机制和关联政府行为的动态惩罚机制下的系统稳定演化策略,分析模型参数对策略产生的影响,并在此基础上进行数值模拟以验证模型结果的准确性。在下文中使用动态惩罚机制(Ⅰ)指代关联居民行为的动态惩罚机制,用动态惩罚机制(Ⅱ)指代关联政府行为的动态惩罚机制。

三、模型假设及参数设计

在垃圾投放过程中,城市居民是否采取分类投放行为,政府是否采取监管行为,构成了城市居民和政府之间的博弈关系。在明确居民和政府行为特征的基础上给出如下假设:

1.假设演化博弈双方是居民和政府,其中居民的投放策略选择为{分类,不分类}, x 为分类概率(0 ≤x ≤1),政府的策略选择为{监管,不监管},y为监管的概率(0 ≤y ≤1)。

2.对于居民来说,居民分类投放需要付出成本Cp,但在政府监管的情况下亦可以获得政府的奖励S 以弥补付出的成本,政府监管也需要付出监管成本Cg1,但同时可以获得由居民分类投放所带来的环境收益V。

3.对于居民来说,虽然不分类投放可以不用付出成本,但在政府监管的情况下会付出惩罚F,而且无论监管与否,政府都需要付出因居民没有分类投放所造成的环境治理成本Cg2。表1 给出模型的参数及含义。

表1 模型参数及含义

四、静态惩罚机制下的模型构建及分析

(一)模型构建及求解

在静态惩罚机制下, F 为常量,不会随着其他参数的变动而变动。根据模型假设及参数设计,构建静态惩罚机制下的垃圾投放行为演化博弈模型,居民和政府的收益矩阵如表2 所示。

表2 垃圾投放行为演化博弈收益矩阵

将居民分类和不分类时的期望收益以及居民的平均收益分别用Ux1、Ux2和表示:

同理,当政府监管和不监管居民垃圾投放行为时的期望收益以及政府的平均收益分别为Uy1、Uy2和:

构建居民选择分类投放策略和政府选择监管策略的复制动态方程组为:

为了使演化博弈各参与方有稳定策略,需满足条件:F(x)=F(y)=0。因此,求得系统五个可能的均衡点分别为A(0,0)、B(0,1)、C(1,0)、D(1,1)和O(x*,y*)。当x∈[0,1],y∈[0,1]时,

(二)均衡点稳定性分析

Friedman 提出,系统均衡点的稳定性可由雅克比矩阵的局部稳定性分析得到[18]。根据式(7)和(8)可以求出雅克比矩阵J:

当均衡点同时满足雅克比矩阵J 的行列式det(J)和迹tr(J)的条件时,该均衡点为系统演化的稳定点,能够形成演化的稳定策略。需满足条件为:

将五个均衡点分别带入式(10)和(11)中进行计算,得到均衡点的稳定性分析结果,如表3 所示。

表3 静态惩罚机制下垃圾投放行为演化博弈系统均衡点稳定性分析

根据表3 内容,按照参数大小关系的不同,居民与政府之间的演化博弈存在三种结果,分别为没有稳定的演化策略、ESS(0,1)和ESS(0,0)。对于居民来说,分类投放垃圾是需要额外付出成本Cp的,政府进行监管引入奖励和惩罚的目的就是为了弥补居民分类投放和不分类投放之间的收益差距。只有当S+F-Cp＞0 时,居民才有动力进行分类投放。而对于政府来说,只有当F＞Cg1时,即当政府对于不分类投放行为能够收取的惩罚F 可以弥补政府监管所需付出的成本Cg1时,政府才会有监管的动力。同时满足条件F＞Cg1和S+F-Cp＞0 时,静态惩罚机制下的系统没有稳定的演化策略,因此需要在此条件下对模型进行进一步的修改,将静态惩罚机制变为动态惩罚机制。

五、动态惩罚机制(Ⅰ)下的模型构建及分析

(一)模型构建及求解

在动态惩罚机制(Ⅰ)中,F 不再是一个常量,其值与居民垃圾分类投放行为概率相关联,即随着x 的变化而变动。用F(x)代替F,令F(x)=(1-x)F,该式中的F 为惩罚的上限值[19]。F(x)随着居民不分类投放的概率增大而增大,即居民越是不愿意分类投放,所获得的惩罚越大,这属于一种累进惩罚机制。

用F(x)代替(7)和(8)式中的F 得到:

(二)均衡点稳定性分析

根据式(12)和(13)可以得到雅可比矩阵:

在满足条件F＞Cg1和S+F-Cp＞0 时,对系统五个均衡点的稳定性进行分析,发现det(J)和tr(J)的符号还会受到S 和Cp大小关系的影响,但无论二者的大小关系如何都不会影响成为系统的渐近稳定点。受限于篇幅,在此仅以S＞Cp的情况为例进行后续分析,具体结果如表4 所示。

表4 动态惩罚机制(Ⅰ)下垃圾投放行为演化博弈系统均衡点稳定性分析

在此种情况下,均衡点A(0,0)、B(0,1)、C(1,0)和D(1,1)均为鞍点,为渐近稳定点。尽管系统并没有得到演化的稳定策略,但会不断趋近于,并最终在该点保持稳定。

(三)参数分析

六、动态惩罚机制(Ⅱ)下的模型构建及分析

(一)模型构建及求解

在动态惩罚机制(Ⅱ)中,F 不再为常量,其值与政府监管行为概率相关联,即随着y 的变化而变动。用F(y)代替F,令F(y)=(1-y)F,该式中的F 同样为惩罚的上限值。F(y)随着政府不监管的概率增大而增大。

用F(y)代替(7)和(8)式中的F 得到:

求得系统五个可能的均衡点分别为A(0,0)、B(0,1)、C(1,0)、D(1,1)和当x2∈[0,1],y2∈[0,1]时,

(二)均衡点稳定性分析

根据式(12)和(13)可以得到雅可比矩阵:

在满足条件F＞Cg1,S+F-Cp＞0 且S＞Cp时,对系统五个均衡点的稳定性分析如表5 所示。

表5 动态惩罚机制(Ⅱ)下垃圾投放行为演化博弈系统均衡点稳定性分析

在此种情况下,均衡点A(0,0)、C(1,0)和D(1,1)均为鞍点,B(1,1)点为不稳定点,O为渐近稳定点。尽管系统并没有得到演化的稳定策略,但会不断趋近于,并最终在该点保持稳定。

(三)参数分析

七、演化博弈模型数值模拟

对模型中的基本参数赋值,并运用MATLAB软件模拟不同惩罚机制下的模型分析结果。为了惩罚参数的赋值能够更加贴近实际,参考迄今为止垃圾分类政策出台数量较多且内容较为全面的城市——上海市颁布的《上海市生活垃圾分类管理条例》中对于居民个人惩罚的条款:将垃圾混放且拒不改正的个人处以一次50 元以上200 元以下罚款,即不分类的惩罚最大值为200 元,因此令初始值F=200。其余参数的初始值设定为S=20,Cg1=50,Cp=10。

假设初始概率值为[x,y]=[0.5,0.5],时间长度设置为[0,10],分别将初始参数值代入静态惩罚机制、动态惩罚机制(Ⅰ)和(Ⅱ)下的模型中进行数值模拟,得到三个模型的演化结果,见图1～图3。图1 中的居民和政府演化路径为环形闭合曲线,无论居民还是政府都无法达到稳定的策略点,说明采取静态惩罚机制既无法促进居民的分类投放行为,也无法影响政府的监管行为。图2 和图3 结果显示,在动态惩罚机制(Ⅰ)和(Ⅱ)下居民和政府的演化路径均为螺旋渐近曲线,最终稳定在和点,说明最后居民和政府将会以某个固定概率分别采取分类投放和监管行为。

图1 静态惩罚机制下的模型演化路径

图2 动态惩罚机制(Ⅰ)下的模型演化路径

图3 动态惩罚机制(Ⅱ)下的模型演化路径

为了进一步比较动态惩罚机制(Ⅰ)和(Ⅱ)对居民行为和政府行为的作用效果,图4(a)和图4(b)还分别给出了两种动态惩罚机制下居民和政府单独的演化路径。由图4(a)和图4(b)可见,在动态惩罚机制(Ⅱ)下,居民分类投放的概率约为0.68,政府监管的概率约为0.05；在动态惩罚机制(Ⅰ)下,居民分类投放的概率下降为0.46,而政府监管的概率则上升至0.08。也就是说,相较于动态惩罚机制(Ⅰ),在动态惩罚机制(Ⅱ)下的居民分类投放概率更高,政府监管的概率更低。这说明在两种动态惩罚机制中,动态惩罚机制(Ⅱ)在促进居民分类投放和释放政府监管压力方面的效果都要更好,能够使得演化结果更接近即使政府不监管,居民也会主动进行垃圾分类投放的理想状态。

图4 (a) 两种动态惩罚机制下的居民行为演化路径比较

图4 (b) 两种动态惩罚机制下的政府行为演化路径比较

由于在三种惩罚机制中,动态惩罚机制(Ⅱ)对居民垃圾分类投放行为的促进效果最好,因此基于动态惩罚机制(Ⅱ),进一步模拟各参数变动对稳定状态下的居民和政府最终行为概率的影响。在保持其余参数不变时,一次只变动一个参数,分别变动F、S、Cp和Cg1的值,将F=200 增加至F=220,得到惩罚上限值变化对居民分类投放行为和政府监管行为的影响,见图5(a)和图5(b)；将S=20 增加至S=40,得到奖励变化对居民分类投放行为和政府监管行为的影响,见图6(a)和图6(b)；将Cp=10 增加至Cp=15,得到分类投放成本变化对居民分类投放行为和政府监管行为的影响,见图7(a)和图7(b)；将Cg1=50 增加至Cg1=60,得到监管成本变化对居民分类投放行为的影响,见图8。由图5(a)、图6(a)、图7(a)和图8 可知,当F 值增大,S、Cp和Cg1值减小时,居民分类投放的概率将增加。由图5(b)、图6(b)和图7(b)可知,当F 和S 值增大,Cp值减小时,政府监管的概率会下降。

图5(a) 惩罚变化对居民分类投放行为的影响

图5(b) 惩罚变化对政府监管行为的影响

图6(a) 奖励变化对居民分类投放行为的影响

图6(b) 奖励变化对政府监管行为的影响

图7(a) 分类投放成本变化对居民分类投放行为的影响

图7(b) 分类投放成本变化对政府监管行为的影响

图8 监管成本变化对居民分类投放行为的影响

八、结论与启示

本文运用演化博弈论方法分别研究了在静态惩罚机制和两种动态惩罚机制下的城市居民垃圾投放行为策略,并对模型进行了数值模拟验证,得到以下结论:

1.对比三种惩罚机制,在静态惩罚机制下,系统不存在稳定的演化策略,政府无法通过静态惩罚机制有效的约束居民的分类投放行为；而在两种动态惩罚机制下,系统均存在渐近稳定点,政府运用动态惩罚机制能够有效约束居民的分类投放行为。其中,动态惩罚机制(Ⅱ)在促进居民分类投放和释放政府监管压力方面的效果更好。

2.在动态惩罚机制(Ⅱ)下,居民分类投放的概率与惩罚上限正相关,与奖励值、政府监管成本和居民分类投放成本负相关；政府监管的概率与惩罚上限和奖励值负相关,与居民分类投放成本正相关。

通过上述结论可以为政府带来如下管理启示:

第一,政府的惩罚机制应当根据政府监管行为进行动态调整。政府在制定监管策略时应结合实际情况,充分考虑监管的成本和收益,因此相较于掌握居民的分类投放概率,政府往往更容易事先确定自身监管的概率,从而相应的调整惩罚机制,取得更好的监管效果。

第二,为进一步降低政府监管的概率,一方面,政府应当适当提高惩罚上限,根据惩罚形式的不同,采取增加罚款金额、扣除更多信用积分、发布范围更广时间更长的通报批评等手段来提高惩罚上限；另一方面,政府应当设法降低居民投放成本。在实际操作中,政府首先需要加大宣传教育力度,通过宣传画册、电视广告、公益课堂、手机小程序或公众号等多种渠道向居民普及分类标准、设备标识及操作流程等知识；其次开通即时查询App,方便居民线上查询及咨询垃圾的归类；最后还要健全分类投放配套设施,让分类垃圾能够被便利投放。

第三,为提升居民分类投放的概率,除了可以采取提高惩罚上限和降低居民分类投放成本的方式,还应当降低监管成本。目前政府对于居民垃圾分类投放行为的监管主要依靠社区管理人员及城管执法人员,但人员数量较少,监管范围较广,致使监管成本相对较高。因此,政府需要结合智慧城市和社区建设,利用大数据、云计算、人工智能等技术,建立“生活垃圾分类”收集信息管理系统,对城市生活垃圾的产生种类、区域分布规律、居民投放习惯等信息进行动态监测,以提升监管效率。同时,还应积极鼓励更多的居民成为志愿者,并引入第三方机构,由完全依赖政府的行政监管模式转型成政府依法监管、第三方专业监管和居民参与监管的综合监管模式。