博弈论视角下机动式巡察的反腐效力评估

2021-05-12 00:33
天府新论 2021年3期
关键词:市县机动理性

郭 锐

一、问题的提出

中共十九大报告对反腐形势作出判断并明确目标:“当前,反腐败斗争形势依然严峻复杂,巩固压倒性态势、夺取压倒性胜利的决心必须坚如磐石。”报告指出,要健全党和国家监督体系,强化自上而下的组织监督,深化政治巡视,建立巡视巡察上下联动的监督网。(1)习近平:《决胜全面建成小康社会 夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告》,人民出版社,2017年,第66-67页。

巡察是对巡视的模仿与借鉴,相当于巡视在市县的延伸。巡视是中央和省、自治区、直辖市党委,通过建立专门机构,对各自的下级党组织,包括省部级、厅局级和部分县处级的领导班子及其成员,开展巡行视察。巡视的内容包括是否做到依法执政、是否严格遵守组织纪律、是否做到廉洁公正等。与巡视不同的是,巡察工作的派出主体为地市、县级党委,巡察对象为县区、乡镇单位的领导干部。巡察的侧重点比巡视更为宽泛,聚焦市县各个基层单位的具体工作,重点是发现和惩治群众身边的生冷硬推、效率低下、吃拿卡要等“微腐败”现象。(2)孙亮:《巡视巡察联动体制:意涵、逻辑与构建路径》,《中州学刊》2019年第1期。巡察是从中共十六大以后开始出现的,在中共十八大之后逐渐兴起,于2015年底正式全面推开部署。在早期阶段,由于没有文件或法规做出统一的规范命名,各地有的用“巡査”,有的用“巡察”。直到近些年出现了多部权威性文件,使“巡察”成为统一规范的名称。

机动式巡察是市县党委开展巡察工作的一种新兴操作模式。它于2017年开始出现,虽然历史较短,也尚未在全国范围内普及,却在很多地区的实践中取得了比常规巡察更为显著的成效,拥有反腐“利剑”的美名。它的“机动式”特征是功不可没的,具体表现为巡察的时间、地点、内容以及组成人员等灵活多变,巡察周期不固定,在效果上力求出其不意,不让巡察对象摸到规律。(3)王振奎,李玉良:《漯河召陵 机动式巡察精准发现问题》,《中国纪检监察报》2017年8月15日。因此,相比于常规巡察,机动式巡察的优势在于行动的“不确定性”。当党员干部出现腐败倾向时,这种不确定性往往会让党员干部顾忌巡察“突袭”的可能性。那么,机动式巡察的这一优势在多大程度上能够抑制腐败现象的发生,被巡察单位的腐败概率会因此呈现怎样的变化规律,则成为很有研究价值的问题。

然而,当笔者以“机动式巡察”为关键词进行文献检索时,出现的内容往往属于新闻报道、工作方案、政策或法规类,并没有找到对应的学术文献,即便将关键词换作大同小异的“机动式巡视”,也是同样的结果。这些资料可以为机动式巡察的研究提供现实素材,但缺少相应的理论分析。主题最相近的是广义上的巡察研究,这方面的论文数量比较丰富。虽然在这类论文里,笔者只发现机动式巡察是作为巡察制度的一种具体手段或者变通方式而提出的,研究焦点普遍都放在巡察工作的现实困境以及相应的对策上面,但是这些核心内容同样适用于某一具体的巡察模式,对本文的研究具有很高的参考价值。在这些文献所涉及的巡察实践难题中,熟人社会、公权租金和同体利益这三个变量无疑会对机动式巡察带来不容忽视的负面效应。其具体的应对之策可以归纳为提级巡察和交叉巡察两种,它们也同样可以成为机动式巡察走出实践困境的出路。

本文将中心线设定为,机动式巡察所营造的“不确定性”,如何影响巡察对象的腐败概率,由此体现这一巡察模式的反腐效力。上述实践困境和相应对策分别属于这一中心线的干扰变量和修正变量,继而分析它们对反腐效力造成的相应影响。由于相关文献和数据的不足,本文就需要借助跨学科工具进行评估。在实行机动式巡察的环境中,腐败概率的变化取决于巡察方与巡察对象的互动,对此,博弈论视角是恰当的选择。因为博弈论是专门研究主体之间互动决策的理论,它可以在没有统计数据的情况下,建构函数图形来呈现变量之间的动态关系。作为一种分析工具,博弈论在中国经济学界的发展已经比较成熟,但是在行政管理领域还需要增添更多的作品,这也是本文的研究价值之一。此外,机动式巡察模式的发展与推广也离不开理论支撑。

二、混合策略博弈中的反腐效力

机动式巡察具备博弈论分析的基本要素,虽然博弈论的理性人假设常见于经济人研究,但也同样适用于政治人的行为,因此博弈论能够成为机动式巡察的研究工具。博弈论可以根据巡察方与巡察对象的策略空间,构建期望效用函数,在函数图形中勾勒双方的混合策略均衡,呈现腐败概率的变化规律,从而体现机动式巡察的反腐效力。

(一)博弈论与机动式巡察研究的耦合性

博弈论的研究对象是人与人之间的互动决策。“互动参与人”是博弈的必要条件,一个人进行的活动不是博弈,多个人进行互不相干的活动也不是博弈。在机动式巡察中,市县党委会根据下属党组织的腐败可能性来决定是否开展巡察工作,党委巡察的不确定性反过来又会影响下属党员干部的腐败倾向。因此,机动式巡察具备“互动参与人”这一必要条件。

博弈论的一般分析方法,就是根据任意两位博弈方的策略空间,以及策略空间中的得益结构,建构博弈模型,然后根据模型中的互动情形,求解纳什均衡。其中,“策略”是指博弈方相机行事的方案,即一方的种种行动选择如何一一针对另一方的行动选择;“策略空间”意味着每位博弈方都拥有一个以上可供选择的策略;“纳什均衡”是指所有博弈方都选择了得益最高的策略,从而形成最优策略的组合。在这种组合中,任何博弈方都没有积极性改变自己的策略选择,从而使博弈进入稳定状态。简而言之,纳什均衡相当于博弈的“解”。纳什均衡之所以需要“求解”,正是因为每位博弈方的策略不止一个,必须经过一个推导过程才能得出。在实行机动式巡察的地区,市县党委的策略空间包括“巡察”和“不巡察”两种,其下属党员干部的策略空间也对应地包含“不腐败”和“腐败”两种。这四种策略可以根据各自的得益信息,通过概率的赋值,最终形成一种稳定的组合形式,从而得出腐败概率的具体情况,即纳什均衡。因此,机动式巡察适用于博弈论的分析方法,也具备博弈论分析的价值。

(二)前提假设

1.理性人假设

本文所采用的博弈论模型是以“理性人假设”为逻辑起点和理论前提的。虽然在以马歇尔为代表的新古典经济学家的影响下,理性人又通常被称为“经济人”,但是我们不能忽视理性人假设针对的是人类趋利避害的本性,而不是某个特定的领域。其实早在20世纪70年代,加里·贝克尔就拓宽了经济人假设的范畴,在经济人的效用函数中加入非经济因素,涵盖了个人可能追求的任何目标,既包括金钱收入,也包括无法用金钱计量的尊严、名誉、社会地位等。因此,追求经济利益最大化的理性人同样会追求政治利益最大化。有学者对政治理性人给出了这样的界定:政治理性人是在特定的政治经济环境中,基于物质需求与精神需求,在三元利益(公共利益、集团利益、自身利益)的激励下,追求、夺取并运用公共权力,实现特定的利益权威性分配以满足特定利益需求,从而实现权力工具理性与价值理性的有机统一。(4)汪波:《政治学基本人性假设的再探讨:论“政治理性人”的基本逻辑》,《浙江社会科学》2007年第6期。由此可见,政治理性人和经济理性人在本质上并无差别,其不同体现在形式上:一是政治理性人的出发点更为多元,不仅包括自身利益,还包括公共利益和集团利益;二是政治理性人以“公共权力”而不是货币为手段。因此,经济博弈论中的理性人假设也同样适用于政治人。

然而,理性人假设在学术界始终备受争议,历史上不断出现试图取而代之的学说,但是博弈论和经济学依然坚持这个假设。坚持理性人假设的第一个原因是那些批判的声音往往没有区分“理性”的不同环节。曾有西方学者调查发现,人们对理性的理解多达20余种(5)Follesdal,D.,“The Status of Rationality Assumptions in Interpretation and in the Explanation of Action,”Dialectica,Vol.36,No.4,1982.。这是因为人们在作出理性决策时,至少要经历三个环节:目标——手段——结果。相应的,理性则包括“价值理性——工具理性——结果理性”三种类型,各自的含义分别为“价值目标设定与偏好一致——选择最有助于实现价值理性的方法——最终结果与价值理性一致”。但是,现实经验告诉我们,“目标——手段——结果”这三个环节既会出现全是理性的情况,也会出现不全是理性的情况,比如“价值理性——工具不理性——结果不理性”、“价值理性——工具理性——结果不理性”和“价值理性——工具不理性——结果理性”。现实中的理性模式如此复杂,倘若笼统地谈理性,自然会招致歧义。根据古典经济学家约翰·穆勒的观点,“理性人”是能够通过对成本——收益的计算,对所面临的一切“目标”

及实现目标的“手段”进行理性优化选择。(6)马克·布劳格:《经济学方法论》,黎明星等译,北京大学出版社,1990年,第68-69页。现代西方主流经济学中的理性人概念暗合于马克斯·韦伯提出的工具理性,但是需要注意的是,韦伯还强调工具理性与价值理性的一致性。(7)莫志宏,刘业进:《评经济学中理性人概念的方法论基础》,《当代经济研究》2011年第3期。地道的理性人假设都是遵循这样的逻辑:理性人会选择符合偏好的价值目标,并为此选择最佳的手段和工具,从而得到符合预期的结果,即价值、工具和结果都是理性的。尽管其他理性模式在现实中可能更为常见,但它们都不属于“理性人假设”所指代的理性,很多质疑理性人假设的声音都没有弄清这一点。

坚持理性人假设的第二个原因是不完全理性学说同样存在局限,无法取而代之。理性人假设中的理性是完全理性,即行为人掌握着完全信息,且不会犯错误。这种假设显然太过极端,这也是理性人假设饱受争议的重要原因,所以产生了一系列“不完全理性”学说。其中,比较典型的有以下两种:第一种是以西蒙为代表的“有限理性”理论。西蒙认为,人们在现实中选择的只是满意解,而不是最优解。(8)赫伯特·西蒙:《现代决策理论的基石》,杨砾、徐立译,北京经济学院出版社,1989年,第70页。威廉姆森也提出,由于人的认知能力是有限的,所掌握的信息是不完全的,所以最终不能实现完全的理性。(9)Williamson, O. E.,Markets and Hierarchie,New York:Free Press,1975,pp.21-23.然而,有限理性学说却始终没能建构出强有力的理论模型来彻底替代完全理性假设。“有限理性”毕竟是量化概念,它的相关理论要想更准确地分析人的行为,就必须确定有限理性的程度。遗憾的是,西蒙和威廉姆森的理论都没有给出相应的办法。其他现有的影响较大的有限理性理论也同样如此,仅仅集中在对完全理性的批判上。(10)何大安:《行为经济人有限理性的实现程度》,《中国社会科学》2004年第4期。诺贝尔经济学奖得主、芝加哥大学教授梅耶森也表示,“尽管我们知道人不是完全理性的,甚至经常会干傻事,但目前还没有发展出来一个建立在非理性假设上的、可以信赖的、准确的、具有更好处理能力的研究框架。虽然有限理性更符合现实,但以此构造理论的努力目前并不成功。非理性假设可以描述许多现象,但不可能建立起一个有分析能力的理论体系。”(11)Myerson, R. B.,“Nash Equilibrium and the History of Economic Theory,”Journal of Economic Literature,Vol.37,No.3,1999.第二种不完全理性学说来自社会学制度主义,认为人的决策是制度和社会背景作用的结果。人是“嵌入”在诸多社会、经济和政治关系之中的,人所做出的决定是为了实现与特定背景相联系的期望,所以不能跳出“背景”而空谈利益最大化。行为人并不是考虑如何最大化自身的收益,而是根据自己的位置和责任,考虑什么样的反应才是合适的。总之,社会环境限制了完全理性的实现。显然,这种批判并没有搞清理性人假设对“理性”的界定。因为理性人首先要做到价值理性,价值理性取决于行为人的价值目标设定是否与自身偏好一致,而行为人的偏好正是各种“环境”和“背景”作用下的产物。正如经济学家常说的:理性人是在给定约束条件下追求自我偏好满足的最大化。如此来看,与其说社会学制度主义是在质疑完全理性的存在,不如说它是在为理性的起点提供理论解释。理性人假设中的完全理性实际上正是指在社会背景约束下所能达到的最大理性,因此社会学制度主义的观点并不构成对完全理性的否定,自然也就不能替代理性人假设。

坚持理性人假设的第三个原因来自完全理性假设的使用价值。理性人假设之所以能够在社会科学的历史中具有很强的竞争优势,除了它是一个退而求其次的办法外,还在于完全理性假设的意义是更好地“求解”社会问题,而不是成为社会问题的“解”。很多人将完全理性误解为“结论”,而不是“条件假设”。实际上,理性人假设的属性是体现在“假设”上面,而不是体现在理性上面。这就好比伽利略和牛顿等物理学家,首先假设物体运动的摩擦力或空气阻力为零,然后进行各种理论推导进而得出结论。但是,并不能因此就得出物理学是在否定摩擦力和空气阻力的存在,牛顿的各条定律也没有因为所选择的前提假设太过极端,就被认为是错误的。同样的道理,理性人假设也只是一种“限定条件”而已。那么,为什么要选择完全理性作为限定条件呢?一是因为社会科学不仅要研究微观问题和短期问题,还要研究宏观问题和长期问题。现实世界中的确存在很多有限理性和不理性的现象,人类也并非时时刻刻都能保持理性。但是,这并不能成为宏观的和历史的结论。正如梅耶森的观点:从社会演进的角度看,人类如果长期不理性,就很难生存。(12)Myerson, R. B.,“Nash Equilibrium and the History of Economic Theory,”Journal of Economic Literature,Vol.37,No.3,1999.二是因为制度设计、制度改革和制度评价都需要预测人的行为,如果我们假定人都是非理性的,一切社会问题都可以归结到人的身上,那么制度就没有办法进行设计、改进和评价了,甚至也没有存在的必要了。更重要的是,即便有限理性学说将来可以发展到能够量化的程度,也不可能像完全理性假设那样去服务于制度建设。原因很简单:人的理性程度是不一致的,但是制度必须是统一的,不可能因人而异。三是因为除非有限理性假设能够得出完全不一样的结论,否则完全理性假设就没有被取代的必要。实际上,生活中的很多事情,并不需要复杂的计算就能做出理性选择,所以在面对简单的事物时,无论是基于完全理性还是基于有限理性,都会得出相同的答案,否则就属于不理性行为了。

在机动式巡察中,市县党委和下属党员干部是这场博弈的参与人,在分析和预测双方的行为时,一是需要设定双方的完全理性是什么,二是需要论证完全理性能够出现。对巡察对象而言,选择腐败会受到惩罚,不腐败则平安无事;对巡察方而言,发现腐败会让党组织受益,没有发现腐败则会白白支付巡察成本,即得益为负。因此,将党员干部的完全理性设定为,基于自身利益选择“腐败”或“不腐败”;将市县党委的完全理性设定为,基于组织利益(公共利益)在某一时间选择“巡察”或“不巡察”。机动式巡察属于“重复博弈”,不是一劳永逸的一次性巡察,即便是巡察过的地方,将来也会进行“回访”。因此,这场监督博弈属于无休无止的持久战,哪怕参与人起初的理性程度有限,也能在长期的重复博弈中提升理性程度。有学者曾尝试建构有限理性实现程度的大致模型,最终也同样论证出“时间长度”与理性程度成正比(13)何大安:《行为经济人有限理性的实现程度》,《中国社会科学》2004年第4期。。更重要的是,市县党委和下属党员干部可选择的行动在得益上都易于比较,无需量化,质化分析即可分出高低。对党员干部而言,在市县党委选择“巡察”或“不巡察”的时候,可选择的行为得益如表1所示。

表1 下属党员干部的行为得益

对市县党委而言,在下属党员干部选择“腐败”或“不腐败”的时候,可选择的行为得益如表2 所示。

表2 市县党委的行为得益

表1和表2清晰地展示出双方可选择的行为在得益上都是正、负或零之分,对理性程度和计算能力的要求很低。所以,即便市县党委和下属党员干部都没能达到完全理性,也有足够的有限理性空间得到与完全理性相同的结果。

2.常量假设

建构机动式巡察的博弈模型,除了理性人假设以外,还需要借助其他前提假设。为了更好地求解腐败概率的变化规律,需要排除不相干变量。具体做法是将不相干变量设为常量,假设它们保持不变:一是在巡察队伍方面,假设巡察人员不存在工作能力方面不适任、不专业以及彼此性格上的不合等问题;二是在发现问题方面,假设巡察组能够顺利找到相应的线索和证据;三是在问题整改方面,假设党员干部的腐败行为被巡察组核实后,能够及时得到处置和纠正。这三种假设与理性人假设一样,不是对现实世界的描述,而是为接下来的理论分析提供便利。尽管很多关于巡察制度的研究,都专门讨论过这三个方面的种种问题,但是本文的研究焦点在于,在机动式巡察机制下,市县党委与下属党员干部会做出怎样的策略选择,所以任何与双方策略空间无关的变量都需要排除掉。

(三)博弈模型的建构及其结论

在机动式巡察的博弈中,市县党委和下属党员干部都无法事先确定对方的行动,因此适用于“静态博弈”模型中的得益矩阵分析。在得益矩阵中,将下属党员干部的策略设置为“腐败”和“不腐败”两种,市县党委的策略为在某一时间“巡察”或“不巡察”。这四种策略构成的得益矩阵如图1所示。当市县党委在某一时间选择“巡察”时,设巡察成本给党委带来的负效用为-C1,若发现腐败行为,党委则获得巡察收益R1,从而可以抵消巡察成本,且巡察净收益为正效用(R1-C1> 0),此时党员干部因违纪惩罚遭受的负效用为-L2;若党员干部选择“不腐败”,那么市县党委选择巡察则一无所获,白白浪费巡察成本,设此时的党员干部没有得失,效用为0。当党委选择“不巡察”时,若党员干部选择“腐败”,得到的好处为R2,同时给党委带来负效用-L1;若选择“不腐败”,设博弈双方无得也无失,效用皆为0。

图1 机动式巡察的混合策略博弈

根据图1中箭头所示的策略偏离方向,可知该得益矩阵不存在纯策略纳什均衡。这是因为,若市县党委选择“巡察”,那么下属党员干部的理性选择是“不腐败”;但当党员干部“不腐败”时,党委的正确策略应该是“不巡察”,以免浪费巡察成本;既然党委“不巡察”,那么党员干部就可能选择“腐败”;一旦党员干部“腐败”,党委就有理由选择“巡察”;……这样便形成了永无止境的循环,无法达到一个稳定的状态。因此,双方在长期博弈中的最优策略都应该是“随机”地选择各自的行动,不能让对方准确地预测自己的行为,从而构成混合策略博弈,这正是巡察周期“机动式”的原理所在。

机动式巡察对腐败行为的抑制程度,可以用期望效用函数进行衡量。由于下属党员干部是以一定的概率选择两种策略中的某一种,因此将党员干部选择“腐败”的概率设为p,那么选择“不腐败”的概率则为1-p。根据图1所示的得益信息,可得出市县党委选择“巡察”的期望效用函数:

u1= (R1- C1) p + (-C1) (1 -p) = R1p -C1

对此,若以p为自变量,R1和C1为常量,那么函数u1的定义域为[0,1],进而描绘出如图2所示的实线函数图形。该实线函数u1= R1p -C1与横轴的交点p1是构成混合策略纳什均衡的概率。这是因为,如果腐败概率大于p1,那么巡察的期望效用u1就大于0,党委就有理由提高巡察的频率,这意味着党员干部选择“腐败”会面临更高的风险,促使腐败概率下降(向左移动)。反之,若腐败概率小于p1,则巡察的期望效用u1小于0,党委就会降低巡察的频率,党员干部就有积极性提高“腐败”的频率,导致腐败概率上升(向右移动)。总之,不论腐败概率最初处于什么位置,机动式巡察最终都会使腐败概率稳定在p1点。

图2 机动式巡察中的腐败概率

根据图2揭示的规律,还可以得出如下结论:(1)在相同的巡察成本下,机动式巡察能够对较为严重的腐败行为产生更强的约束力。腐败程度较重意味着巡察收益更高,比如将巡察收益设为大于R1的数值R1',这意味着巡察净收益由R1-C1向上移动到R1'-C1处,腐败概率由p1向左移动到p2的位置,即程度越重的腐败行为,出现的频率反而越低。(2)在相同的巡察收益下,机动式巡察的成本越低,腐败概率就越小,反腐效力就越强。比如巡察成本由-C1向上移动到-C1'处,与此同时,巡察净收益由R1-C1向上移动到R1-C1'的位置,最终腐败概率由p1向左移动到p3点。(3)只要巡察成本存在,机动式巡察就无法杜绝腐败行为的出现。即使巡察成本接近于0,巡察收益无穷大,也只能让腐败概率趋近于0,但无法等于0。

三、干扰变量对反腐效力的负面效应

上述关于机动式巡察反腐效力的分析,是假定在无干扰的纯化环境中进行的,然而现实环境更为复杂,所以在研究机动式巡察时,不能忽视实践中可能遇到的阻力与障碍。根据现有的常规巡察文献,机动式巡察的主体同样有可能将理性的天平向自身利益倾斜,出现个体理性与集体理性的偏离,从而失去履行公职的积极性。这是因为,在巡察方与巡察对象的互动中,往往会遇到其他变量的干扰。其中,“熟人社会”是基层巡察工作的普遍制约因素,熟人社会又会给“公权寻租”创造有利的生存环境,熟人社会和公权租金又会进一步加深巡察主客体之间的“同体利益”关系。这些因素会导致巡察方策略空间中的得益结构发生改变,从而使巡察工作陷入困境。在机动式巡察的博弈模型中加入这些实践中的干扰变量,必然会导致腐败概率发生新的变化,影响这一巡察模式的反腐效力。

(一)机动式巡察的干扰变量

从人民群众的视角看,腐败行为是对群众利益的直接侵害,巡察方是作为“局外人”代表群众进行监督的,从这个意义上讲,机动式巡察属于“第三方执行”机制。这样便出现了一个问题,局外人实施惩罚的积极性往往会低于直接受害方,尤其是当巡察方的价值理性倾向于自身利益的时候,事不关己的感觉会更为强烈。再加上现实环境中还可能存在一些外在变量会破坏巡察成员的参与约束和激励相容约束,或是给巡察工作带来额外成本,或是诱导巡察流于形式。

1.熟人社会

市县以下的基层单位是机动式巡察的对象,但是历史悠久的中国乡土社会有其独特的人文环境。所以,在推测机动式巡察的实践难题时,既要把参与人视为政治人,也要将其视为“社会人”。正如社会学制度主义的观点:人的行为和选择是社会背景作用的结果。虽然中国已经开始从“熟人社会”走向“陌生人社会”,但是熟人社会在基层单位的遗患依然较为明显,成为市县巡察工作难以回避的挑战。因为,在基层社会中,县域局长、乡镇书记之间很可能是曾经的同事、同学、哥们。山西省运城市委巡察二组成员周登峰也曾在《运城日报》上描述到,市县两级的很多干部都是在共同的环境中生活与工作的,好人主义思想根深蒂固,亲情乡情成为巡察工作的“软肋”。(14)周登峰:《当前市县巡察工作面临的机遇与挑战》,《运城日报》2018年1月3日。机动式巡察也会面临同样的问题,一旦因为人情因素事先走漏风声,使巡察对象得以充分准备,那么机动式巡察的“不确定性”的优势就会形同虚设。或者在巡察过程中,巡察人员碍于情面放不开手脚,没有积极尽职尽责,对各种违纪线索视若无睹,只能让巡察工作流于形式,甚至会迫使市县党委在筛选巡察对象时,以人情关系的远近为依据。总之,熟人社会因素会让机动式巡察面临额外的人情损失,给巡察方带来行动阻力。

2.公权租金

机动式巡察属于以权力监督权力,但是任何权力都存在扩张性和腐败风险,即便是行使监督权的一方也存在寻租性腐败的空间。再加上熟人社会能够降低权力寻租的交易成本,巡察方寻求公权租金的可能性就更加不容忽视。与经济寻租的公开性不同,公权寻租具有隐蔽性。掌权者可以利用职务之便,给公权租金披上“合法”的外衣。也许正是基于这样的原因,改革开放后被查处的寻租性腐败案件居高不下,且涉案官员级别较高,涉案金额相当惊人。此外,当前我国公权寻租腐败还呈现出横跨领域广泛、利益分赃程序化和不断恶化地方政治生态等特点。(15)韩飞:《公权寻租利益链阻断研究》,《领导科学》2017年第11期。江苏省射阳县纪律检查委员会纪检监察员王家峰也表示,“寻租性腐败可发生于政府的任何职能部门”(16)汪淑珍,王家峰:《地方政府寻租性腐败现状分析:以江苏省北部某县为例》,《北京科技大学学报(社会科学版)》2008年第3期。。因此,机动式巡察同样存在这样的隐患。虽然机动式巡察是一种基于正当价值目标的政治行为,但是如果对巡察方缺乏有效的约束,则很有可能会发生“无意创租”。(17)王立峰,潘博:《党内基层巡察制度优化路径探析》,《长白学刊》2017年第2期。因为机动式巡察一旦形成态势,任何“不干净”的单位都有积极性采取“自保”行动。而且在熟人社会的环境下,行贿方和受贿方都会对彼此降低警惕。这种“自保”行动一旦形成潜规则,就会构成一种竞争市场:谁给的好处最多,谁就最安全。这也是腐败金额往往数目惊人的一个重要原因。在公权租金的诱惑下,巡察方在选择巡察对象时,可能会以各单位的“租金”数额为依据。另外,根据麦克切斯内的权力寻租理论(18)Mcchesney,F. S.,“Rent Extraction and Rent Creation in the Economic Theory of Regulation,”The Journal of Legal Studies,Vol.16,No.1,1987.,巡察方还有可能利用手中的监督大权诱使或迫使下级单位向其“进贡”,从而让原本的“无意创租”在自利的驱动下演变为“主动创租”。总之,公权租金可能会通过可观的个人收益诱导巡察方玩忽职守。

3.同体利益

与中央的“异地”巡视不同,全国各地大部分巡察都是在各自基层范围内进行的“同体巡察”,即本县县委巡察本县的乡镇。(19)吴纪树:《基层巡察的实践逻辑及其制度完善》,《求实》2017年第10期。一方面,巡察方与巡察对象在较近的距离内生活和工作,更容易获取有关违纪现象的信息和线索,这是同体巡察的优势;但另一方面,同体巡察会涉及“同体利益”问题,这层利害关系网络会成为巡察工作的制约因素。比如,有些违规违纪问题在一个县内的部门单位比较普遍,巡察人员本身也在这些单位之中,如果纠正则会引起连锁反应;(20)陈建平,郑雯雯:《监督下沉:市县实施巡察制度面临的困境及其优化路径》,《河南社会科学》2019年第9期。巡察组成员与巡察对象受同级党委、政府领导,在共同的财政和人事体制下工作,从心理到行为存在天然的亲近关系。再比如,在行政化村级自治组织,村委干部是乡镇干部的“腿”,各种基层腐败案件往往是村委干部与乡镇干部“上下其手”才得逞的,因此双方自然也会对巡察形成“攻守同盟”;由于县级党委对下属党组织负有廉政建设的“主体责任”和“监督责任”,这往往会导致本县域基层巡察中查处的腐败问题被“虚化处理”,以免县级党组织被上级组织追查问责。(21)周少来:《基层巡察要避免“形式化陷阱”》,《人民论坛》2018年第8期。此外,熟人社会的环境以及公权寻租的隐患,可能会进一步加深巡察方与巡察对象之间的同体利益关系。同体利益同样会给机动式巡察的有效运行带来干扰,使巡察方的工作面临额外的成本。

(二)加入干扰变量的博弈模型及其结论

在熟人社会和同体利益的干扰下,即使“巡察”能够发现腐败行为,巡察方也会遭受额外的负效用-D1,使巡察净收益变为R1-C1-D1。在公权租金的诱惑下,如果巡察方对腐败行为视而不见,让巡察“形式化”,反倒可以获得额外收益G1。那么,图1中的得益矩阵就会发生如图3所示的改变。

图3 干扰环境中机动式巡察的博弈

根据图3中箭头所示的策略偏离方向,可知“实质性巡察”有可能转变为严格下策,使机动式巡察走向“形式化”。在干扰环境中,如果巡察方将个人得失置于组织得失之上,则意味着即便在党员干部选择“腐败”的情况下,“不巡察/形式化巡察”的得益也依然大于“实质性巡察”的得益,导致 “不巡察/形式化巡察”成为巡察方的严格上策,机动式巡察的不确定性优势就名存实亡,最终混合策略纳什均衡就会转变为纯策略纳什均衡——(不巡察/形式化巡察,腐败)。这是机动式巡察可能陷入的最坏境地。如果巡察方能够以组织利益为价值理性,那么在得益矩阵中就能实现R1-C1-D1> -L1+ G1,保障实质性巡察的出现,但是相比于纯化环境,实质化巡察的期望效用函数会有所不同,如图4所示。

图4 干扰环境中机动式巡察的腐败概率

根据图4所展现的信息,可得出如下结论:(1)只要干扰变量存在,即便巡察方能够做到公共利益至上,保证应有的实质性巡察,腐败概率也依然会提高,从而使反腐效力受损。图4中的虚线部分表示纯化环境中巡察的期望效用函数,该函数在干扰变量的影响下,巡察净收益由R1-C1向下移动到R1-C1-D1的位置,腐败概率p1随之向右移动到p1'处,即腐败概率大于纯化环境中的状态。(2)在相同的巡察收益下,机动式巡察的成本越低,腐败概率在同等干扰环境中增加的幅度就越小,反腐效力受到的干扰就越弱。同等干扰环境是指实质性巡察所面临的负效用-D1不变,所以当-C1向上移动时,R1-C1与R1-C1-D1也同时向上移动,且这三点的移动幅度相同,这意味着图4中的虚线与实线之间的夹角和各自的斜率保持不变。相当于横轴平行向下移动,从而可以得出p1'与p1之间的距离会逐渐缩短。(3)在相同的巡察成本下,较为严重的腐败行为出现的概率在同等干扰环境中提高的幅度更小,受到的约束力依然更强。巡察所发现的腐败行为越严重,巡察收益R1就越高,使得纵轴上的R1-C1与R1-C1-D1两点同时向上移动,虚线与实线就会变长。倘若虚线与实线的夹角保持不变,这两点间的距离D1就会增大,不满足D1保持恒定的条件。所以,当巡察收益升高时,虚线与实线的夹角就必须缩小,p1'与p1之间的距离也就随之缩短。

四、跨域巡察对干扰变量的应对效果

机动式巡察的上述干扰变量是亟需采取具体措施去预防的。当前,已有很多地区的常规巡察在这方面有了成功的经验,可以将其归纳为“纵向提级”和“横向交叉”,这两种方式对干扰变量所带来的修正效果,同样可以运用博弈论模型进行评析。

(一)纵向提级

近年来,一些地区的常规巡察改变了县级巡察乡镇的模式,由市级党委巡察机构派出巡察组对重点乡镇的单位进行巡察,巡察组向市委巡察工作领导小组负责并报告工作。这种“纵向提级”的巡察方式,一方面可以减弱“熟人社会”的干扰,有利于攻克“人情关”,另一方面能够回避县乡之间的“利益关系”,从而为巡察方创造出有利的工作环境。实践也证明,提级巡察比同级巡察更容易发现腐败问题。例如,2018年3月十堰市委对23 个曾在同级巡察中全年零办案的乡镇开展提级巡察,在不到一个月的时间里就发现多起违规违纪线索。(22)雨田:《十堰:“提级巡察”剑指基层监督难题》,《中国纪检监察报》2018年5月29日。可见,相比于同级巡察,提级巡察更加超脱,而且巡察组代表的是市委的权威,能够放胆巡察,有利于破解同级巡察“巡不深、察不透”的难题。机动式巡察如果能以纵向提级的方式进行,就能有效降低熟人社会与同体利益的潜在干扰,为巡察质量提供一定的保障。

(二)横向交叉

除了纵向提级以外,还有“横向交叉”的巡察方式能够减轻干扰变量的负面影响。中共十九届中央纪委二次全会提出了探索开展县(市、区、旗)交叉巡察等方式方法的重要性。(23)蔡志强:《交叉巡察的实践价值——破解基层“熟人社会”困扰的制度安排》,《人民论坛》2018年第31期。从全国各地的实践来看,横向交叉的巡察方式主要有三种: 一是跨县域异地交叉巡察,让甲县巡察乙县,乙县巡察丙县……做到公务回避、任职回避和地域回避。此外,巡察组的内部成员也要做到“回避”,让来自不同县域的人员组成交叉巡察组,对不涉及组内成员县域的县直部门开展“回避式”交叉巡察。最后,还有“交叉回访”作为最后一道锁。既要坚持交叉巡察与前期巡察对接,接力促进整改,对个性问题全程跟踪督办,也要打破“被巡察单位由哪个巡察组巡察,就由哪个巡察组回访”的固定模式,防止“一回生、二回熟”。这种交叉巡察模式在实践中让外界很难提前知晓巡察人员和巡察内容,使求情电话无处可打,所以基层干部群众反映问题的主动性也大大增强。二是县域内部跨乡镇交叉巡察,临时指定巡察组与被巡察村,提前三四天交办任务,在这之前,巡察的时间和地点一概不知,从而保障了巡察监督的“不确定性”。三是市直单位部门跨系统交叉巡察,巡察组不得巡察自身对口监督的单位,让外行查内行,做到“旁观者清”,避免因思路同化而导致的监督缺位。江西省新余市通过这种交叉巡察模式,使发现问题线索的质量与数量的同步提升。过去未被发现的租金问题,就是由原本并不归口巡察商业局的第一纪工委巡察所发现。经系统整改,为国家挽回经济损失300万元。(24)李玉长:《交叉巡察破除人情干扰:衡水、桐庐、新余三地的交叉巡察实践探析》,《中国纪检监察报》2017年4月14日。因此,比起纵向的提级巡察,横向的交叉巡察对工作质量的保障有过之而无不及。倘若机动式巡察能够以横向交叉的形式开展,可以有力消除干扰变量带来的额外成本。

(三)跨域巡察中的腐败概率

提级巡察和交叉巡察都属于跨域巡察,巡察成本带来的负效用-C1会由此增加。如图5所示,-C1的增加会导致纯化环境中巡察的期望效用曲线u1(虚线部分)向下平行移动,使腐败概率大于纯化环境中的p1点,因此跨域巡察依然无法避免腐败概率的增加。但是,实行跨域巡察的目的在于降低干扰环境中同域巡察(细实线部分)的腐败概率p1',所以需要注意的是,跨域所带来的额外成本不得超过-E1,否则跨域巡察(粗实线部分)中的腐败概率就会大于p1',使得跨域巡察失去意义。

图5 机动式跨域巡察中的腐败概率

五、结 论

通过博弈论的模型分析可以得出,降低机动式巡察的成本是提高反腐效力的必要条件;即便在熟人社会、公权寻租和同体利益的环境中,机动式巡察也能够对较为严重的腐败行为产生更强的约束力;如果机动式巡察采用纵向提级和横向交叉的模式,就能够回避熟人社会与同体利益的干扰,但这受到跨域空间的限制。至于公权寻租问题,则需要从价值理性入手探寻相应的面对之道。有些人之所以能够自觉遵规守纪,是因为遵规守纪能够博得他人的尊重和社会的认同,违反规则会招致他人的鄙夷和社会的谴责。(25)Mcadams,R.H.,“Cooperation and Conflict: The Economics of Group Status Production and Race Discrimination,”Harvard Law Review,Vol.108,No.5,1995.如果巡察方对党和人民的认同拥有足够的道德追求,那么就能找到自觉抵制贿金诱惑的驱动力。虽然有些时候周围人的尊重或谴责并不会表现出来,但是遵规守纪行为也可以向周围人彰显自己的“合作型”倾向,从而赢得潜在的合作机遇,这是一种“信号传递机制”。(26)Posner,E.A.,“Symbols, Signals, and Social Norms in Politics and the Law,”The Journal of Legal Studies,Vol.27,No.2,1998.在全面从严治党的背景下,党组织更愿意重用和提拔严于律己的人,这种潜在的机遇可以让巡察方找到履行职责的积极性。此外,职业角色也会让职业道德和职业责任内在化,使人们可以从工作中获得道德和荣誉上的主观收益。(27)Cooter,R.,“Law and Unified Social Theory,”Journal of Law and Society,Vol.22,No.1,1995.如果受贿行为给巡察方造成的主观道德伤害能够大于租金的客观收益,那么寻租问题就能迎刃而解。

社会认同、潜在机遇和内在收益这三种非物质动因,实际上都可以归纳为“道德动力”。因此,要想保障巡察方能够自觉抵制权力租金的诱惑,就需要党组织对巡察方的价值理性做出引导,增强他们的道德追求,不断提升他们对公共利益的价值评价。这就需要以教育活动为主要手段,不但要在巡察之际对巡察方进行专门的思想教育,平时也要对市县党委成员、纪委成员以及其他巡察备选人员定期开展各种主题教育,实现思想教育活动常态化。然而,部分单位的教育活动还存在实效性不强的问题,这主要是由于这些单位的思想教育活动缺乏吸引力和趣味性造成的。如何保障每一场教育活动的高质量,持久地激发巡察方的学习热情,是当下亟需思考的问题。

猜你喜欢
市县机动理性
“双减”的路向反思与理性审视
年度赶考
——省审计厅召开市县审计机关主要负责同志述职报告工作会议
12万亩机动地不再“流浪”
机动三轮车的昨天、今天和明天
多个省的市县机构改革开始实施
人人都能成为死理性派
一图读懂贵州市县乡三级人大换届选举
滚转机动载荷减缓风洞试验
改革牛和创新牛都必须在理性中前行
为业余棋手诊脉