不完全信息下军事威逼讨价还价博弈分析*

2016-11-16 08:15张小娟向钢华胡喜珍曹素平

火力与指挥控制 2016年10期

关键词：挑战者威慑效用

张小娟，向钢华，胡喜珍，曹素平

（火箭军指挥学院，武汉430012）

不完全信息下军事威逼讨价还价博弈分析*

张小娟，向钢华，胡喜珍，曹素平

（火箭军指挥学院，武汉430012）

在详细分析威慑与威逼区别的基础上，构建了不完全信息下军事威逼讨价还价博弈模型。按照最大期望效用准则，分析了不完全信息下军事威逼走向讨价还价阶段的条件，研究表明：运用鲁宾斯坦经典讨价还价唯一完美均衡解，得出以下结论：争夺目标自身的效用越大，战争带来的声誉得益效用越大，军事威逼走向讨价还价阶段的可能性越大；一旦进入讨价还价阶段，威逼者会接受挑战者提出的方案，冲突将不再发生。

军事威逼，讨价还价博弈，不完全信息

0　引言

威慑理论研究中，威慑（deterence）和威逼（compellence）是两个涵义相近而又容易混淆的学术概念。托马斯·谢林（ThomasSchelling）最早对威慑和威逼两个概念进行了区分［1］。罗伯特·阿特（Robert Art）认为，威逼与威慑的区别“就是主动与被动使用武力的区别”［2］。克劳迪奥·乔菲-雷维利亚（ClaudioCioffi-Revilla）认为：尽管两者均以“实力”为手段，但威慑的目标是维持现状，消除对现状挑战的潜在威胁，而威逼旨在改变现状，以取得新的平衡［2］。如下页表1所示，威慑是在挑战者发起挑战之前，威慑者以武力威胁慑阻挑战者打破现状。威逼是在威慑者事先没有察觉的情况下，挑战者发起了挑战，造成某种既成事实，而这种事实是威慑者不愿接受的结局，因此，威慑者会发出武力威胁，逼迫挑战者撤回挑战，达到新的“现状”。托马斯·谢林认为威逼比威慑更难成功，之所以如此，除了威逼涉及挑战者已经付出的实质性代价及撤回挑战承受的声誉损失［3］，还涉及威慑者与挑战者对新“现状”的构建与达成一致，此过程是二者进行讨价还价的博弈过程。对威逼者与挑战者的这一博弈过程进行分析，得到反映威逼全过程的作用机理，有助于更加深刻地把握和理解当今世界政治军事领域的一些现象。

表1　威慑与威逼的区别

1　军事威逼讨价还价博弈模型

在威逼的博弈分析中，博弈方为威逼者（D）和挑战者（C），而且双方都是理性行为体。挑战者在威逼者没有察觉的情况下发起挑战，并造成某种既成事实；威逼者不能接受这种结局，发出武力威胁，要求挑战者撤回挑战；挑战者碍于声誉成本，将不会退回原有的现状。尔后，双方要么发生武力冲突，要么进行谈判（bargain）。此时，挑战者提出一个利益划分方案，威逼者选择接受或拒绝，如果接受，则达成新的“现状”。如果拒绝，由威逼者提出新方案，如果挑战者接受，博弈结束；如果拒绝，挑战者继续提出新方案。以此类推，直到达成新的现状，威逼结束。

基于上述分析，军事威逼讨价还价博弈模型包括两阶段模型，即第1阶段的军事威逼模型和第2阶段的讨价还价模型分别如图1、图2所示。

图1　第1阶段军事威逼模型

图2　第2阶段讨价还价模型G1

2　军事威逼博弈分析

军事威逼过程中，双方利益完全对立的完全冲突状态是非常罕见的。在多数情况下双方介于完全冲突与完全合作之间。博弈双方不是完全誓不两立的敌人，而是互存疑虑与分歧的伙伴，关注的问题不是冲突双方的利弊得失，而是如何达到一个实现冲突双方最大利益的结果［4］。

在军事威逼两阶段博弈模型中，挑战者与威逼者之间的策略互动结局有“挑战者赢”CWIN、“威逼者赢”DWIN、“战争”WAR以及重新构建的现状SQi（i=1，2，…，n）。完全信息条件下，军事威逼现象不会出现［5］，不完全信息条件下，博弈双方的策略选择依赖于结局的期望效用。

面对挑战者由于挑战造成的既成事实，威逼者有“默认”和“逼迫”两种策略可以选择。当他选择“默认”策略时，结局为“挑战者赢”CWIN，顾及由此带来的声誉成本，威逼者将不会选择“默认”策略，而会选择“逼迫”策略。面对威逼者的“逼迫”，挑战者有“后退”和“坚持”两种策略可以选择。当他选择“后退”策略时，结局为“威逼者赢”DWIN；当他选择“坚持”策略时，威逼者将以“武力”和“谈判”两种策略应对，如果威逼者选择“武力”策略，结局为“战争”WAR，如果威逼者选择“谈判”策略，双方将进入第2阶段讨价还价博弈阶段。

由上述分析可以看出，面对挑战者的挑战，威逼者顾及声誉成本势必会实施“逼迫”策略，迫使挑战者撤回挑战，因此威逼者对于4种结局的两种偏好顺序分别为：

挑战者考虑到声誉成本与发起挑战的经济成本，必然不会选择“后退”策略，而会选择“坚持”策略，因此，挑战者对于4种结局的两种偏好顺序分别为：

当战争的期望效用远远低于讨价还价的期望效用时，威逼者和挑战者将分别选择式（1）和式（3），博弈进入讨价还价阶段。比如核威慑条件下，由于核战争的期望效用远远低于讨价还价的期望效用，“战争”将成为威逼者和挑战者的劣势策略，军事威逼必然进入讨价还价阶段。

2.1军事威逼第1阶段博弈

当战争的期望效用不小于讨价还价的期望效用时，挑战者就必须先根据威逼者行动来判断其类型是强硬型（Tough）还是软弱型（Weak），然后再选择自己的策略。此时，第1阶段军事威逼博弈就变成了不完全信息动态博弈，威逼者必须主动发出信号以反映自身的真实状态（实力与决心），挑战者也会采取试探行为，力求进一步获取威逼者类型的真实信息。根据斯宾塞（Spence）提出的信号博弈模型，建构不完全信息动态博弈模型如下页图3所示。

图3中圆圈内的N、D、C分别表示虚拟参与人——自然（Nature）、威逼者、挑战者的决策节点，自然首先选择威逼者的类型（假定类型由付出的成本决定），p和1-p分别表示威逼者为强硬（T）和软弱（W）类型的先验概率，x和y分别表示威逼者发出高强度信号和低强度信号时挑战者对威逼者为强硬类型的后验概率。设争夺目标对威逼者和挑战者的效用分别为UD和UC；威逼者发出高强度信号和低强度信号付出的代价效用分别为和；在威逼者发出高强度信号和低强度信号时，挑战者敢于采取“武力”策略的声誉得益效用分别为和，则其采取“谈判”策略的效用为和－；威逼者和挑战者的战争代价效用分别为和，赢得战争的概率分别为α和1－α。

图3　不完全信息动态博弈

则威逼者发出高强度信号时，其在WAR结局下的期望效用为：

挑战者在WAR结局下的期望效用为：

因此，挑战者选择谈判的期望效用为：

挑战者选择武力的期望效用为：

按照最大期望效用准则，当x＜x*时挑战者更倾向于选择谈判策略；当x＞x*时，挑战者更倾向于选择武力策略。

同理，在威逼者发出低强度信号时，转折概率：

当y＜y*时，挑战者更倾向于选择谈判策略；当y＞y*时，挑战者更倾向于选择武力策略。

2.2讨价还价阶段博弈分析

在讨价还价阶段，假设争夺目标自身的价值为1，博弈双方进行鲁宾斯坦式讨价还价，挑战者提出一个划分方案（α，1－α）（该方案是鲁宾斯坦式讨价还价的唯一完美均衡解），威逼者选择接受或拒绝，如果接受，则博弈结束，双方得益分别为α和（1－α）；如果拒绝，挑战者将实施报复，双方得益分别为δCα和δD（1－α）。尔后，威逼者提出一个新的方案（1－β，β），如果挑战者接受，博弈结束；如果拒绝，威逼者实施报复，挑战者随后提出新的方案，直到达成新“现状”。其中，0≤α，β，δC，δD≤1，δ是谢林提出的折扣因子，用来表示相互威慑的讨价还价能力或对对方的伤害能力，即协议无法达成时的受损失程度。

博弈双方单边信息不完全时，冲突不会出现［6］。当博弈双方信息不完全时，设挑战者为高讨价还价能力H类型和低讨价还价能力L类型的先验概率分别为γ和1－γ，威逼者相应的折扣因子分别为δDL和δDH。威逼者为高讨价还价能力H类型和低讨价还价能力L类型的先验概率分别为η和1－η，挑战者相应的折扣因子分别为δCL和δCH，根据博弈双方的不同类型，挑战者提出的方案有以下4种，见表2。

表2　挑战者的4种方案

若挑战者提出（σ，1－σ）方案，H类型威逼者接受时得益为（1－σ），拒绝时期望得益为：

由于

所以

此时，H类型威逼者拒绝的期望得益小于接受时的得益，他将选择接受（σ，1－σ）方案。

若挑战者提出（υ，1－υ）方案，H类型威逼者接受时得益为（1－υ），由于υ＞ω，挑战者将不可能选择（ω，1－ω）方案，所以威逼者拒绝（υ，1－υ）方案时期望得益为δDL（1－σ）γ2+δDH（1－φ）（1－γ2）

若δDL（1－σ）γ2*+δDH（1－φ）（1－γ2*）=（1－υ）

由于0≤γ2≤1，所以

此时，H类型威逼者将接受（υ，1－υ）方案。

若挑战者提出（φ，1－φ）方案，该方案是H类型威逼者偏爱的方案，此时，他将选择接受。

若挑战者提出（ω，1－ω）方案，H类型威逼者接受时得益为（1－ω），拒绝时期望得益为：δDL（1－σ）γ4+δDH（1－φ）（1－γ4）

由式（5）可知：

此时，H类型威逼者将接受（ω，1－ω）方案。

经上述分析，进入讨价还价阶段后，H类型的威逼者将接受挑战者提出的任何方案，L类型的威逼者也将如此；由于υ>σ，υ>ω，所以（υ，1－υ）方案是挑战者的优势策略，即无论威逼者是否L类型，挑战者都将可以将自己视为H类型针对L类型的威逼者提出方案，此时威逼者都会选择接受。

3　结论

本文首先对威慑与威逼进行分析，在此基础上建构了军事威逼讨价还价博弈两阶段模型。尔后根据最大期望效用准则，得出不完全信息下军事威逼走向讨价还价阶段的条件，并运用鲁宾斯坦经典讨价还价唯一完美均衡解，对比分析了挑战者4种不同方案，得出以下结论：①争夺目标自身的效用与军事威逼走向讨价还价阶段的可能性正相关，目标效用越大，走向讨价还价阶段的可能性越大；②战争带来的声誉得益效用越大与军事威逼走向讨价还价阶段的可能性正相关，声誉得益效用越大，走向讨价还价阶段的可能性越大；③战争付出的代价与军事威逼走向讨价还价阶段的可能性正相关，代价越大，走向讨价还价的可能越大；④军事威逼一旦进入讨价还价阶段，威逼者必然会接受挑战者提出的方案，冲突将不再可能发生。

［1］THOMAS S.Arms and influence［M］.New Haven Yale UniversityPress，1966.

［2］理查德·N.哈斯.新干涉主义［M］.殷雄，译.北京：新华出版社，2000：1-286.

［3］向钢华，王永县.偏好、信息与威慑博弈［J］.国际政治科学，2006，2（3）：1-33.

［4］托马斯·谢林.冲突的战略［M］.赵华，译.北京：华夏出版社，2006：1-263.

［5］向钢华，王永县.军事威逼博弈分析［J］.运筹与管理，2010，19（2）：5-8.

［6］向钢华，王永县.一种不完全信息相互威慑讨价还价模型［J］.运筹与管理，2008，17（17）：15-19.

［7］RUBINSTEIN A.Perfect equilibrium in a bargaining model［J］.Econometrica，1982，50（1）：97-109.

Game Theoretical Analysis of Military Compellence Bargaining Process with Incomplete Information

ZHANG Xiao-juan，XIANG Gang-hua，HU Xi-zhen，CAOSu-ping
（The Rocket Army Command College，Wuhan 430012，China）

The meanings of deterrence and compellence are distinguished.And then a military compellence bargaining model with incomplete information is advanced.According to the expected utility maximization criterion the condition of military compellence to bargaining game is yielded.With Rubinstein bargaining equilibrium the following conclusions are obtained.The larger the target avail which is contested is，the larger the report avail which is obtained by the war is，the larger the probability that the players go into bargaining process is.Once the players go into bargaining process the conflict will not occur any more and the defender will accept the project that the challenger advanced.

militarycompellence，bargaininggame，incompleteinformation

E81

1002-0640（2016）10-0055-04

2015-08-26

2015-09-16

国家自然科学基金资助项目（51409258）

张小娟（1982-），女，山东肥城人，博士研究生，讲师。研究方向：军事运筹、军事威慑。

不完全信息下军事威逼讨价还价博弈分析*

0 引言

1 军事威逼讨价还价博弈模型

2 军事威逼博弈分析

3 结论

0　引言

1　军事威逼讨价还价博弈模型

2　军事威逼博弈分析

3　结论