关于萨维奇统计决策理论的研究

2013-10-20 04:29季爱民
统计与决策 2013年23期
关键词:悖论效用理性

季爱民

(安徽师范大学 政治学院,安徽芜湖 241000)

1738年,贝努利(D.Bernoulli)阐发了现代期望效用决策理论的萌芽,经过拉姆齐(F.P.Ramsey)和菲尼蒂(B.De Finetti)主观概率理论的奠基,以及冯·诺意曼(J.V.Neumann)和摩根斯顿(Q.Morgenstern)现代期望效用决策理论的发展,1954年,萨维奇(L.J.Savage)给出了一个规范的理性决策模型——主观期望效用理论,为20世纪50年代决策分析理论的迅速崛起做出了不可磨灭的贡献。

1 私人概率测度

拉姆齐在不满意通过打赌方法测度部分信念后,曾提出了一种用效用定义相信度的方法,虽然后来他依旧不满意这个方法。他认为行为人对任何事物都有着某种信念,可以将所有的可能世界(即行动的所有可能结果的集合,一个可能世界是一个结果的全部情形)都放进一个价值序列,看行为人如何看待所有可能世界进程的好坏。这样一来,信念就能够通过个体的行动选择反映出来。不过,仅仅指出不同可能世界的价值不同肯定不够,这样无法在不同的可能世界之间进行比较。因为在不同的可能世界里,虽然价值的数值不同,但是,如果它们在不同的可能世界里是被任意地赋值,无法用确切的数值代表它们,那么说α和β之间的价值差别等于γ和δ之间的价值差别,这样一个断言将不会有意义。[1][2]这就是说,虽然存在某种定性的价值,可以将所有的可能世界放进一个价值序列,但是,如果没有办法在它们之间进行比较,那肯定是不够的。拉姆齐提出可以通过个体的偏好对价值进行比较,即通过个体的某种信念对所有可能世界用偏好关系进行排序,利用偏好关系导出一个概率测度来定义相信度。

拉姆齐证明了他的每一个定义都伴随着一个一致性公理,把部分信念一致性理解为一种特别类型的偏好关系的性质,如果行为人的信念体系不满足这种偏好关系,那么他的价值判断将不一致,这会导致自己遭受荷兰赌。[3]拉姆齐给出了四个概率律并证明对于任何一致的相信度集合,概率律都必然成立,违背概率律的任何确定的相信度集合都将违背选择间的优选律。[1][2]在对这个建立在偏好关系之上的测度价值体系给出一些假设性条件后,他认为可以由偏好关系得到效用函数。虽然他本人没有对效用函数的存在性进行证明,只是指出这种偏好关系是一种传递关系,但是,实际上,这个偏好关系就是一种弱序关系,并且他所指的效用函数是存在的。

萨维奇同样把概率看成是私人的事情,1954年,他将效用理论与私人概率(Personal probability为萨维奇用语)结合起来研究不确定情形下理性人的行动选择,给出了一个严格的公理体系,得到主观期望效用理论。之所以称之为主观期望效用理论,是因为对效用函数进行加权的不是客观概率,而是取决于个体的偏好,由个体的行动选择推断出来的私人概率。

萨维奇的方法与拉姆齐不同,拉姆齐是基于机会均等事件取得效用,然后根据效用得到概率,而萨维奇私人概率的获得并没有通过效用,他是把行动定义为状态到结果的函数,在弱序和一系列假设条件的基础上得到:在状态空间存在唯一的概率测度;在结果空间存在唯一的适合于一个正线形变换的实值效用函数。即对所有的行动(f,g)而言,f≤g,当且仅当,U(f)≤U(g),U(f)和U(g)为行动的主观期望效用。

萨维奇承认自己曾陷入频率论传统太深,之所以他要重新考虑统计学基础,提出私人概率是统计学大厦的阶梯,至少有以下一些因素:如果统计学家既拒绝客观概率,又拒绝私人主义的概率,那么势必使得他们别无选择;如果统计学家使用频率论进行统计理论的研究,由于接受了概率必然性的观点,那么又只能“影响着科学以及统计学的其他应用领域的最重要的不确定的事情就再也不能用概率来测度了”[1];如果使用私人概率,则可以推进统计学的发展。

为了对个体进行概率测度,萨维奇对现实世界的状态、行动和结果进行了形式化的处理。他认为现实世界是个体关心的,针对不同的问题,行为人会有许多不同的现实世界,而现实世界的状态就是一种对现实世界有关方面毫不遗漏的描述。状态要体现一切有关的决定因素(关于这些因素,决策者不能断定),并且应当用这样一种方法来表示,即取得的状态不依赖于选定的行动。[4]在萨维奇那里:世界状态是一个有着元素s,s',s"……和表示事件的子集A,B,C……的集合S;一个结果是可能对个体发生的任何事件,结果集合被设想由F表示,由 f(s),g(s),h(s)……组成;行动是行为人采取的一个动作,一个行动被视为和它的可能结果相同,即行动被定义为状态到结果的函数(而不是把状态定义为行动到结果的函数),用f,g,h表示。

萨维奇通过一个具体事例澄清了这些概念。他说:“思考一个例子。当你进来并且自愿完成煎蛋卷的时候,你的妻子已经打了5个好鸡蛋放在一个碗里。第六个鸡蛋,没有打碎放在碗的旁边,由于一些原因,它必须要么被用来煎蛋卷,要么扔掉。你必须决定怎么处置这个没有打碎的鸡蛋。你必须只能在三个行动之间作出决定,也许这并不是太过度单纯化的。即把它打碎放在装其他5个鸡蛋的碗里,把它打碎放在一个碟子里观察,或者不观察直接把它扔掉。取决于蛋的状态,这三个行动的每一个将有一些与你有关的结果。这个说明行动、状态和结果的例子可用下表来表示:”[5]

行动打碎放进碗里打碎放进碟子里扔掉状态好的六个煎蛋卷六个煎蛋卷,和洗一个碟子五个煎蛋卷,一个好鸡蛋毁坏臭的没有煎蛋卷,5个好鸡蛋毁坏五个煎蛋卷,和洗一个碟子五个煎蛋卷

可以看出,在给定的情形下,所有可得到的行动的集合可以用F表示,在这个例子中,F有三个行动作为元素。如果用f表示表中的第一个行动“打碎放进碗里”,那么行动f可以表示成函数的形式:f(好的)=六个煎蛋卷;f(臭的)=没有煎蛋卷,和5个好鸡蛋毁坏。以次类推。

2 主观期望效用最大化决策

萨维奇认为,虽然菲尼蒂私人概率的提出在拉姆齐之后,但是他是独立的,并且非常详细地发展了这一概念。他们对概率的观点相同之处在于,都认为私人概率可以解释客观概率所解释的问题。但是,与菲尼蒂拒斥客观概率的态度不同,萨维奇和拉姆齐一样,并不否定客观概率,他只是主张没有必要用客观概率去解释外面的世界,所有这些事情,私人概率都可以做的很好。他自己“已经对提出一个特别的私人概率的概念很满意。因此,在这一点上,在客观概率和私人概率两者之间的某种相互连接中,寻找一个对这两者都承认的二元的理论应该是很诱人的。虽然菲尼蒂对此已经表明(似乎萨维奇认为菲尼蒂的私人概率是一种客观的私人概率,寻求的是两者之间的某种联系),但是,这样做是没有必要的,因为有着未知概率p的硬币的想法能够单独用私人概率重新解释。”[5]不过,萨维奇对彻底的贝叶斯主义者菲尼蒂是理解和欣赏的,他认为,在怀疑菲尼蒂理论,甚至把它作为荒谬的东西之前,至少应该好好研究菲尼蒂那些激动人心的著作。

萨维奇在借助弱序概念和一些前提条件之后,严格论证出行为人用私人概率和效用进行决策的主观期望效用决策理论:存在唯一的私人概率测度,并且存在有界的和唯一正线形变换的实值效用函数。这一理论是从个体对行动的偏好关系中推导出来的,个体就是行动决策人,决策人的决策是根据价值大小进行评价和选择,价值体现了决策人需要的某种满足。这里的决策人也就是偏好主体,而使决策人在需要上得到某种满足的对象为偏好对象。简单地说,偏好关系是一种关于偏好对象的二元关系。例如,对象x优于对象y,并且偏好关系x优于y,也就蕴涵了最终在价值判断上决策人是认为x优于y。而对于一个理性决策人而言,“理性的偏好关系体现在关于偏好关系≥(弱优于)的两个基本假设,即完备性和传递性之中。具体地说,我们假定决策者是理性的,即他的偏好关系≥满足:(1)完备性。任何两个备选对象a、b∈S,它们的关系是,或者a≥b,或者b≥a。两者必居其一。(2)传递性。对于任意的三个对象:a,b,c∈S,如果a≥b,b≥c,那么a≥c。”[6]萨维奇的决策理论就是建立在具有这样的完备性和传递性的弱序(≥或者≤)之上。

萨维奇给出的7个原则性前提条件中,[4]对状态到结果的集合上的全部行动而言,其中的第7个假设条件只是用来保证对全部行动的效用计算,并且保证在结果集合上的效用函数u是有界的,正因为u是有界的,所以全部行动也是有界的。其余的P1-P6对于求得在状态空间存在唯一的概率测度,在结果空间存在唯一适合于一个正线形变换的实值效用函数u是足够的,它们分别为:

P1.行动之间的联系≤是弱序。

D1.给定B(为一事件),f≤g⇔ f'≤g',对每个 f'和g'与 f和g一致,在B上分别地一致,在¬B上互相一致。

P2.对每一个f,g,和B,给定B时f≤g,或者给定B时g≤f。

D2.g≤g'⇔f≤ f',当 f(s)=g,f'(s)=g',s∈S。

D3.B≡Φ⇔f≤g,对每个f,g,给定B。

P3.如果f(s)=g,f'(s)=g',s∈S,并且B≠Φ;那么给定B,f≤ f'⇔g≤g'。

D4.A≤B⇔fA≤fB或者g≤g',对每个 fA,fB,g,g'使得:fA(s)=g,s∈A;fA(s)=g',s∈¬A;fB(s)=g,s∈B;fB(s)=g',s∈¬B。

P4.对所有的A,B,A≤B或者B≤A。

P5.对每个 f,f',f≤f'为假。

P6.假定g≤h为假,那么对每个f,S有一个有限的划分,使得假如g'与g一致除了此划分中的任一元素,g'和h'等于 f为假,则g'≤h或者g≤h'将为假。

萨维奇用≤·(…比…的可能性差一点)来表示所有事件B,C,D…之间的联系是一个定性概率关系,当且仅当,它满足下面三个性质:[5]

(1)≤·是弱序;2.B≤·C,当且仅当,B∪D≤·C∪D,假如B∩D=C∩D=0;3.0≤·B,0≤·S。

在这些原则性前提条件下,萨维奇证明了他的两个著名的结论:第一,在状态集合的全部子集的集合上有唯一的一个概率测度,即一个个体对每一个事件可以赋予一个概率数值。他说:“如果S有一个概率测度P并且有一个定性概率关系≤·,那么对每一个B,C,P(B)≤P(C)⇔B≤·C。”[5]萨维奇应该是缘于此给出了概率的私人解释,因为对个体的偏好而言,在证明上述一系列前提条件合理后,通过它们确实推导出一个概率测度,并且,正如萨维奇所认为的那样,这种推导并没有依赖任何客观的因素,而是完全从个体的偏好关系用数学方法严格推导出来的,因此,私人概率的解释是合理的。

第二,存在有界的和唯一适合于一个正线性变换的实值效用函数,使得对所有的行动(f,g)而言,f≤g⇔U(f)≤U(g)。这个公式和冯·诺意曼和摩根斯顿的期望效用理论,都反映了理性人在决策时考虑的效用等于各个结果效用的期望值。不同点在于,冯·诺意曼和摩根斯顿用客观概率对效用加权,而在萨维奇的公式中,客观概率被私人概率取代。对一个二元博弈而言,萨维奇的效用值为U(x,A;y)=S(A)U(x)+(1-S(A))U(y),S(A)为个体对事件A的私人概率。因此,上式中的U应该为行动的主观期望效用,其效用值为U=(Xi)S(Ai),A={A1,A2,…,An},对应事件A有n个可能结果,即X={X1,X2,…,Xn}。这就是说,决策结果可以用私人概率和代表偏好关系的效用函数来理解,即理性人决策的依据是期望效用最大化。

3 确定事件原则及其悖论的实质

萨维奇拓展了拉姆齐和菲尼蒂的主观概率理论,建立了规范人们行动的主观期望效用理论。该理论认为个体的概率分布可以由行动的偏好导出,理性人的行动选择应该遵循主观期望效用最大化,但是,该理论也遭受了不少批评和挑战,最著名的例子是阿莱斯悖论[7]和埃尔斯伯格悖论[8]。这两个悖论指出,在现实生活中,人们实际行动的选择并不总是和该理论的结果相一致,人们并不总是按照主观期望效用最大化进行决策。究其实质,这两个悖论针对的主要是确定事件原则或“确凿性原则”。

确定事件原则是萨维奇通过一个事例引入的,他说:“一个商人打算购买某个物品。他认为下一届总统选举的结果与对这个购买的吸引是相关的。因此为了对自己澄清这个事情,他问自己,如果知道共和党候选人将获胜,他是否购买,他决定自己将购买。相同地,他认为如果他了解到民主党候选人将获胜,他又发现自己将购买。由于看到在每一个事件里自己都将购买,他决定自己应该购买这个物品,即使他不知道哪个事件成功,或者将成功,正如我们通常说的。一个决策能够在一个被这个商人使用的原则的基础上做出是很少的,但是,可能除了这个简单的次序假定之外,我了解到没有其他特别的调整决策的逻辑原则能够得到这样情愿的赞同。”[5]由此,萨维奇给出了确定事件原则相对形式化的陈述:如果一个人在得知事件B出现,或者在得知事件B不出现时,他都将不是喜欢f胜过g,那么他是不喜欢f胜过g。而且(倘若他不把B看作实质上的不可能),如果他在得知B出现时,他很明确,自己喜欢g胜过f,并且,如果他在得知B不出现时,他并不喜欢f胜过g,那么他就是明确地喜欢g胜过f。[5]实际上,这就是指一个理性人对两个行动之间偏好的次序关系。

萨维奇对该原则形式化的详细说明主要是通过P2和P3进行的。P3是用来指出B在非零状态下的偏好关系,这就在关于结果的优先和关于决策者视为可能事件条件的优先之间产生一个合理的对应。单独P2的意思是指,对没有进行条件偏好定义的、给定B时的偏好关系是不存在的,即给定B时,f≤g,或者给定B时,g≤f。D1则正是针对P2下的关于条件偏好的一个定义,把它们结合起来,则为:如果f,g和f',g'满足下面三个条件:①在¬B上,f和g一致,并且,f'和g'一致;②在B上,f和 f'一致,并且,g和g'一致;③ f≤g;那么 f'≤g'。

这就指出了存在一种行动之间的偏好关系,直觉上的理解为:在给定B时,f和g之间的条件偏好关系仅仅依赖于在B上f和g的特性,而不依赖f和g在状态B之外所假定的值;只要两个行动f和g在B之外被更改成相互之间一致,那么在更改的行动之间的偏好次序的获得将不依赖于被容许修改的哪个行动实际上的实现。简而言之,在假定f和g在除B之外是相互一致的,没有一般性的损失,因此,我们能够在B之外对它们进行修改,使得他们一致而不影响条件偏好。

在同等意义上,如果f和g是两个行动,在B之外它们可以被任何方法更改,只要修改了的行动f'和g'在B之外继续相互一致,那么在B之外所发生的变化将不影响给定B时f和g之间的条件偏好。可以通俗地理解为:只要取得状态不依赖于实际上履行的行动,行动中间的优先就不应当取决于那些对两个行动有完全等同结果的状态。这在萨维奇看来肯定是合理的,并且由很多人也都证实这是合乎情理的。[4][5]但是,恰恰是这个看上去合理的条件偏好被显示出和人们实际中的行动选择相违背。

针对这一原则,萨维奇用了一个直观的图表进行了进一步的阐明,图表如下:[5]

在图表中,所有的状态s的集合S和所有的结果f的集合F分别用水平和垂直的距离表示,一个行动f(对每一个s∈S,存在一个函数f(s)∈F)用一个曲线表示。这很形象地说明了用来保证条件偏好的确定事件原则,即:在¬B上,两个行动f和g相互一致,并且,f'和g'也相互一致。在B上,行动f和f'相互一致,并且,行动g和g'也相互一致。如果这个条件满足,那么 f≤g⇔f'≤g'。

虽然萨维奇对作为理论出发点的偏好关系竟然违背理论自身的原则感到震惊,但是,他似乎并没有正面回答悖论对其理性原则的置疑,没有澄清悖论所针对的确定事件原则本身的合理性问题,也没有放弃自己的理性决策观。只是在回答阿莱斯提出的问题时,他提到人们可能有两种偏好,一种是个体临时的、最初的偏好,当被发现与理性原则不一致后会进行修正,另一种是与主观期望效用理论中的理性原则相一致的个体真正的偏好。不过,修正仍然是在事先假定确定事件原则正确性的前提下进行,这样,再次选择是为了使个体的偏好关系满足确定事件原则,而得出个体对自己的偏好确实“有一个一般性的或者客观性的主张”的相应结论。

从逻辑学视野来看,严格意义上的逻辑悖论应该同时具有三个要素:即公认正确的背景知识;严密无误的逻辑推导;可以建立矛盾等价式。如果不能同时满足这三个要素,那么不能称之为逻辑悖论。有些“悖论”虽然具有悖论的结构特征,但是不满足“公认正确的背景知识”这一要素,称之为悖论的拟化形式。[9]公认正确的背景知识是一个涉及到认知主体的概念,“‘公认,总是为某一领域的认知共同体所公认,因而任一悖论都相对于一定领域的认知共同体而言。……其中的‘背景知识,既可以是人们公认的明晰知识,也可以是认知共同体不自觉地使用的预设。尽管这个一般概念是模糊的,但落实到每个具体悖论的构造,其由以导出的背景知识,是能够以特定认知领域相适应的严格性,明确而非含混地予以揭示的。”[9]

主观期望效用理论的两个悖论所依据的同一背景知识实质上相同,悖论实例的本意就是要反对该理论用所谓的理性人作为决策理论的基本假定。不过,完全理性人的假定并不是经济学家这个共同体所公认正确的背景知识。西蒙(H.A.Simon)曾明确提出有限理性理论,认为现实生活中的决策者介于完全理性与非理性之间。之后,卡尼曼(D.Kahneman)和特韦尔斯凯(A.Tversky)更是提出在不确定情形下人们的行动选择要受到心理因素的影响,实际决策中的决策权重不是概率,也不服从概率公理。同样持有主观概率思想的奥地利经济学派的沙克尔(G.Shackle)则开辟了一条由非帕斯卡概率理论来研究个体选择的方向。这就是说,逻辑全知和概率全知并不是公认的知识,这里的“公认”至多是针对帕斯卡概率论者。

因此,之所以通过严密无误的逻辑推导,建立了矛盾等价式,是由于理性人的假定,理性人的信念满足概率公理。但是,这个背景知识的正确只是针对经济学领域特定的共同体而言,对其他人而言(例如,对非帕斯卡概率论者来说,帕斯卡概率公理并不成立),这个假设不一定被认为正确。鉴于这个公认正确的背景知识有一定的模糊性导致了这两个悖论本质上的相对性,它们只能被称为悖论的拟化形式,不属于严格意义上的逻辑悖论,至多只能将它们归入广义逻辑悖论的范畴。它们也不应该是经济学的悖论,只能是针对有着理性人假定的主观期望效用理论的悖论,由此,促进了不确定性经济学朝着一般期望效用理论发展。

4 结语

虽然阿莱斯悖论和埃尔斯伯格悖论不是严格意义上的逻辑悖论,但是,它们表明了,在不确定情形下,行动决策存在非理性。这使得经济学家开始对完全理性人假定进行重新审视,决策研究开始重视非理性因素的作用。因此,在萨维奇的主观期望效用决策理论遭遇悖论挑战后,出于辩护和摒弃,主观决策理论开始朝两个方向发展。一是继续坚持理性决策宗旨,或对现有的期望效用值理论进行改进,或研究更具一般性的理性决策模型;一是质疑期望效用理论本身,开始研究行为人行动时的心理因素。毫无疑问,这对促进决策理论的发展起到了杠杆的作用。

[1]江天骥主编.科学哲学名著选读[M].武汉:湖北人民出版社,1988.

[2]H.E.Kyburg,H.E.Smokler.Studies in Subjective Probability[M].Florida:Robert E.krieger Publishing Company,Inc,1980.

[3]Howson,Colon.Logic and Probability[J].The British Journal for the Philosophy of Science,1997,48(4).

[4]潘介人.决策分析中的效用理论[M].上海:上海交通大学出版社,2000.

[5]Leonard J. Savage. The Foundations of Statistics[M]. New York:John Wiley and Sons,1954.

[6]潘天群.社会决策的逻辑结构研究[M].北京:中国社会科学出版社,2003.

[7]Allais,Maurice.Le Comportement de I,Homme Rationnel devant le Risque:Critique des Postulates et Axiomes de I,Ecole Americane[J].Econometrica,1953,21(4).

[8]Ellsberg,Daniel.Risk,Ambiguity,and the Savage Axioms[J].The Quarterly Journal of Economics,1961,75(4).

[9]张建军.逻辑悖论研究引论[M].江苏:南京大学出版社,2002.

猜你喜欢
悖论效用理性
视神经炎的悖论
海岛悖论
呼和浩特市中心城区低效用地潜力分析
小学美术课堂板书的四种效用
“帽子悖论”
人人都能成为死理性派
纳米硫酸钡及其对聚合物的改性效用
改革牛和创新牛都必须在理性中前行
美妆悖论
理性的回归