在风险的条件下的效用理论

到目前为止我还没有解释效用函数的逻辑基础。给定一个对于结果的效用函数和从行动到结果的概率分布,我们就能够确定所偏好的行动。效用函数从何而来呢?效用函数体现了行为者为了获得较为偏好的结果而愿意接受得到较为不偏好的结果的风险。仅有对于结果的序数偏好还不足以创造一个冯·诺伊曼摩根斯顿效用函数。我们需要有对全部可能选择的偏好,并且这些可能选择是具有风险性的。抽象地说,我们把对于结果的带风险的选择表示为抽奖(lotteries)。在抽奖中,我们从一个固定的后果集合中选中一个后果,而在该后果集合中,每个结果被选中的概率是已知的。如果一个人能够把所有可能的关于后果的抽奖进行排序,并且对于这些抽奖的偏好遵守一定的规律性条件,那么我们就能够用一个效用函数来反映这些偏好。

定义:一个抽奖(或打赌)就是一个满足的概率集合(p1,p2,……,pn)和一个奖励的集合(Q1,Q2,……,Qn)(这些奖励可能要么是后果,要么是别的抽奖)的配对。在这里pi给出获得奖励Qi的概率。一个只以后果作为奖励的抽奖是简单抽奖(simple lotter-y),一个以别的抽奖作为奖励的抽奖是复合抽奖(compound lotter-y)。一个抽奖被记作(p1Q1,p2Q2,……,pnQn)。

行动被以抽奖的形式表现出来,每个中奖的后果的概率表示给定该行动的话那种后果发生的概率。复合抽奖提供了一个途径来考虑那种一些风险带来进一步风险的决策问题。如果我们有行为者对于所有关于后果的抽奖的偏好,那么我们就能够把这些偏好概括为一个效用函数。期望效用定理给出一致性条件。个体对各种抽奖的偏好必须满足这些条件,以便我们能用一个效用函数来表示这些偏好。

定理(期望效用定理):如果

(1)对于后果的偏好排序是传递性的和完全的(为方便起见,后果的下标显示偏好排序:C1PC2PC3……PCn);

(2)复合抽奖能被简化为简单抽奖(假定每个抽奖都是独立的);

(3)对于每个后果Ci,存在一个只牵涉C1和Cn(最受偏好的后果和最不受偏好的后果)的抽奖,满足Ci对行为者而言是无差异的;

(4)在任何抽奖中,都能被用来代替Ci

(5)对于各个抽奖的偏好是完全的和传递性的;

(6)(确定事件原则[the Sure Thing Principle])当且仅当p>p′时,人们对[pC1,(1-p)Cn]的偏好胜过[p′C1,(1-p′)Cn]。

那么,存在与后果集合(C1,C2,……,Cn)相联系的数字集合(u1,u2,……,un),该集合满足:对于任何两个抽奖L和L′,期望价值(p1u1+p2u2+……+pnun)和(p′1u1+p′2u2+……+p′nun)的大小反映行为者对于这两个抽奖的偏好。

如果以上六个条件得以满足,并且我们有行为者对于各种抽奖的偏好,我们就能计算出一个效用函数,使得期望效用的大小给出行为者对于各种抽奖的偏好。

然而,这六个条件要求我们接受什么呢?第一个条件说,行为者对于各种后果有偏好序。我在前面讨论了这一假定。第二个条件允许我们运用关于概率的法则来把复合抽奖简化为简单抽奖,即那些结果就是奖励的抽奖。有些行动会带来多重风险,可以被当作复合抽奖来看待。把复合抽奖简化为简单抽奖能使我们得到对于这些复合抽奖的偏好,因为其他条件提供了对于简单抽奖的偏好。对于复合抽奖的简化是根据有关概率的法则而进行的,并且它的假定是:每个抽奖的概率都是独立的。例如,令L1=(0.4C1,0.6C2)且L2=(0.5C1,0.5C3)。那么,L3=(0.6L1,0.4L2)就等价于L′3=[0.6(0.4C1,0.6C2),0.4(0.5C1,0.5C3)]=[(0.24+0.2)C1,0.36C2,0.2C3]=(0.44C1,0.36C2,0.2C3)。

练习2.3:把复合抽奖(0.3L1,0.4L2,0.3L3)简化为一个从C1、C2、C3等三个结果中所作的简单抽奖,这三个抽奖中的每一个都在前面例子中作了定义。

第三个条件允许我们创造出一个从最好和最坏的结果中所作的抽奖,并且决策者在该抽奖和一定的后果之间确实是无差异的。第四个条件说明,等价的抽奖可以被用来替代该后果。这两个假定合在一起就允许我们把任何抽奖(不管是复合的还是简单的)简化为一个从最好和最坏的结果中所作的简单抽奖。首先,把任何复合抽奖简化为一个对所有结果所作的简单抽奖。其次,用等价抽奖替代该简单抽奖中最好结果和最坏结果之外的每一个结果。最后,把新的复合抽奖简化为一个从最好和最坏的结果中所作的简单抽奖。

但是,第三个条件还包含两个非常重要的假定:最好的结果并非如此令人向往以至于决策者会毫无疑问地拒绝任何其他结果而接受任何抽到最好结果的概率非零的抽奖,最坏的结果也并非如此不令人向往以至于决策者会毫无疑问地拒绝任何抽到最坏结果的概率非零的抽奖而接受任何其他结果。换种说法,第三个条件排除具有无穷效用的结果。无穷效用会产生非常怪诞的行为。6例如,有人主张核战争具有负无穷效用。如果我们接受这一观点,那么我们必定会偏好任何没有核战争的结果——在这里想象一下你自己做过的没有核武器的噩梦——胜过任何抽到核战争的概率非零的抽奖。在这里人们偏好没有核武器的噩梦胜过这样一个抽奖:地球上的每个人同时翻转一枚硬币,如果所有五十多亿枚硬币都是正面向上,一场核战争就会发生,而如果哪怕一枚硬币是背面向上,世界和平(或者你自己所理解的幸福)就得以实现。7很难相信你肯定会选择没有核武器的噩梦而不是这个抽奖。在这里,我的意思不是说无穷效用不“存在”,而是说无穷效用会带来一些对于选择而言非常怪诞的后果。

在第五个条件里,我们假定对于各个抽奖的偏好具有传递性。第六个条件是确定事件原则。如果我们比较两个从最好和最坏的结果中所作的简单抽奖,那么抽到最好结果的概率较大(因而也是抽到最坏结果的概率较小)的抽奖应该更受偏好。这是一个“确定的事件”。确定事件原则允许我们比较任何抽奖。通过对每个结果都运用等价抽奖,我们可以把任何抽奖简化为一个从最好和最坏的结果中所作的简单抽奖。根据确定事件原则,抽到最偏好的结果的概率较大的抽奖更受偏好。

这六个条件合在一起让我们能够对效用作以下估计。首先,通过运用第三个条件,我们为每种后果找到一个等价的抽奖。通过运用第二个和第四个条件,我们能够用等价的抽奖来替代任何抽奖的后果,并且把复合抽奖简化为一个在最好结果C1和最坏结果Cn中所作的简单抽奖。然后,根据确定事件原则,在这些简化的抽奖中获得最好结果的概率能给出所有抽奖的排序。把最好的后果的效用定为1,即u(C1)=1,并把最坏的后果的效用定为0,即u(Cn)=0。由第三个条件我们得到每个后果的效用就是在等价抽奖中获得C1的概率。

期望效用定理为我们提供了一条途径,让我们能在一个基数度量上表示出决策者的偏好。结果之间的效用差异让我们能够判断决策者会接受多大的风险。由于效用是从决策者承担风险的意愿程度计算而得,这些效用根据获得不同结果的概率而测量出各种结果之间的相对偏好。这样的效用函数被称为冯·诺伊曼摩根斯顿效用函数,以纪念最早证明期望效用定理的两个人。

练习2.4:

(1)计算与下列偏好相一致的冯·诺伊曼摩根斯顿效用函数:C1PC2PC3PC4,并且对于C2和C3存在等价抽奖=(0.65C1,0.35C4)和=(0.4C1,0.6C4)。

(2)运用这一效用函数,确定下列两个抽奖中的哪一个更受偏好:是L1=(0.3C1,0.2C2,0.2C3,0.3C4)还是L2=(0.03C1,0.4C2,0.5C3,0.07C4)。

效用函数反映个体对于从可能后果中抽奖的偏好。如果我们有一个表示某决策者偏好的效用函数和对于每个行动来说每种可能后果的概率,那么我们就能预测该个体的决策。我们为每个行动计算期望效用,而能带来最大的期望效用的行动就是选择。