对情境的形式化表述:古巴导弹危机中的威慑

政治情境能够向行为者呈现在各种条件下的许多决策。在我们能够以形式化的方式分析这些情境之前,我们需要具体描述这些参与者有些什么选择。让我们考察一下古巴导弹危机。几乎每个关于这次危机的分析都关注艾利森(Allison 1971,39)所明确的三个中心决策:“为什么苏联企图把进攻型导弹安置在古巴?为什么美国选择通过封锁古巴来回应苏联的导弹部署?苏联为什么决定撤出导弹?”

然而,这些问题只是解释任何一起国际危机都会提出的三个一般问题的具体形式。我们把这起危机看作两个行为者(挑战者和防御者)之间的一次较量。为什么挑战者试图改变现状?为什么另一方以威胁来回应挑战者?最后,为什么一方或另一方退却而没有发生战争,或者如果危机以战争收场的话,为什么双方选择战争而不是退让呢?挑战现状和抵抗挑战者,这些选择对于一场危机来说是必要的。如果挑战者不试图改变现状或者如果这种尝试不被抵抗的话,就没有危机。艾利森的三个问题只是这三个一般问题在古巴导弹危机中的具体例子。

模型应当努力体现情境的一般特征,这和一个特定事件的具体决策不同。在事实发生后,我们总可以构建一个模型来反映所发生的事情。在考察反复发生的政治情境的一般特征方面,博弈论模型则更为清楚明了。例如,我们研究威慑模型而不是古巴导弹危机的模型。古巴导弹危机不会再发生,但不幸的是,军事威胁和威慑也许会永远伴随着我们。

危机的开始是苏联决定把进攻型导弹部署在古巴。该决定是何时作出的,这一点至今尚未清楚,但它肯定是发生在肯尼迪决定封锁古巴之前。它发生在美国的决策之前,并且在美国作出回应的决策时,苏联的决定对于美国而言是已知的。我们可以有多种方式来模型化这个最初决定。最简单的方式就是一个简单二元选择——挑战现状或不挑战现状。我们设计几种类型的挑战。在古巴导弹危机中,这些其他的挑战可以包括在古巴部署苏联地面部队或者针对西柏林的直接行动。但是这些选项是为古巴导弹危机所特有的。如果我们要在一般意义上构建一个关于国际危机的模型,我们可以把这些选项简单概括为挑衅性挑战(provocative challenge)和非挑衅性挑战(nonprovocative challenge)。在目前,我们让我们的模型保持简单,只考察两个选项——挑战现状或不挑战现状。图3.1将这一选择表示为一个方格,称为节点(node),用CH来表示挑战者,并且还用两个分枝(branches)来表示从该方格所发出的两个选择。不挑战(No Challenge)的行动会使模型以没有危机的结果结束,该结果标记为SQ,表示现状。挑战(Challenge)的选项会带出防御者的决策,标记为D。该图给出了挑战者开始行动的模型。

图3.1 威慑博弈中挑战者的第一个决策

危机的第二个决策是由防御者作出的。它可以抵抗挑战者,也可以作出让步以满足挑战者的要求。抵抗可以采取多种形式中的一种。例如,在古巴导弹危机中,美国可以以几种方式来抵抗苏联的挑战。它可以对导弹部署地点发动空袭、用地面部队入侵古巴或通过联合国施加外交压力。在讨论美国的选项的行政委员会中(ExCom,Executive Commit-tee),这些选项的每一个都有其支持者。如果防御者决定不抵抗,让步也可以采取多种可能的形式。可以是满足挑战者的全部要求,或者也可以在一些最初的让步之后开启谈判。但是,为了简明起见,我只让防御者有两个选项,要么通过发出威胁而抵抗挑战,要么不抵抗挑战并给予挑战者足够多的让步以满足其要求。在后一种情况下,危机会以我称之为C[表示让步(concession)]的结果结束。防御者只是在了解挑战者在其初始行动中做了什么之后才采取新的行动。把这一新的行动加上,我们就可以用图3.2来表示前面两个决策。

图3.2 威慑博弈中挑战者的第一个决策和防御者的决策

美国封锁古巴的决定相当于在第二章关于威慑的计算中防御者的决定。在那里,挑战者的回应被当作一个抽奖,其中,概率q表示防御者关于挑战者会继续推进威胁的信心。然而,挑战者是在其自己的决策中决定是否继续推进威胁。防御者关于挑战者愿意继续推进威胁的信心应当反映出防御者对于挑战者继续推进威胁的动机的认识。如果这是事实的话,我们应当让模型中包含挑战者的最终决策。

我们的模型的最后一个选择是由挑战者来作的,它必须决定如果防御者抵抗的话它是否会继续推进威胁。我们把这一选择简化为在继续推进威胁和退却这两者之间的选择。前者会导致战争;后者则使危机结束,并且除了对双方参与者的声誉有影响以外对现状没有改变。要再次指出的是,现实世界中这样的选择要比模型里的选择更复杂。挑战者可以降低它的要求或者发出新的威胁,或许把第三方卷入危机中来。和走第二步的防御者一样,如果挑战者必须走出这最后一步的话,在它必须选择时它知道博弈中前面已经作出的决定。我把最后的结果标记为代表战争的W和代表挑战者的退却的BD。

图3.3给出了这个简单的威慑模型的完整的决策序列。它有四个可能的结果:现状(SQ)、防御者对挑战者的让步(C)、挑战者的退却(BD)、战争(W)。作为下一步,我们需要有行为者对这些结果的偏好。在这个例子中,我们可以就每个行为者偏好哪个结果作一些假定。所有的挑战者都应该偏好让步胜过现状,并且偏好现状胜过退却。同意挑战者的要求会使现状以挑战者所偏好的方式改变——否则,它就不会提出这些要求。有关威慑的研究文献一般把从威胁退却看作比在一开始就不作威胁成本更高——挑战者也许在面对防御者的反威胁(counterthreat)时不得不作出让步;不仅如此,它的威胁的可信性在将来会降低(至少很多学者这样认为)。然而,我们却无法说出挑战者在其偏好排序中把战争排在第几位。它也许偏好战争胜过让步——也就是说,挑战者的要求也许只是发动一场战争的借口罢了——或者它也许偏好退却胜过战争,在这种情况下,它的要求本身是一个真正的恫吓。

图3.3 威慑博弈中的全部三个选择

同样,我们也能够就防御者的偏好作一些假定。它偏好退却的结果胜过现状,并且偏好现状胜过作出让步。如果挑战者退却的话,那么它未来不可能再提出要求,或者是因为这样的威胁的可信性已经降低,或者是因为防御者会要求挑战者作出让步从而保证未来不会发出威胁。再次需要指出,我们不一定能够说出战争在防御者的偏好排序中落在什么位置。防御者可能偏好战争胜过任何其他结果,又或者可能偏好作出让步胜过战争。

最后,我们不仅需要对于各种结果的偏好序,我们还需要两位参与者对每种结果的效用。我们把参与者对特定结果的效用称为它们的收益(payoffs)。收益可以是期望效用。例如,战争结果实际上是从一次战争的所有可能结果中所作的一次抽奖。没有任何一位参与者事先知道如果战争爆发的话哪一方会赢。因此每位参与者对于战争结果的收益是对于该抽奖的期望效用。我们可以把这个抽奖放进博弈之中作为机会(Chance)或自然(Nature)的一个移动。由机会或自然的节点发出的一个移动由选择每个行动的固定且已知的概率所限定。如果参与者选择战争结果,那么它们就进行战争的抽奖。相反,我们一般并不把这一抽奖包含到博弈里,因为在此之后没有其他的步骤。我们只是规定每一方对于战争抽奖的期望效用是其对于战争结果的收益。

因为参与者可能在其选择中面临风险,为了判断它们会接受什么样的风险,我们需要知道它们从结果中得到的效用。在博弈中,风险来自另一位参与者的未来行动。如果挑战者威胁到现状,那么防御者会屈服还是抵抗?任何一个挑战者,如果它知道防御者总是满足它的要求,那么它会乐于挑战。根据假定,所有的挑战者都偏好让步的结果胜过现状的结果。同样,防御者大体上不知道如果防御者抵抗挑战者的初次威胁的话挑战者是否会诉诸战争。我们如何在一个博弈中表示这些不确定性呢?在关于威慑的计算中,抽奖中的概率表示这些不确定性。典型的做法是,我们假定所有参与者都知道别的参与者的收益,所有参与者都知道别人都知道这个信息,如此类推。共同知识(common knowledge)就是任何这样的信息,所有参与者都知道该信息,并且所有参与者都知道所有参与者都知道该信息,如此类推。[2]

有一个表示关于收益的不确定性的很好的方法。如果有两种类型的防御者,一种类型偏好战争胜过作出让步(坚决型),另一种类型偏好作出让步胜过战争(不坚决型),那会怎么样呢?如果挑战者不知道它正在面对的是什么类型的防御者,它就不得不判断为了获得挑战不坚决型防御者的收益而冒着遭遇坚决型防御者的风险是否值得。我们可以把挑战者的不确定性用形式化方式表示为:博弈的开始是机会的移动,它决定防御者是否坚决。防御者被告知这一机会移动的结果,但是挑战者却未被告知。正如图3.4所示,机会的开局移动(标记为C)产生一个有两个主要分枝的博弈树,位于上面的分枝表示坚决的防御者,而位于下面的分枝表示不坚决的防御者。图3.4的位于下面的分枝的收益用星号标出来,以提醒我们它们牵涉到不坚决的防御者,因而我们不能假定防御者的收益和位于上面分枝的类似结果是相同的。

图3.4 具有两种类型的威慑博弈

那么,我们怎样才能表示出挑战者的不确定性呢?如图3.5所示,我们把这两个分枝中挑战者相对应的节点连接起来。我们用虚线把挑战者的两个初始节点以及它的两个终端节点连接起来,以表示当挑战者必须作出选择时它无法说出它正位于两个节点中的哪一个。我们把这些选择节点的集合称为信息集(information sets),因为它们具体描述行动中的参与者在必须作出选择时他或她对以前的行动有些什么信息。在这里,挑战者并不知道能决定防御者收益的机会移动的结果。我们不把防御者的两个节点连接成一个信息集,这是因为防御者是知道机会移动的结果的,也就是说,它知道它自己的收益。

图3.5 对两种类型的防御者有不确定性的威慑博弈

在危机中实际发生的很多东西都被排除在图3.5的模型之外。威胁与提议的复杂互动被省略了。相反,我聚焦于危机的纯粹本质要素:挑战、回应、最终决定。对于在实际危机中有许多选项的地方,我把决策简化为二元选择。我构建了挑战者在战争和退却之间的一个最终选择,这样的选择在实际危机中也许不存在。但这些简化明确了建模的中心点——每个主张都是实际事件的简化。形式化模型强迫我们选择我们的假定,并且使我们意识到存在其他合理的替代性模型。建模中最重要的一个决定就是博弈的设计。该博弈陈述我们相信行为者会在某情境中面对什么样的选择,它们相信其决策会带来什么后果,它们如何评价这些后果等。在建立模型时,我们需要仔细思考什么假定能概括一个情境的特征。不存在放诸四海而皆准的正确的模型,相反,总是存在许多可能的模型。形式化理论使我们意识到可能建立的模型的多样性,使我们能够抓住它们之间的差异,并且让我们看到这些差异是否对这些模型所预测的行为有重要影响。

例如,上面的威慑模型包含着许多学者有异议的几个假定。在战争和退却之间的最后选择是人为设置的。把选择限定为二元这一做法不切实际地限制了行为者的选择范围。挑战者对于防御者的决心是不确定的,而防御者却知道挑战者愿意走向战争。有些人会认为把行为者概括为“挑战者”和“防御者”本身就是不准确的和强加道德判断的。但是这些异议是社会科学理论方面的问题,不是博弈论的问题。博弈论能帮助我们理解区分这些关于危机的不同观点的是什么样的事实论据。在把这些不同观点形式化表述以后,我们就能够求解模型并看到这些相互竞争的观点是否导致对行为的不同预测。依此形式,我们也许能够化解有关社会科学理论的歧见,这些歧见也许不是通过对相互竞争的观点的文字叙述就能轻易解决的。

由于我们在建模时必须作出简化的假定,因此真理很少存在于单一模型中。我们需要一系列相互联系的模型来理解各种政治情境。我们必须从一个简单模型开始,然后增加复杂性。在上面的威慑模型中,我们可以加上防御者对于挑战者走向战争的决心的不确定性,给双方增加更多的选项,或者允许双方有更长的互相交换威胁的过程。任何这样的添加都会使模型“更加贴近现实”。但是,对单个模型的检验在于它是否增加我们的理解,而不是它是否接近某个关于“现实”的抽象理想。国际危机中的威慑是一个非常复杂的问题,任何特定的威慑模型都无法使我们“感受”威慑,也无法完全确切地描述一个威慑案例。相反,模型帮助我们理解该复杂性某个方面背后的策略动机。正如伟大的建筑是一块砖一块砖地建起来的,一个又一个的模型也是这样慢慢地促进我们对政治的日益增长的理解的。