3.3 条件概率和全概率公式

3.3.1 条件概率

对概率的讨论总是在一组固定的条件限制下进行的。以前的讨论总是假定除此之外再无其他信息可供使用,可是,有时却会遇到这样的情况,即已知某一事件B已经发生,要求另一事件A发生的概率。例如,考虑有两个孩子的家庭,假定男女出生率一样,则两个孩子(依大小排列)的性别为(男,男)、(男,女)、(女,男)、(女,女)的可能性是一样的。若以A记随机选取的这样一个家庭中有一男孩、一女孩这一事件,则显然,但是,如果预先知道这个家庭至少有一个女孩,那么,上述事件的概率便应是

两种情况下计算出的概率不同。这也很容易理解,因为在第2种情况下多知道了一个条件:事件B(这一家庭至少有一女孩)发生,因此算得的概率事实上是“在已知事件B发生的条件下,事件A发生的概率”,这个概率将记为PA|B)。

这种带有条件的概率很重要,下面就来研究它。在给出严格定义之前,首先考察一些特殊的场合。

就从上述例子出发。这是一个古典概型问题,样本点总数n=4,有利于事件A的场合数mA=2,因此;但是假如已知事件B发生,即至少有一女孩,那么可能性大的样本点是(男,女)、(女,男)、(女,女),总数为mB=3,而有利场合(至少有一女孩,而且有一男孩、一女孩)数mAB=2,因此,

这一公式很重要,虽然以特例形式引入,但读者不难证明,它对一般古典概型问题也成立。

在几何概率中,若以m(A),m(B),m(AB),m(Ω)分别记事件ABAB,Ω所对应点集的测度,且mB)>0,则

结果与古典概型相同。

对频率也有类似结果,请读者自行验证。

在一般场合,将把这个算式作为条件概率的定义。

定义3.2 设(Ω,FP)是一个概率空间,B∈F,而且PB)>0,则对任意A∈F,记

并称P(A|B)为在事件B发生的条件下事件A发生的条件概率(conditional probability)。

若未经特别指出,今后出现条件概率P (A|B)时,都假定PB)>0。

不过,即使PB)=0,由于这时PAB)也未必为0,因此,式(3-3)为待定型,进一步的研究是可能的,但已超出本书的范围。

由式(3-3)立刻得到

P(AB)=P(B)P(A|B)

这个等式被称为概率的乘法公式或乘法定理。

若还有PA)>0,则也可以定义PB|A),这时有

P(AB)=P(A)P(B|A)=P(B)P(A|B)

例3.1 在肝癌普查过程中发现,某地区的自然人群中,每10万人内平均有40人患原发性肝癌,有34人甲胎球蛋白含量高,有32人既患原发性肝癌又出现甲胎球蛋白含量高现象。

从这个地区的居民中任抽一人,若其患有原发性肝癌则记为C,甲胎球蛋白高含量记为D,这时

P(C)=0.0004,P(D)=0.00034,P(CD)=0.00032

由条件概率定义可得

通过计算得知,患原发性肝癌的人有80%其甲胎球蛋白含量偏高,而甲胎球蛋白的测定非常有助于发现原发性肝癌患者:若出现高含量,则有高达94%以上的概率对患原发性肝癌做出正确诊断。

由于事件D的发生,使事件C发生的概率由0.0004一下子上升到0.9412。可见,事件发生的概率与条件有关,也即与信息有关。

下面讨论条件概率的性质。

首先,不难验证条件概率P(A|B)具有概率的3个基本性质:非负性、规范性、可列可加性。

(i)P(A|B)≥0;

(ii)P(Ω|B)=1;

(iii)

因此,类似于概率,对条件概率也可由3个基本性质导出其他一些性质,例如,

P(Ø|B)=0

P(A|B)=1-P(A|B)

P(A1A2|B)=P(A1B)+P(A2|B)-P(A1A2|B)

特别地,当B=Ω时,条件概率化为无条件概率,因此把一般的概率看作条件概率也未尝不可。

推广的乘法公式:可以把乘法公式推广到任意n个事件之交的场合:

P(A1A2An)=PA1PA2|A1PA3|A1A2)…PAn|A1A2An-1

这里,当然要求P(A1A2An)>0。

例3.2波利亚坛子模型)毯子中有b只黑球及r只红球,随机取出1只,把原球放回,并加进与抽出球同色的球c只,再摸第2次,这样下去共摸了n次,问前面的n1次出现黑球,后面的n2=nn1次出现红球的概率是多少?

:以A1表示第1次摸出黑球这一事件,…,An1表示第n1次摸出黑球,An1+1表示第n1+1次摸出红球,…,An表示第n次摸出红球,则

因此,

注意,这个答案只与黑球及红球出现次数有关,而与出现的顺序无关。

这个模型曾被波利亚(Polya)用来作为描述传染病的数序模型。这是很一般的摸球模型,特别地,当取c=0时,则是放回摸球;当取c=-1时,则是不放回摸球。

3.3.2 全概率公式

概率论的重要研究课题之一是希望从已知的简单事件的概率推算出未知的复杂事件的概率。为达到这个目的,经常把一个复杂事件分解为若干个不相容的简单事件之和,再通过分别计算这些简单事件的概率,最后利用概率的可加性得到最终结果。这里,全概率公式起着很重要的作用。

还是从最简单的情况开始。为了计算P(B),找一个有关的事件A,利用下列关系式:

便是常用的方法之一。

例如为计算从装有a只黑球和b只白球的袋子中不放回摸球,第2次摸得黑球的概率P(B),可以选A为第1次摸得黑球,则

这不就是摸球与顺序无关吗?是的,但上式的计算让这个结论有了新的理解:后摸者可能处于“不利情况”,即先摸者摸到黑球,这时他摸到黑球的概率降为;但是他也可能处于“有利情况”,即先摸者摸到白球,从而使他摸到黑球的概率升为;最终,正确的答案是二者的加权平均,这些权,正是处于“不利境况”与“有利境况”的概率。这样一看,这一答案既合情又合理。

下面讨论一般的情况。

设事件A1A2,…,An,…是样本空间Ω的一个分割,亦称为完备事件组,即Aii=1,2,…,n,…)两两互不相容,而且

这样一来,则有

这里的AiBi=1,2,…,n,…)也两两互不相容(如图3-1所示)。

图3-1 样本空间的分割

由概率的完全可加性

再利用乘法公式,即得

上述公式可归纳为全概率公式,它是概率论中使用频率最高的一个基本公式。

从推导中可以看出,当P(Ai)=0时,只要把相应的项作0即可。在多数问题中,公式(3-4)只包含有限项。

例3.3 雨伞掉了。雨伞落在图书馆中的概率为50%,这种情况下找回的概率为0.80;落在教室里的概率为30%,这种情况下找回的概率为0.60;落在商场的概率为20%,这种情况下找回的概率为0.05,求找回雨伞的概率。

:以B表示找回雨伞,而以A1A2A3分别记为雨伞落在图书馆、教室和商场。显然,A1A2A3满足

而且P(Ai)=0.5,P(A2)=0.3,P(A3)=0.2,P(B|A1)=0.8,P(B|A2)=0.6,P(B|A3)=0.05,因此,

可以看出,全概率公式之所以有利,就在于它概括了一种普遍的解题策略:各个击破或分而食之。