第三章 概率基础
第一节 概率
前面谈到社会调查中最常用的方法是抽样调查。抽样调查是通过对抽样(局部)的研究,达到对全体的判断或推论,也就是以小看大的研究方法,它属于归纳法的范畴,归纳法与演绎法所不同的,在于归纳法的结论大于前提,因此结论与前提间不是包含关系。归纳法的结论不能有百分之百的可靠性。它除了推理所预言的结果外,还可能存在其他结果。而研究各种可能出现的结果,及其所对应出现可能性的大小,正是概率论所要研究的问题。可见,对于通过抽样调查,研究局部推论到总体,必须通过概率论作为工具或媒介。这也是学习统计推论必须首先学习概率论的缘故。通过概率论,可以知道在一定条件下,总体的各种抽样结果所具有的概率特性。而统计推论则是研究在发生了某种抽样结果的情况下,判断它来自何种总体更为合理。因此可以说,统计推论是概率论研究的逆问题。为了学习概率论,首先要了解概率论的研究对象。简单说来,概率论的研究对象是随机现象。
一、什么是随机现象
客观现象可以分为确定性现象和非确定性现象。在很长一段历史时期内,由于生产水平的限制,人们只限于研究确定性现象。例如,在一个标准大气压的情况下,温度上升到100℃,水必然沸腾。同样,在社会经济领域内,一个国家每年要支付多少薪金也是确定的。但除了确定性现象外,在自然、经济、社会领域内还存在另一类现象。这类现象的特点是在一定条件下,它无法像“水必然沸腾”那样预言其必然发生。例如,我们无法预言某天将有多少人死亡;多少婴儿将诞生;多少人因车祸而身亡;多少人结婚;多少人离婚;多少人从北京到上海;多少人晚间收看哪些电视节目等等。所有这些现象都有一个共同的特点,那就是在一定条件下(例如某天)事物的出现只具有可能性但不具有必然性。所谓可能而又不必然,则意味着在一定条件下出现的结果不止一种,因此对其中任一种结果的出现,都只能说具有一定的可能性、偶然性或称随机性。而且这种非确定性的存在,并不取决于对事物事先了解的程度。例如一个竞技再好的运动员,也无法预言在比赛中是否一定会取胜。
随机现象具有非确定性、随机性,但绝不是说随机现象是杂乱无章、无规律可循或无法研究的。实际上,随机现象是存在着规律性的。人们通过大量的实践与观察,是能认识其统计规律性的。例如人口学中的性别比问题,说明了从局部的、瞬时的、小范围来看,婴儿的性别比可能波动性很大,但长期或大面积的统计,就会发现男、女性别比稳定地保持在,这正是概率论所要研究的随机现象的统计规律性。
从命题来分,确定性现象的研究属于必然命题,它表示为:
若……则……
而非确定性现象的研究属于随机命题。它表示为:
若……可能……
在社会学的研究中,常见的多为随机命题,必然命题是十分少见的。但从另一方面,也应该看到确定与非确定都是相对而言的,其间并无不可逾越的鸿沟。实际上,随着问题研究的深入和精确程度的提高,原先认为是确定性的现象也会成为非确定性的现象。比如以国家的工资总额来说,似乎是确定的。但如果要求数字的精确度进一步提高,那么每月随着职工人员的增加,退休、死亡、工伤、离职以及工资的变动,其工资总额也是不断变化的。因此,可以说非确定性是普遍的,只是程度不同而已。同时,在社会生活中,由于任何一种社会现象、社会行为,其产生的原因都是十分复杂的,人们往往无法准确地掌握其全部原因,这也正是为什么社会学命题多为随机命题的缘故。当人们对事物发生的原因知之甚少时,事物的发生总是具有某种非确定性或偶然性的。但在看到社会现象具有偶然性一面时,还应该注意到,对于大量现象的研究,由于平衡与排除了单个孤立事件所具有的偶然性,从而呈现出了内部所隐蔽着的统计规律性,正如恩格斯所指出:“在表面上是偶然性在起作用的地方,这种偶然性始终是受内部的隐蔽着的规律支配的,而问题只是在于发现这些规律。”[4]偶然事件的概率(即发生可能性的大小)就是偶然事件隐蔽着的规律。
二、概率的概念
前面谈到了随机现象具有在一定条件下,呈现多种可能结果的特性。而到底出现哪种结果,却又是无法预言的。因此,随机现象的结果以及这些结果的集合就称作随机事件,或简称事件。
例如:
●某人在运动会上将得金牌。
●某人将活到80岁以上。
●明年报考医学院的学生将超过一万人。
●明天将下雨。
以上列举的事件都并非一定会发生的,而只是可能发生也可能不发生的非确定性事件,称随机事件。而概率则是这些随机事件发生可能性大小的数量表示。实际上,人们在日常生活中常用“比较级”粗略地来表示随机事件发生可能性的大小。
例如:
●某生明年不可能考上大学。
●某生明年可能会考上大学。
●某生明年很可能考上大学。
●某生明年一定会考上大学。
句中“不可能”“可能”“很可能”“一定”都是对可能性大小的粗略的估计。而概率就其表达的实质来说,和这些“比较级”是一样的,只是在数量上对可能性大小表达得更为精确而已。
数学上一般约定用英文字母P表示概率,并用括号说明P是哪一个事件的概率。例如:
P(A)——表示事件A所具有的概率
P(B)——表示事件B所具有的概率
进一步,为了使可能性的大小能进行比较,概率的度量必须标准化。也就是确定概率的最大值是什么和最小值是什么。为此,我们把不可能发生的事件称作不可能事件(记作),发生的概率P()定作0:
把一定发生的事件(S)称作必然事件,发生的概率P(S)定作1:
而一般随机事件E,由于它发生的可能性介于“必然”与“不可能”之间,因此它发生的概率P(E)为:
可见,如果我们按可能性的大小顺序排列事件的话,则有:
那么,对应事件的概率为:
也就是一般说来,任何随机事件E发生的概率介于0、1之间,是个非负数:
概率的最大值是1,当P(E)=1时,事件E是必然发生的。概率最小值是0,当P(E)=0时,事件E是不可能发生的。而当概率界于0至1之间,事件发生的可能性随P值而变化,例如,当P(E)=0.1时,表示事件E虽然有可能发生,但发生的可能性不大;当P(E)=0.9时,事件E虽然并非必然发生,但发生的可能性就很大了;但当P(E)=0.5时,事件E发生与否,各占0.5,这种情况下,决策者对做进一步的取舍就比较困难了。
下面举例分析哪些是必然事件,哪些是不可能事件或随机事件:
[例]1.某企业有青工100名,其中20名为已婚者。今任抽25名,那么,其中含有5名为已婚者的事件则为随机事件。因为任抽25名可能恰有5名已婚,也可能已婚人数不是5名。
[例]2.接例1:若任抽25名,那么,其中至少有5名为未婚者的事件则为必然事件。(想想看为什么?)
[例]3.接例1:若任抽25名,其中有21名为已婚者的事件则为不可能事件。(想想看为什么?)
三、概率的计算方法
概率是反映随机事件内在的统计规律性的。所谓统计规律性,是指在一定条件下,就其个别一次的结果来说都具有偶然性,但大量重复的试验或观察,则其结果无不呈现必然的规律性,这种规律性,称作统计规律性。统计规律性是事物本身所固有的,是事物的客观属性,而概率P正是这种事物客观属性的数量表现。那么,如何求得这种概率属性呢?最直观、最简单的想法就是和“频率”联系在一起的。人们凭借生活经验的直观感觉可以知道,若事件E出现的可能性愈大,则实际观测结果的频率也愈大,反之亦然。而概率是事件发生可能性大小的数量表示,因此,可以把事件E的概率P(E)定义为试验或观察次数N趋于无穷时相应频率n/N的稳定值。
其中N为在相同条件下试验或观察总次数,n为随机事件E出现的n次。
这里强调实验次数N要足够大,甚至理论上N应趋于无穷的原因是,如果重复试验或观察的次数N不太大时,其频率f(E)取值,不仅可能不相同,而且可以相互差别较大,这是随机事件偶然性的表现;但当试验或观察次数N足够大时,偶然因素被排除,频率f(E)将稳定于某一常数p,从而体现了随机事件统计规律性的一面。
为了说明当N→∞时频率f(E)的稳定值是反映了随机事件自身固有的性质和规律。下面列举统计学家蒲丰和皮尔逊所作经典的大量投掷硬币的试验结果(表3-1),可以看出,当N很大时,f(E)十分稳定地趋近于0.5。
表 3-1
在实际问题中,当概率不易求出时,往往就取当N充分大的频率作为概率的近似值。例如当我们要了解全国人口的出生率、死亡率、初婚年龄、离婚率等等,如果用抽样调查的结果来代替普查,那实际就是用频率代替了概率。但应该看到,由于频率是个试验值,它是随着试验或观察而变化的,因此具有随机性。它只能近似地反映事件出现可能性的大小。而概率是个理论值,它由事件的本质所决定,其值是唯一的,能精确地反映事件出现可能性的大小。所以,从理论上讲,概率比频率要“完美”,它是反映事件出现可能性大小的唯一精确数值;但在实际中经常碰到的却是频率而不是概率。但另一方面,虽然我们经常用频率近似地代替概率,但并不能否定概率这个概念的作用。有了概率,它可以把随机事件与一个精确反映事件出现可能性大小的数量紧密地联系起来,这就是概率论所要研究的内容。