数据分析

与任何科学研究一样,心理学研究中,数据收集也只是用科学方法解决问题的第一步。假设我们测量了装配线上200名工人的产量,或者对200名销售岗位应聘者进行了能力测验,从中我们得到了什么信息呢?目前为止,我们只是简单地收集了200个原始分数而已。接下来就需要对这些数据进行分析解释,得出结论,从而将结论运用到当前情境中去。为此,我们要运用统计方法来总结和描述这些数据。

描述性统计

相信大家都熟悉“描述性”一词,当你描述一个人或一件事时,你会试图把脑海中的图像传达给对方。同样的,当心理学家用描述性统计(descriptive statistics)时,就是在试图把研究数据以一种有意义的方式表达或呈现出来。下面来看一些研究数据以及如何用统计来描述它们。

有一项新的测试是用来预测求职者是否能成功销售卫星电视系统,研究者要评估这份测试,因此选了99名求职者完成此份测试,测试分数见表2-1。看着这一堆数据你就应该知道为什么一定要想方设法来描述这些数据了,因为就这样你是无法理解这些数据有什么意义的。从这个数据表你无法对他们未来的工作表现做出预测或任何有意义的评估。

表2-1 99位求职者在卫星电视测验中的原始分数

建构频次分布(frequency distribution)是描述数据的一种方法,以柱状图的形式表明每个分数出现的次数(见图2-3)。方便起见,可以把这些分数划分为相同的分数段,当然并不是必须要这么做,但这样做能够简化数据分析的过程。与前面的原始分数表相比,从这个柱状图可以更清楚地看到求职者在测验中的表现。此外还可以看到大部分求职者的测验得分处于中间水平。

图2-3 卫星电视销售测试得分的分布(分组数据)

平均数、中数和众数。科学的数据分析方法要求对原始分数进行量化的描述,所以必须要用单个测量值呈现出数据分布的集中趋势,例如平均数、中数和众数。

描述数据分布的最常用且最有效的方法是计算算术平均数(mean),即所有分数的总和除以个数,上例中99位求职者的测验平均分是总分11 251,除以99得到113.6,通过这种方式,99个原始数据的信息就用平均数这种单个数据的形式呈现出来了。平均数是进一步统计分析的基础。

中数(median)是原始数据分布中位于中点的数值,把99个数据从高到低排列,第50个人的分数即中数。所有求职者中,一半人的分数高于中数,一半人的分数低于中数。上个例子的中数是114,与平均数的值相近。在偏态分布中,中数是一个有效的测量值。

众数(mode)是数据分布中出现频率最高的数值,一个分布中可能有不止一个众数。上例中的众数是114,一般描述数据时很少用到众数,但在某些情境中众数是非常有用的数据。例如,某店长要进货就要先考虑哪种电脑游戏卖得最好。

正态分布和偏态分布。从图2-3可以看到,大多数求职者的测验分数处于中间水平,只有几个是非常高或非常低的分数。很多测量结果近似这种钟形分布,一般而言,大样本测量某种物理或心理特征时都会出现这种正态曲线分布。例如,无论是测量身高、体重还是智力,只要样本量足够,大多数的值会集中分布在中间位置,只有少数会落到极高和极低两端。

正态分布(normal distribution)的出现取决于测试样本量的大小和取样的随机性,如果样本不能代表总体,而是有某种偏向趋势的话,结果就不会近似正态曲线。

假设我们对一组高中辍学学生进行智商测试,因为这样一个样本并不能代表总体,所以结果不会呈现出正态曲线,因为他们接受的正式教育很少,也不了解标准化的测验。如果选择某个特殊群体进行测量,那么结果会呈现出不对称分布,即偏态分布(skewed distribution)(图2-4)。对于偏态分布,中数最能反映数据的集中趋势,因为平均数会受到极端值的影响,此时用平均数描述数据可能会带有误导性,而中数受极端值的影响较小。

图2-4 偏态分布曲线

图2-5 债券收益的中数和平均数。

(该数据来自Institute for Civil Justice, Rand Corporation, New York Times, April 13, 1986)

你肯定听到过别人说统计是骗人的。虽然统计可以误导人,但都错在运用不当,而不是统计方法本身的错。如图2-5中的数据代表某公司24年间债券收益的平均数和中数,数据显示,平均收益从6万美元上升到25万美元,而中数却呈略微下降的趋势。对此数据的解释是有争议的,因为律师可以从高债券收益中获利,所以他坚持声称债券收益无变化,而保险公司是要支付这些债券,因此声称债券收益增长了5倍。律师用的是中数,保险公司用的是平均数,从技术上说两方都是对的,尽管在偏态分布中用中数解释更为合适一些。如果你是一名员工、经理、选民或者消费者,当你听到“平均”一词时,应要有所怀疑,并追问一句,是哪个“平均”,平均数还是中数?

离散性和标准差。仅仅对数据分布进行集中趋势的计算和制图是不够的,还需要进一步的分析以便对数据的分布进行更详细的描述和解释。如果想要充分利用数据信息的话,则必须要了解数据在中心点周围的散布情况,并用数值表示出来。

图2-6 两条集中趋势相同但离散程度不同的正态分布曲线

例如,图2-6中的两个正态分布图,如果用平均数和中数来衡量数据分布的集中趋势,那么两个分布应该是相同的,因为两条正态曲线的平均数和中数都相等。但很明显,这两个分布图是不同的,差异在于它们的数据散布情况,也就是离散程度,测量离散程度的基本指标是标准差(standard deviation, SD),是数据到分布基准线的精确距离。通过确定这一距离,可以对数据有更多的了解,进而更有效地描述数据所包含的信息。

如图2-7的IQ分数分布图中,数据构成了一条平均值为100、标准差为15的正态分布曲线,标准差为15意味着,115的IQ得分比平均值100高出一个标准差,而130的IQ得分则比平均值高出两个标准差,以此类推。同样的,85的IQ得分则低于平均值一个标准差。

图2-7 标有标准差单位的IQ分数正态分布图

有了标准差,对于任一原始分数X,我们就可以知道整个分布中有百分之多少的分数高于或低于X。正态分布的数学表达式向我们提供了落在不同标准差单位内的人有多少,分数出现的频率有多高。比如从图2-7我们可以看到,全体被试中IQ低于145的占99%,低于130的占97.5%,低于115的占84%。只要数据符合正态分布,这一百分比关系适用于任何测得的变量。知道了某项正态分布的标准差后,就可以判断任一具体分数的意义,知道其在整个群体中的相对位置。

假设我们开发了一套能力测验,测量牙科学校学生在牙科手术中操作工具的能力,你室友参加了测验并得到60分,这一分数本身说明不了任何问题,它不能告诉你与其他所有人相比你室友的能力如何。但是,如果我们知道测验分数呈正态分布,且平均分为50分,标准差为10,那么60分就意味着比平均分高出一个标准差,说明只有16%的同学得分比你室友高,84%的同学比你室友低。总之,你室友将很有可能成为一名出色的牙医。

这种方法可以把任意原始分数都转换为标准分数,从而可以在整体分布内解释每一个原始分数的意义。此外,还可以用标准分数比较不同个体不同变量之间的差异。例如把所有测试成绩的原始分数都转换为标准分数之后,可以对不同测试上的表现进行比较,因为此时所有的分数都是以同样的形式呈现出来的。

相关。以上我们讨论的是一次对一个变量进行统计处理的方法,例如一组求职者的测验得分。而工业与组织心理学家通常更关心两个变量之间的关系,如果要预测某求职者是否能胜任某份工作也需要对两个或两个以上变量上进行匹配。例如,必须要将员工在选拔测试中的表现与后续实际工作表现相比较,心理学家才能判断这个选拔工具是否是选出最佳人选的有效工具。(我们将在第4章详细讨论效度概念。)此时研究者需要使用相关分析法来研究变量之间的关系。

相关(correlation)分析可以告诉研究者两件事:(1)变量之间关系的方向;(2)变量之间关系的强度。变量之间关系的方向可以是正向的或是负向的,取决于一个变量值高时,另一个变量值是高还是低。在正向相关关系中,一个变量值增加时,另一个变量值也会相应地增加。例如,员工的测验分数与上司评定之间呈正相关,说明测验分数越高,上司对其工作表现的评价也越高,即一个变量增加,另一个变量随之增加,于是就可以预测那些在能力测验中表现更好的求职者在工作中的表现也会更好。换句话说,测验得分高的求职者更倾向于得到上司的高评价。而在负向相关关系中,一个变量值升高时,另一个变量值会下降。举例来说,求职者在选拔测验中的得分越高,得到的上司评价越低,换句话说,测验中表现得越好,工作中却会表现得越差。

通过运用相关系数的统计公式可以计算出两个变量之间关系的方向和强度。相关系数在0到1的范围内即正相关,在-1到0的范围内即负相关。相关系数为1或-1时,相关强度相等,只是方向相反。这两种情形下,一个变量上的得分都可以预测另一个变量上的得分,例如测验分数可以预测上司评价。相关系数越接近1或-1,预测结果越准确。在工业与组织心理学中,相关是一个非常有用而且被广泛使用的工具,在本书中将会看到很多使用相关分析的例子。

推断统计

在标准的心理学实验中,研究者通常会比较实验组和控制组之间的差异。比如在一项检验新培训方法效果的实验中,实验组接受了培训而控制组未接受培训,只有通过比较两组被试的工作绩效,才能做出关键决策,即是否应该将这一新培训方法在全公司内推广。这一决策取决于两组被试工作绩效之间有多大差异。

显著性水平。研究者要判断两组被试的工作绩效达到多大水平的差异时能够推广此培训项目,就必须要通过确定两组平均数之间差异的统计显著性(statistical significance)水平来实现,是以概率的形式呈现出来的,而不是确定性的呈现。也就是说,两组之间的差异是否足够大,以至于如此大的差异并不是偶然发生的。

概率。研究者用推断统计(inferential statistics)的方法处理实验组和控制组被试的数据,计算两组平均数出现差异的概率(probability)值,这一数值代表了差异偶然出现的可能性大小。心理学家认为,有两种统计显著性水平,即.05的概率水平和.01的概率水平。在.01水平上显著意味着实验中两组平均数之间的巨大差异在100次中只有1次可能是偶然发生的,因此如果两组平均数之间的差异达到此显著性水平的话就可以认为差异是由新的培训项目引起的,而不是偶然发生的。若在.05水平上显著的话,对于结果的解释信心会略微有所下降,因为此时出现的显著性差异表明,100次中可能有5次是偶然发生的。

元分析。在工业与组织心理学中,元分析(meta-analysis)是比显著性检验更进一步的分析方法,即通过对大量已有研究的再分析,从而确定总体趋势。许多心理学家采用元分析的方法对同一问题的大量已有研究数据进行分析,从而得出更为客观的结论。元分析在各个领域都有广泛应用,例如工业与组织心理学、经济学和医学等。

元分析已成功运用于工业与组织心理学的许多研究问题上,例如人员选拔技术,领导特征,以及工作满意度、工作绩效、离职、缺勤之间的变量关系等。研究者通过元分析可以理解、分析和解释研究结论,并且将众说纷纭的研究结果整合到一起,给出确信可靠的结论,使得研究更接近实践者的需要(Le, Oh, Shaffer, & Schmidt, 2007, pp.9,14)。

工业与组织心理学家在对商业和工业领域的一些重要问题进行研究时,无论是用何种分析方法研究数据的,统计工具的结果都有助于他们给出决策信息和建议。当然统计并不是让人们不用再做决策了,而是给研究者、管理者或者任务执行者提供一定的引导。统计工具对研究结果很重要,但不是研究的终结。

本章小结

心理学研究中的观察必须要客观,经过系统严格的控制,且能够被重复和验证。但是心理学研究有一些局限性,例如有些问题太过复杂,无法用心理学的研究方法进行研究;观察行为本身也会对被观察对象产生一定的干扰作用,因为有时观察本身带来的新异刺激对行为变化的作用大于处理本身,如霍桑效应。此外,一些研究必须在人为设定的情境下进行,这就限制了研究结论的可推广性。

实验法中,心理学家控制其他所有变量,只研究一个变量对行为结果的影响,这一变量即自变量,行为结果即因变量。实验中还会用到实验组控制组两组被试,通过随机区组设计匹配组设计可以使两组被试尽可能地保持一致。随机区组设计是将被试随机分配到两个组中,而匹配组设计是将被试在一些个人特征上进行匹配后再逐对分配到两个组中。

自然观察法是指在日常生活和工作情境中对行为进行观察,研究者可以控制自变量但不能像实验法那样对自变量进行精确地处理。

调查法聚焦于对人们态度和观点的调查,调查法包括面对面的个人访谈、纸笔问卷、在线问卷和电话调查。美国、日本和法国的研究发现,与纸笔问卷调查相比,员工更喜欢在线调查,同时,50岁以下的员工也更喜欢在线调查。调查的问题可以是开放性问题也可以是限选题,开放性问题允许被调查者用自己的话回答问题,而限选题把被调查者的答案限制在几个特定的选项中。此外,可以通过随机取样分层取样在总体中挑选有代表性的样本进行调查,随机取样是指总体中的每个人都有已知的概率或机会被选入样本,而分层取样是指从一个大群体中复制出一个缩影出来。乔治·盖洛普通过客观、科学的方法从总体中选出代表性样本,并将此方法运用到民意测验中。

与积极配合调查问卷的员工相比,那些不愿意回答调查问题的员工对自己的工作满意度更低。此外,心理学家也在虚拟实验室中进行在线研究,从而获得更多不同的被试样本。与传统的实验室研究相比,在线研究可以在更短的时间内让更多的被试完成研究,同时获得的数据也更加可靠。

研究获得的原始数据可以通过描述性统计进行总结、描述和分析,用图表或几个有意义的统计指标呈现出来。衡量数据分布集中趋势的指标有3个,即平均数中数众数。如果从代表性样本中获得足够的数据,就可以形成一个钟形曲线,即正态分布曲线,其中大部分数据落在中间或平均水平上。此外,心理学家还用标准差,即数据到分布基准线的距离,来衡量一个分布的变异程度。有了标准差,对于任何一个原始数据,就可以知道样本中有百分之多少的数据高于或低于这一分数。相关系数表示两个变量之间关系的方向和强度,在相关系数的基础上,研究者可以根据一个变量的得分来预测另一个变量的得分。

推断统计用来确定两组被试之间差异的显著性水平,根据差异的大小判断这个差异是否是偶然发生的。元分析是通过对大量已有研究结果进行总结和分析,从而使得出的研究结论更接近于实践者的需要。

关键术语

控制组

推断统计

概率

相关系数

匹配组设计

随机取样

因变量

平均数

分层取样

描述性统计

中数

随机区组设计

实验组

元分析

科学方法

实验法

众数

偏态分布

限选题

自然观察

标准差

频次分布

正态分布

统计显著性

自变量

开放性问题

调查研究法

复习题

1.如果要开始你的职业生涯,了解心理学研究方法对你有何帮助?

2.阐述心理学研究的三大基本要求。

3.霍桑效应是什么?它如何限制心理学研究结果?

4.请区分因变量和自变量、随机区组设计和匹配组设计。

5.实验组和控制组的差异表现在哪些方面?在实验中加入控制组的目的是什么?

6.有一组已在公司工作5年的资深计算机工程师,当部门搬迁后,他们突然开始犯输错数据这种小错误。如果要你设计一个实验来判断出现这一情况的原因,你将如何设计?

7.阐述自然观察法的优势和劣势。

8.调查和民意测验有哪些用途?并讨论哪些问题会有损其适用性。

9.收集调查数据的4种方法是什么,并分别阐述其优点。

10.如果你要开展一项市场调查,去了解宝马车主想要在这次的新车型中看到什么样的改变,你会使用何种调查研究方法?为什么?

11.盖洛普是如何改变民意调查方式的?

12.导向性民意调查是什么?它是如何影响选举结果的?

13.请区分开放性问题和限选题。

14.讨论随机取样和分层取样之间的差异。

15.为什么与之前相比,用电话进行研究调查和民意调查变得更加困难了?

16.阐述虚拟实验室中的心理学研究有何优势和劣势。

17.描述性统计和推断统计之间的区别是什么?

18.在你看来,没有统计,世界是否会更美好?请对自己的观点进行辩护,并给出适当的数据支持。

19.用标准差如何解释你在某个IQ测验上的得分。

20.如果你的IQ分数和老板对你工作绩效的评定之间的相关系数是.85,说明什么?


(1) “Effect of Training on the Productivity and Tenure of Sewing Machine Operators,” by J.Lefkowitz, 1970, Journal of Applied Psychology, 54, pp.81—86.

(2) “Understanding the Relationship Between Displayed Emotions and Organizational Sales:The Case of Convenience Stores,” by R.I.Sulton and A.Rafaeli, 1988, Academy of Management Journal, 31, pp.461—487.