- 公共卫生服务基本技术与方法
- 陈坤 沈华浩 蒋健敏等
- 7348字
- 2020-08-29 00:10:44
第三节 常用统计推断方法
统计推断是指使用样本的信息来推断总体的特征,包括参数估计和假设检验。
一、参数估计
参数估计的概念是Neyman在1937年提出的,指在抽样研究中由样本统计量估计总体参数,包括点估计(point estimation)和区间估计(interval estimation)。
(一)点估计
点估计一般是直接把样本统计量作为总体参数的估计值,如。这种估计方法简单,但是未考虑抽样误差,所以,通常不建议使用。一般建议使用95%可信区间来估计参数水平。
(二)区间估计
可信区间是按一定的可信度(1-α)来估计参数所在的范围,相应的区间叫可信区间或置信区间,可信度一般取95%或99%。
1.总体均数的区间估计 总体均数μ的95 % CI可以根据t分布理论推导得到,其计算公式为:
例3-1某研究对国内26架次飞机客舱空气质量进行抽样检测评估,时间为2010-06-01至2012-06-01,得到噪声x=77.2dB(A), s=4.5dB(A),试问:国内飞机客舱噪声的平均水平是多少?
解:已知n=26, x=77.2dB(A), s=4.5dB(A),查t临界值表,可得t0.05/2.25=2.060,代入公式(3-1)得:
μ的
故国内飞机客舱噪声的平均水平是75.32~79.08dB(A)。
2.总体率的区间估计 根据样本大小和p大小来选择具体方法,常用有正态近似法和查表法。
(1)正态近似法:当满足np>5且n(1-p)>5时,样本率p近似服从正态分布,即p~N(π, σ π)。根据正态分布理论,可以得到总体率π的95 % CI的计算公式为:
例3-2某市2008年农村居民碘盐检测结果分析发现,320份碘盐中248份为合格,求其合格率的总体水平。
解:已知
故该市居民碘盐的合格率为77.50 %(95 % CI:72.92 %~82.08 %)。
(2)查表法:当n≤50时,根据二项分布理论,可以使用查统计学教材中“百分率的可信区间”表(表3-3)直接获得。
表3-3 百分率的可信区间(部分)
注:上行:95%置信区间 下行:99%置信区间
例3-3某市蜚蠊携带病原体状况调查发现,在24组德国小蠊中,体表检出病原体的有23组,求其检出率的总体水平。
解:已知n=24,阳性数为23,阴性数x=1,查百分率的可信区间,可得总体阴性数的95 % CI为:0~21 %,故其检出率的总体水平95 % CI为:79 %~100 %。
注:“百分率的可信区间”表给出的阳性数x<n2的阳性率的95%和99%可信区间,若,则使用类似例3-3方法先进行换算,先查表求出阴性率,再换算求回阳性率。
二、假设检验
假设检验方法可以根据研究目的、资料类型和设计类型等来选择。下面就按不同的资料类型、两组还是多组设计来简要介绍。
(一)单变量定量资料
对于观测指标是定量资料,如温度(℃)、相对湿度(%)、压力(kPa)、风速(m/s)和噪声(dB(A))等,组间比较方法常用的有t检验、方差分析、秩和检验或Ridit分析。
1.两个独立样本间比较 两组间定量资料比较方法的选择与设计类型有关,如果研究者采用完全随机设计,那么就考虑使用两个独立样本的t检验、方差分析、Wilcoxon秩和检验或Ridit分析。如果研究者采用配对设计,如给予干预措施前后的比较,那么就考虑采用配对设计t检验或配对设计秩和检验。
(1)t检验:当配对设计资料的差值满足正态性,则对配对设计资料的差值进行正态分布假设检验,其结果不拒绝H0,则采用配对设计t检验。若研究者采用完全随机设计,两组资料都满足正态分布和方差齐性,则可以采用两个独立样本的t检验。
例3-4现用两种仪器对12名妇女测量最大呼气率(L/min),资料如表3-4所示,问两种方法的检测结果有无差别?
表3-4 对12名妇女用两种方法测量的最大呼气率(L/min)检测结果
解:首先,建立SPSS数据库。
接着,计算差值d,如表3-4所示。
然后,调用SPSS程序进行差值正态性检验,结果见表3-5。Shapiro-Wilk法结果显示:差值服从正态分布(w=0.951, P=0.658)。
表3-5 Tests of Normality
*This is a lower bound of the true significance.
aLilliefors Significance Correction
最后,调用SPSS程序中Analyze——→Compare Means——→Paired-SamplesT Test,结果见表3-6。
表3-6 Paired Samples Test
从表3-6可见,两种方法检测妇女最大呼气率之间差异没有统计学意义(t=1.475, P=0.168)。
注:如果差值不服从正态分布,则选择配对设计的Wilcoxon符合秩和检验。SPSS调用程序为:Analyze——→ Nonparametric Tests——→Legacy Dialogs——→ 2 Related Samples。
(2)方差分析:若研究者采用完全随机设计,并且两组资料都满足正态分布和方差齐性,除了可以采用两个独立样本的t检验外,还可以使用单因素方差分析(one-way ANOVA)。换句话说,两个独立样本的t检验和单因素方差分析的应用条件是相同的。
(3)秩和检验或Ridit分析:若研究者采用完全随机设计,并且两组资料不满足正态分布或方差齐性,可以采用Wilcoxon秩和检验或Ridit分析方法。
2.多个独立样本间比较 多组间定量资料比较方法的选择可以根据资料满足的条件来定,一般常用的方法有方差分析和秩和检验。
(1)方差分析:多组间定量资料比较,如果研究者采用完全随机设计,资料满足正态分布和方差齐性,那么可以使用单因素方差分析;如果采用配伍组设计,那么考虑双因素方差分析(two-way ANOVA);若需分析观察指标在不同时间点上的变化,还可以采用重复测量的方差分析。
例3-5为研究各期矽肺患者血清铜蓝蛋白含量是否相同,某职业病防治所分别测定了30名不同期矽肺矿工血清铜蓝蛋白含量(活性单位/100ml),资料如下,请作出统计推断。
0期:8.0,9.0,6.3,5.4,8.5,5.6,5.4,5.5,7.2,5.6,5.8
0~Ⅰ期:8.5,4.3,11.0,9.0,6.7,9.0,10.5,7.7,7.7
Ⅰ期:11.3,7.0,9.5,8.5,9.6,10.8,9.0,12.6,13.9,6.5
解:首先,建立SPSS数据库。
接着,调用SPSS程序中Compare Means——→one-way ANOVA来进行单因素方差分析。
结果如表3-7:
血清铜蓝蛋白含量(活性单位/100ml)
表3-7给出了3组的描述性指标。
表3-7 Descriptives
血清铜蓝蛋白含量(活性单位/100ml)
表3-8 Test of Homogeneity of Variances
表3-8表明本资料具有方差齐性(F=0.959, P=0.396)。
血清铜蓝蛋白含量(活性单位/100ml)
表3-9 ANOVA
方差分析结果见表3-9,其结果显示:各期矽肺患者血清铜蓝蛋白含量是有差异的(F=7.704, P=0.002)。
Dependent Variable:血清铜蓝蛋白含量(活性单位/100ml)
表3-10 Multiple Comparisons
*The mean difference is significant at the 0.05level.
b Dunnett t-tests treat one group as a control, and compare all other groups against it.
多重比较(Dunnett检验)结果显示0期与Ⅰ期之间有统计学差异(t=3.30, P=0.001),见表3-10。
(2)秩和检验:多组间定量资料比较,如果研究者采用完全随机设计,资料不满足正态性或方差齐性,那么可以使用完全随机设计多组比较的秩和检验方法;如果采用配伍组设计,资料不满足双因素方差分析的条件,那么可以考虑采用配伍组设计秩和检验。
例3-6已知6名产妇羊水中前列腺素(毫微克)含量如表3-11所示,问:
表3-11 6名产妇不同时点羊水中前列腺素含量(毫微克)
①产妇间羊水中前列腺素含量有无差别?
②不同时点产妇羊水中前列腺素含量有无差别?
解:首先,建立SPSS数据库。
接着,调用SPSS程序中Analyze——→Nonparametric Test——→Legacy Dialogs——→K Related Samples来进行Friedman检验。结果如表3-12至表3-14。
表3-12 Ranks
表3-13 Test Statisticsa
aFriedman Test
表3-14 Ranks
表3-13结果表明:产妇间羊水中前列腺素含量差异无统计学意义(X2=5.216, P=0.390)。
表3-15结果表明:不同时点产妇羊水中前列腺素含量差异有统计学意义(X2=17.000, P=0.001)。
表3-15 Test Statisticsa
aFriedman Test
注:①在分析(1)和(2)时,需要调用SPSS中的Data——→ Transpose进行数据库转置;②如果需要进一步了解哪个时点产妇羊水中前列腺素含量比较高,则需要使用多重比较方法进行深入分析。
(二)单变量分类资料
如果需要比较的效应指标是分类变量资料,那么在选择分析方法之前应该区分一下该效应指标是属于有序分类变量还是无序分类变量,因两者的统计学方法是有所不同的。
1.有序分类变量资料 对于效应指标是有序分类变量资料,间组比较方法常用的是秩和检验或Ridit分析。两组资料间比较通常是使用秩和检验或Ridit分析,而多组资料间比较通常是采用秩和检验中的H-检验或Ridit分析。
对于有序分类资料最好不要整理成二分类的形式,因为有序分类变量资料的信息量比较多些。进行资料的降级处理后,资料所含的信息量会变少。
例3-7 32名铅作业工人与20名非铅作业工人的尿棕色素含量定性检测结果见表3-16所示,试问:铅作业工人尿棕色素含量是否高于非铅作业工人?
表3-16 铅作业工人与非铅作业工人的尿棕色素定性检测结果
解:本例资料为有序分类资料,可以选用秩和检验方法,其步骤如下:
首先,建立SPSS数据库。
接着,调用SPSS程序中Analyze——→ Nonparametric Tests——→ Legacy Dialogs——→ 2inde-pendent Samples来进行Mann-Whitney秩和检验。结果如表3-17和表3-18。
表3-17 Ranks
表3-18 Test Statisticsa
aGrouping Variable:工人
表3-17和表3-18结果显示:铅作业工人的尿棕色素水平较非铅作业工人高。(z=4.503, P=0.000)
2.无序分类变量资料 对于效应指标是无序分类变量资料,根据资料的设计类型,分完全随机设计和配对设计两种情况来选用具体假设检验方法。
(1)完全随机设计:又根据两组还是多组分两种情况。①两组资料间比较:当需比较的效应指标是二分类资料时,若样本含量n>40且T>5时,采用PearsonX2检验;样本含量n>40且1<T≤5时,采用连续性校正X2检验;样本含量n≤40或T≤1时,采用Fisher确切概率法。当需比较的效应指标是无序分类资料时,可以考虑采用2×CX2检验。②多组资料间比较:当需比较的效应指标是二分类资料时,并且各格的理论频数T>1,且1<T≤5的格子数小于20%时,则采用C×2X2检验,否则可以考虑采用似然比X2检验。当需比较的效应指标是无序分类资料时,可以考虑采用R×CX2检验。
例3-8某市2011年对分散式供水水质进行检测,其结果见表3-19,问:家庭自备井水的水质是否优于地表水?
表3-19 2011年某市分散式供水水质检测结果
注:地表水包括取自沟渠、河塘等水。
解:本资料为无序分类资料,设计为完全随机设计,n>40且T>5,采用PearsonX2检验。其步骤为:
首先,建立SPSS数据库。
接着,在SPSS软件中调用:Analyze——→DescriptiveStatistics——→Crosstabs,并在Statis-tics界面中选上Chi-square,结果如表3-20和表3-21所示。
表3-20 水源类型*结果
表3-21 Chi-Square Tests
a0cells(0.0%)have expected count less than 5.The minimum expected count is 8.81.
b Computed only for a 2x2table.
从表3-21可见,两种水样的水质之间的差异无统计学意义(X2=2.773, P=0.096)。
例3-9某市市售农产品中铅、镉、总汞检测情况见表3-22,问:其合格率有无差别?
表3-22 某市市售农产品中铅、镉、总汞检测情况
解:本资料为无序分类资料,设计为完全随机设计,T>5时,采用3×2X2检验。其步骤为:
首先,建立SPSS数据库。
接着,在SPSS软件中调用:Analyze——→DescriptiveStatistics——→Crosstabs,并在Statis-tics界面中选上Chi-square,结果如表3-23和表3-24。
表3-23 检测项目*结果Crosstabulation
表3-24 Chi-Square Tests
a0cells(0.0%)have expected count less than 5.The minimum expected count is 49.00.
从表3-24可见,3种监测项目的合格率之间差异有统计学意义(X2=43.119, P=0.000)。
(2)配对设计:采用配对设计X2检验,亦称McNemar检验方法。
例3-10 96例流感病例每例同时采用鼻拭和咽拭标本,结果如表3-25所示,试问采样哪个部位对流感病毒检测阳性率较高?
表3-25 96例流感样病例鼻拭采样和咽拭采样结果比较
解:本资料为无序分类资料,设计为配对设计,可以采用配对设计的X2检验。在SPSS软件中调用:Analyze——→Descriptive Statistics——→Crosstabs,并在Statistics界面中选上Mc-Nemar,结果如表3-26和表3-27。
表3-26 鼻拭*咽拭Crosstabulation
表3-27 Chi-Square Tests
aBinomial distribution used.
表3-27结果表明:两种方法的检出率无统计学差异(P=0.500)。
(三)双变量资料
在医学上,疾病的发生与遗传、药物的剂量与疗效、人的体温与脉搏次数等均有一定的联系。若要将客观事物或现象的数量关系的密切程度和方向用适当的统计表和统计指标表示出来,则选用相关分析的方法;若要将客观事物或现象的数量关系用函数形式表示出来,则选用回归分析的方法。
事物数量之间有相关,不一定是因果关系,也可能仅是伴随关系。例如,孪生姐妹,往往姐姐高妹妹也高,这主要与遗传因素及生活条件有关,而不能说姐姐高是妹妹高的原因。但是,如果事物之间存在因果关系,则两者必然是相关的。
1.相关性分析 如果研究的两个变量是定量资料或有序分类变量资料,那么,其两者之间的相关性分析一般采用Pearson相关分析或Spearman相关分析;若研究的两个变量中一个是无序分类变量资料,另一个是定量资料,那么两者之间的相关性分析可以考虑采用分析完全随机设计的两组或多组定量资料的平均水平或分布是否相同的方法,如t检验、方差分析或秩和检验;若研究的两个变量中都是无序分类变量资料,那么两者之间的相关性分析可以考虑采用完全随机设计两组或多组秩和检验方法。
(1)Pearson相关分析:Pearson相关分析是分析两个定量资料之间关系的密切程度和方向的统计分析方法,其分析思路是首先观察散点图确定其有无线性趋势,然后计算Pear-son相关系数r值,对总体相关系数ρ进行参数估计和假设检验。①适用范围:双变量正态分布,即当一个变量取某个定值时,另一个变量资料服从正态分布,反之亦然;②结果的解释:Pearson相关系数r值的绝对值大小表示密切程度,它没有单位,取值范围为-1<r<1;r的符号表示方向,r>0表示正相关,r=0表示零相关,r<0表示负相关。当然下结论时还需要结合总体相关系数ρ的假设检验结果和样本含量的大小,当假设检验的结果和r值大小出现矛盾时,还得考虑决定系数r2的大小来推断。
(2)Spearman相关分析:Spearman相关分析是用于分析一个是定量资料而另一个是有序分类变量资料,或两个都是有序分类变量资料之间关系的密切程度和方向的统计分析方法,其分析思路是首先观察散点图确定其规律性,然后计算Spearman相关系数rs值,对总体相关系数ρs进行参数估计和假设检验。①适用范围:不满足双变量正态分布资料的有序分类变量资料的相关性分析;②结果的解释:Spearman相关系数rs值的绝对值大小表示相关的密切程度,它介于-1与1之间;rs的符号表示方向,rs>0表示正相关,rs=0表示零相关,rs<0表示负相关。当然下结论时该结合总体相关系数ρs的假设检验结果和样本含量的大小,当假设检验的结果和r值大小出现相矛盾时,还得考虑决定系数rs2的大小来推断。
例3-11在某地一项膳食调查中,调查对象为14名40~60岁中年健康妇女,测得每人的基础代谢与体重的数据,见表3-28。据此数据如何判断两者之间有无关联?
表3-28 中年健康妇女的基础代谢与体重的测量值
解:首先,建立SPSS数据库。然后,制作相关图,见图3-13。接着,调用SPSS中Ana-lyze—→—Correlate—→—Bivariate,其结果见表3-29。
图3-13 14名中年健康妇女体重与基础代谢的相关图
表3-29 Correlations
**Correlation is significant at the 0.01level(2-tailed).
表3-29Pearson相关分析结果显示:健康妇女体重与基础代谢之间存在正相关关系(r=0.964, P=0.000)。
2.回归分析 直线回归(linear regression)是分析两个定量资料之间依存变化的数量关系的统计方法,它是回归分析中最基本、最简单的情况,也称为线性回归或简单回归。其中表示结果的变量叫应变量或因变量,用y表示;另一个表示原因的变量叫自变量或解释变量,用x表示。
其中a为回归直线在y轴上的截距,亦称常数项,其几何意义是:a>0表示回归直线与y轴的交点在原点的上方,a=0说明回归直线通过原点,a<0表示回归直线与y轴的交点在原点的下方;b为回归系数,即回归直线的斜率,其几何意义是:b>0,表示y随x的变大而变大,b=0,表示y不随x变化而变化,b<0表示y随x的变大而变小。
(1)适用范围:应变量是定量资料,并且满足线性回归的假设:①自变量与应变量间呈线性趋势;②每个观察个体之间相互独立;③给定某个x,对应的y服从总体均数为μy/x,方差为σ2的正态分布;④不同x对应的y的方差相等,均是σ2。
为了便于记忆,很多书上把以上假设称为LINE假设,因为线性、独立、正态、等方差的英文首字母刚好为LINE。
(2)模型中参数的解释:回归模型中参数a的统计学意义是:当x=0时y的平均水平;参数b的统计学意义是:x每增加一个单位,y相应地增加|b|的单位(b>0)或减小|b|的单位(b<0); |b|越大,表示x对y的影响越大。当然,推断时需要有H0:β=0的假设检验结果为依据,若得到P≤0.05,则可以认为x和y之间存在回归关系;若P>0.05,则尚没有足够的理由认为x和y之间存在回归关系。
(3)模型的拟合优度评价方法:直线回归模型的拟合优度主要由决定系数来评价,其值越大,说明模型拟合情况越好。
例3-12某省疾病预防与控制中心对8个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘浓度进行监测,结果如表3-30,试问两者之间是否线性回归关系?
表3-30 8个城市大气中苯并(a)芘浓度和肺癌标化死亡率
解:大气中苯并(a)芘浓度和肺癌标化死亡率之间关系可以解释为因果关系,所以考虑使用回归分析。其步骤如下:
首先,制作散点图,见图3-14。
图3-14 大气中苯并(a)芘浓度和肺癌标化死亡率的散点图
接着,调用SPSS中Analyze——→Regression——→linear,结果如表3-31至表3-33。
表3-31 Model Summary
aPredictors:(Constant),苯并(a)芘浓度
表3-32 ANOVAa
aDependent Variable:肺癌标化死亡率
b Predictors:(Constant),苯并(a)芘浓度
表3-33 Coefficientsa
aDependent Variable:肺癌标化死亡率
表3-33结果显示:回归模型无统计学意义(F=5.039, P=0.066)。
表3-33结果显示:大气中苯并(a)芘浓度和肺癌标化死亡率之间不存在回归关系(F=2.245, P=0.066)。
3.Logistic回归Logistic回归(logistic regression)属于概率型非线性回归,是研究因变量y为分类变量指标(可以是二项分类变量或多项分类变量)与一些影响因素之间关联的一种多变量统计分析方法。Logistic回归模型对自变量的分布没有要求,可以是计量、计数和等级资料。
假设y为二分类变量,取值为1表示某阳性结果发生,取值为0表示某阳性结果未发生。在m个自变量为x1, x2, …, xm的作用下(每个自变量可以是分类变量也可以是连续型变量),该事件发生的概率为P,则不发生的概率为1-P,于是,二分类Logistic回归模型是:
为发生概率与不发生概率之比,记作优势比(odds ratio)或比数比,简记为OR。若对其取自然对数则有:
其中β0为常数项,β1, β2, …, βm称为回归系数。与各x的关系成为线性关系。当P在(0,1)之间变动时,对应的logit(P)取值范围在(-∞, +∞)之间,此时无论自变量x1,x2, …, xm如何取值,方程都不会得到不符合实际的结果。
根据设计类型不同,Logistic回归模型可分为二种:条件Logistic回归和非条件Logistic回归。前者适用于匹配设计资料,后者适用于成组设计资料。非条件Logistic回归是Lo-gistic回归最基本的一种类型,简称为Logistic回归,又包括两项分类Logistic回归、无序多分类Logistic回归和有序分类Logistic回归。
Logistic回归模型的回归系数表示的是自变量对因变量作用大小的一种度量。设i为变量xi的回归系数,它表示当自变量xi改变一个单位时logit(P)的改变量。表示的是在其他自变量固定的情况下,该自变量与因变量关联的优势比,即自变量与因变量关联的程度。例3-13糖尿病是一种常见的慢性内分泌系疾病,患病人数多。据WHO估计,糖尿病引起的疾病负担在不断增加。为了解某城市居民糖尿病患病的影响因素,对某市20岁以上的城市居民进行了现场调查。设因变量y表示糖尿病的患病情况,1=患病,0=未患病。分析性别、年龄、吸烟、饮酒、BMI和劳动对糖尿病患病的影响。设性别:1=男性,2=女性,年龄:实际年龄。吸烟:0=不吸,1=吸烟。饮酒:0=不饮,1=饮酒。调查结果示例见表3-34。问:糖尿病患病的相关因素有哪些?
表3-34 1631名居民现场调查结果示例
解:该资料的因变量是二项分类变量,取值为0或1。自变量为定量、定性与等级变量都有的资料。该研究目的是分析多个自变量对因变量的影响作用,属于多变量分析,可以考虑采用二分类Logistic回归分析。
采用二分类Logistic回归分析,结果见3-35。
表3-35分析结果表明:年龄、BMI是糖尿病患病的相关因素,且年龄每增长1岁,得糖尿病的危险性是原来的1.064倍,且BMI每增长1个单位,糖尿病的危险性是原来的1.085倍。
表3-35 糖尿病患病Logistic回归筛选分析结果