第三节 研究误差及其控制

误差是指原始数据及其统计指标与真实情况之间的差别。在医学科研活动中,由于研究对象的个体差异、内外环境因素的影响,研究样本的有限性,观察、测量技术的限制,可能会出现研究结果偏离了客观真实的情况。

一、误差的分类及其影响

(一)研究结果的真实性与可靠性

1.真实性(validity) 是指测量值与实际值相符合的程度,即所得结果能反映观测对象或推论对象真实情况的程度。

2.可靠性(reliability) 是相同条件下用某测量工具重复测量同一受试者时获得相同结果的稳定程度。影响可靠性的因素主要包括研究对象的生物学变异、观察者变异和试验方法的差异。

(二)误差的分类

误差就其来源和性质的不同,可归纳为两类,即随机误差和系统误差。

1.随机误差(random error) 是由于无法控制且不能预测的因素所引起的一类表现不恒定、随机变化的误差。主要包括随机测量误差和随机抽样误差。前者是在排除了系统误差后仍然存在的,由偶然因素引起的不易控制的差异;后者是由于随机抽样所引起的样本统计量与总体参数间的差异以及各样本统计量之间的差异。

2.系统误差(systematic error) 是指研究过程中,由一些已知或可控制的因素引起的使研究结果或推论系统地偏离真实情况的误差。研究结果倾向性地偏离真值,表现为恒定偏大或偏小,或周期性变化,也称偏倚(bias)。

(三)误差对研究结果的影响

随机误差主要影响研究结果的可靠性,系统误差则主要影响研究结果的真实性。

1.随机误差的影响 随机误差制约着研究结果的可靠性,主要由研究中的一些不可控制的因素或抽样所引起。随机误差对研究结果的影响还表现在假阳性和假阴性错误上。

2.系统误差的影响 系统误差主要是影响研究结果的真实性。由于某种因素如实验方法不当、仪器不准、试剂不同、调查者主观偏见、操作人员不熟练等原因所引起的确定性误差,表现为研究结果有规律性的偏离真实结果,有方向性。

二、随机误差及其控制

(一)随机误差的来源

1.测量工具产生的随机变异 是指在同样条件下,用同一方法对同一研究对象的某项指标重复进行测量,在极力控制或消除系统误差后,每次测量结果仍会出现差异的现象。随机测量误差是不可避免的,没有固定倾向,而是有高有低。

2.个体间的随机变异 医学研究不可能对总体中的每个个体都进行观察或测量,常通过对样本中每个个体的观察或测量的结果来推论总体。由于生物间个体差异的存在,抽得的样本指标并不恰好等于总体指标,这种在抽样过程中所造成的样本指标与总体指标间的差异,是抽样误差。

3.个体内的随机生物学变异 指在稳定的机体状态下,排除已知可能外环境影响因素后依然存在的随机变异。如血压值在同一个体内的不同时间点进行测量,其值的大小也存在差异,这种差异是由于个体内的生物学因素所引起。

(二)随机误差的估计

用统计学方法进行估计或测量,样本资料的随机误差用统计学指标中的变异系数或标准误来估计。如果是多组比较的研究,必须进行统计学显著性检验以估计随机误差的大小,如统计学显著性检验显示组间差异具有统计学意义(P<0.05)。

(三)随机误差的控制

1.研究设计阶段 

(1)改善研究设计和抽样方案 在研究设计阶段,根据研究目的对研究对象制订出科学合理的选择和排除标准,如果研究对象是某疾病的患者,还要采用公认的诊断标准来选择对象,以提高样本的代表性而减少抽样误差。在设计时还需合理运用各种抽样方案来控制抽样误差。常用的抽样方案主要包括简单随机抽样、系统抽样、分层抽样、整群抽样和多级抽样。

(2)科学估计样本含量 在研究设计时需要根据研究目的及精确度的要求,在保证研究结论具有一定可靠性的条件下,应用一定的统计学方法科学地确定样本含量数,合理地控制抽样误差。

2.实施阶段 为控制随机误差的影响,应在研究实施阶段严格控制测量条件,尽量使每次测量时的各种因素保持相近,提高研究结果的可靠性。主要措施包括:

(1)随机化 在选择样本时,遵循随机化的原则,使研究样本更具有代表性。

(2)改善测量方法 选择符合要求的测量方法,制订标准化的测量操作规程,测量前仪器的校正等。

(3)统一测量时间 在科研的实施阶段,在相同时间对研究对象进行调查或测量,均有利于减少研究对象个体内生物学变异引起的随机误差。

(4)重复测量或实验 按照统一的标准进行多次重复测量或实验。

3.资料分析阶段 在资料分析阶段,对研究结果进行统计学残差分析,并计算测量结果的平均值、标准误及其总体参数的置信区间,来估计随机误差。

三、偏倚及其控制

偏倚(bias)是指在研究的设计、实施、分析等阶段发生的系统误差。由于某种因素的影响,使得研究或推论结果与真实情况存在系统误差,在研究或推论过程中所获得的结果系统地偏离其真实值。

(一)偏倚的分类

医学研究从研究设计、实施、分析和推论过程中均可能发生偏倚,根据其产生的原因和阶段,常见的偏倚有三大类:选择偏倚(selection bias)、信息偏倚(information bias)和混杂偏倚(confounding bias)。

1.选择偏倚 指在确定研究对象时出现的系统误差,主要发生在研究的设计阶段。由于研究对象的选择方式不当,导致入选对象与未入选对象在与研究结局有关的特征上存在差异,使得研究样本不能代表总体而造成的系统误差。常见的选择偏倚有由于非随机抽样所致的偏倚;参与者引起的不应答偏倚、志愿者偏倚、失访偏倚,及病例确认不恰当所致的入院率偏倚、新发病例和现患病例偏倚、检出症候偏倚、时间效应偏倚、领先时间偏倚等。

2.信息偏倚 又称测量偏倚或观察偏倚,是指在研究的实施阶段,在进行资料收集、整理、编码和分析过程中出现的系统误差,如资料收集不完整、仪器测量不准确等,造成对研究对象的暴露程度或疾病结果的错误归类,影响了结果估计的真实性。信息偏倚可来自于研究者、研究对象和测量工具。研究者本身可由于不恰当的观察或访问、偏性随访、错误的资料编码和分析以及结果的解释与发表等原因产生信息偏倚;研究对象可因为回忆或报告不准确而产生信息偏倚;而测量工具的不准确亦可导致信息偏倚。根据导致信息不准确的原因,信息偏倚可分为回忆偏倚、报告偏倚和测量偏倚等。

3.混杂偏倚(confounding bias) 当研究某暴露因素与疾病之间的关系时,由于某个既与所研究的疾病有联系,又与所研究的暴露因素有联系的其他因素的影响,掩盖或夸大了所研究的暴露与疾病的联系,这种现象称为混杂,而由其产生的偏倚称为混杂偏倚,引起混杂偏倚的因素称为混杂因子。混杂是医学研究设计中一个不容忽视的问题,在混杂存在的情况下,估计的暴露因素与疾病间的联系强度本质上是暴露因素与混杂因素的混合效应,是对真实联系的有偏估计。

(二)医学研究中的偏倚

在调查研究中,按照是否存在研究者主动施加的干预措施可分为观察性研究和试验/实验性研究两大类。这些研究方法在设计、实施、分析阶段均可能出现各种各样的偏倚。

1.观察性研究中的常见偏倚 观察性研究是指有目的地观察或测量自然状态下研究对象某结果事件的发生状况,并通过描述或对比分析发现该事件的分布特点或差异,从而获得研究结论的一类研究,如生态学研究、横断面研究、病例对照研究和队列研究等。

(1)入院率偏倚(admission rate bias) 也称伯克森偏倚,是指利用医院门诊或住院患者为研究对象时,由于入院率的不同而造成的偏差,由J.Berkson于1946年提出。由于医院的技术专长、患者所患疾病的严重程度、患者的经济状况、就诊的方便程度、离医院的远近等因素影响,患者对医院以及医院对患者都有一定的选择性而导致入院率不同。

(2)现患病例-新发病例偏倚(prevalence-incidence bias) 又称奈曼偏倚,在病例对照研究或现况研究中,用于研究的病例一般是研究时的现患病例而较少新发病例或死亡病例。但由于存活病例(包括现患和新发病例)与死亡病例间、现患病例和新发病例间在所研究的因素方面往往存在系统差异,产生的偏倚即为现患病例-新发病例偏倚。

(3)检出症候偏倚(detection signal bias) 又称检出偏倚,是指某种因素与疾病虽然没有因果联系,但由于这种因素的存在,可引起或促进了该疾病相关的症状和体征出现,从而使患者及早就医,接受多种检查,使得该人群有较高的检出率并有更大的可能被选择性地纳入研究。此时如果进行以医院人群为基础的研究,则被选入的研究对象在某些研究特征上同未被选入的对象间存在系统差别而导致偏倚。如病例对照研究中的病例主要为有检出症候者,而对照来自产生所有病例(包括有检出症候和无检出症候病例)的人群时,则通常会夸大暴露的危险性,从而得出该因素与该疾病相关联的错误结论。

(4)无应答偏倚(non-response bias) 是指研究对象中没有按研究设计要求对被调查的内容予以应答,当无应答者的身体素质、暴露状况、患病情况、嗜好等与应答者有明显不同时,由此而产生的偏倚称为无应答偏倚。

(5)志愿者偏倚(volunteer bias) 在选择志愿者进行观察性研究时,由于纳入的对象一般都是对健康十分关心而乐于参加研究的个体,导致其对调查内容的感兴趣程度与一般人群存在系统差异而出现的偏倚,称为志愿者偏倚。

(6)回忆偏倚(recall bias) 是指研究对象在回忆以往发生的事情或经历时,由于记忆失真或不完整而造成的比较组间的系统差异,多发生于病例对照研究和回顾性队列研究中。如事件发生回忆不清、调查时研究对象对所调查事情的关心程度不同、调查对象对所调查内容的理解不同等,造成对研究结果的有偏估计。

(7)报告偏倚(reporting bias) 指被调查对象有意夸大或隐瞒某些信息,或者调查者在调查时进行个人倾向性的诱导性调查而导致了对疾病或暴露程度的错误分类所产生的偏倚。例如,肺癌患者在调查时可能不愿承认吸烟与其发生肺癌有关而故意不报告其真实的吸烟情况,对暴露史的错分而低估吸烟与肺癌的联系。

(8)诊断怀疑偏倚(diagnostic suspicion bias) 在队列研究中,由于研究者期望得到阳性结果,如果事先已认为某因素的暴露可能与疾病有关联,则可能对在暴露组人群进行疾病诊断时,采取了带有主观倾向性的判断,检查得比较仔细,而对非暴露组或对照组则不然,由此导致的系统误差。

(9)暴露怀疑偏倚(exposure suspicion bias) 主要发生在病例对照研究中,由于怀疑疾病与某暴露因素有关,研究者在对病例组进行某因素暴露史调查时会更仔细、认真,而对对照组的调查则漫不经心,从而导致暴露怀疑偏倚。

(10)测量偏倚(measurement bias) 指由于调查表的设计缺陷、记录不完整,调查员询问方式和态度不同而使研究结果系统地偏离其真值的现象。

(11)混杂偏倚(confounding bias) 在观察性研究中,由于研究者不能对研究对象进行随机化处理,也不能控制研究条件。因此,可能存在较多影响研究结果的混杂因素,而产生混杂偏倚。

2.试验/实验性研究中的常见偏倚 指在研究者的控制下,对研究对象施加或消除某种因素或措施,以观察此因素或措施对研究对象影响的一类研究,如临床试验、现场试验、社区干预试验和动物实验。在试验/实验性研究中,研究者能够主动控制研究条件,使研究对象更具有可比性,因而产生的偏倚相对于观察性研究会少些。常见的偏倚主要有:

(1)向均数回归(regression to the mean) 在干预性研究中,一些具有极端临床症状、体征或化验指标的患者,即使不进行治疗处理,在其后的连续测量中,这些指标也有向正常值趋近的现象。

(2)霍桑效应(Hawthorne effect) 指那些意识到自己正在被别人观察的个体具有改变自己行为的倾向。在干预性研究中,研究者对自己感兴趣的试验组的研究对象往往表现得更加关心,而受到特别关心的试验组对象由此产生某种心理变化,进而改变了他们的行为,可能夸大干预的效果,这种现象即是霍桑效应。它是一种心理效应,往往夸大试验性研究中的干预效果。

(3)安慰剂效应(placebo effect) 指患者虽然获得无效治疗,但却相信治疗有效而产生的一种正向心理效应,这种效应往往会使患者的症状得到缓解甚至得到治愈。安慰剂效应一般是因为患者相信某种干预一定有效,而在接受了外型、颜色与该干预措施相同或相似但没有效果的假干预,即安慰剂后产生的正向心理效应,可表现为一定的干预效应,但这种心理效应并不是干预措施的真正效应。安慰剂效应在研究中往往夸大干预效果。

(4)干扰(intervention) 指在干预性研究中,试/实验组或对照组额外地接受了与干预措施干预效应相同的其他处理,从而夸大或缩小干预效果的现象。如果研究中只是试/实验组对象接受了“干扰”的处理,则引起试/实验组与对照组的效应差增大,表现夸大干预效果;反之,如果对照组接受“干扰”的处理,则主要是减小试/实验组与对照组的效应差,表现为缩小干预效果。

(5)沾染(contamination) 指对照组的研究对象额外地接受了与试/实验组对象相同的干预措施,造成夸大对照组效果的现象。沾染一般缩小了对照组与试/实验组的效应差,引起假阴性。

(6)失访偏倚(withdraw bias) 在研究中,由于观察时间较长,研究对象中有人不能坚持,或由于迁居、死亡,因药物副作用等而退出研究,这种现象称为失访。这种现象对研究结果的影响称为失访偏倚。

(三)偏倚的控制

研究者应充分意识到研究过程中可能产生的各类偏倚,并通过周密的设计、实施和分析加以控制,把偏倚降低到最低程度,使研究结果具有较高的真实性。

1.研究设计阶段

(1)选择适宜的设计方案 在研究初始组成具有良好可比性的观察组和对照组十分重要,是控制偏倚最关键的阶段。如采用随机对照试验设计的研究方案,特别是将适合的研究对象分层后再随机分配入组,可以确保比较组间基线特征相似,实现各比较组间的良好可比性,最大限度地避免偏倚的影响。

(2)随机化 采用随机化方法进行分组是消除选择性偏倚最好的方法,它不仅平衡了各比较组间各种已知的可能影响研究结果的因素,而且也平衡了各种我们不知道的可能影响研究结果的因素。真正的随机化分组是指每个研究对象都有同样的机会进入各个比较组。

(3)限制 指在研究设计时,针对某一潜在的混杂因素对研究对象的入选条件加以限制,以排除它们的影响。

(4)匹配 就是在设计研究对象的选择方案时,采用个体匹配或者频数匹配的方式使某些可疑混杂因素在比较组间均匀分布。匹配是控制甚至消除某个(些)混杂因素的常用方法,常用于病例对照研究或试/实验性研究中。但应注意不能将研究因素作为配对条件。实际研究中匹配因素过多更会造成选择对象的困难,使研究无法找到足够的配对者而难于进行,这称过度匹配。

(5)采用多种对照 病例-对照研究中,理想的研究对象应是人群中的全部病例和非病例,或其有代表性的样本,但往往很难做到。在医院选择研究对象虽然易产生入院率偏倚,但由于方便、易行、应答率高,在实际工作中常常采用。此时最好选用两个或两个以上的对照组,如不同病种对照,其中之一最好选自一般人群,通过比较不同对照组的结果,判断是否存在选择偏倚,估计结果的真实性。

2.研究实施阶段

(1)严格遵守设计方案 研究实施过程应按照事先确定的设计方案来执行,如按照方案中规定的标准选择研究对象,对合格对象进行随机化分组等。确需要对研究方案进行调整时,需经过专家委员会讨论。

(2)采用盲法收集资料 指在收集资料时,研究者或研究对象不知道具体的分组情况和研究目的,以消除研究者或研究对象的主观心理因素的影响。盲法是消除测量性偏倚的有效方法,可避免报告偏倚、诊断怀疑偏倚和暴露怀疑偏倚。

(3)提高应答率 在实施阶段,采取相应措施尽量取得研究对象的合作,减少失访现象,提高应答率。

(4)校准测量工具 在调查和测量前,要评价调查问卷的信度与效度;选取符合设计要求的测量工具并进行校正,统一测量方法。

(5)统一调查方法,注重调查技巧 进行调查前,要对调查员进行严格的培训,正确理解调查的目的与意义,明确判断标准,严格按设计的要求、方法等进行调查和复核。对于敏感性问题,可通过随机应答技术等手段进行调查以提高资料的真实性。

3.资料分析阶段

(1)整理和分析资料 资料分析前,对资料进行审核、修正,缺失数据的检查与填补等资料整理时,应采用盲法。资料整理结束后,进行数据分析时也应隐藏研究对象的组别信息以克服统计分析人员的主观偏倚。

(2)分层分析 指将科研资料按某些影响因素分成亚组进行分析。分层分析是资料分析阶段控制混杂偏倚的最常用方法,在分析阶段分层,既可显示不同特征研究对象的真实效果,又能显示出重要的混杂性偏倚因素。

(3)多因素分析 多因素分析方法主要包括广义线性模型如Logistic回归模型、Cox模型和对数线性模型,广义线性混合效应模型和线性混合效应模型等。采用多因素分析方法进行分析是控制混杂因素的一种较理想的手段。