第十节 重复测量设计

一、概  念
重复测量设计(repeated measures design)是医学研究领域中,针对同一受试对象某一效应指标在不同的场合下多次反复测量的一种常用的设计方法。受试对象包括正常人、患者、受试动物、离体组织与细胞等;场合多指不同的时间点或同一受试对象的不同部位。按此种设计方法所收集的资料称为重复测量资料(repeated measures data)。按不同时间点所收集的重复测量数据又称为追踪数据或纵向数据(longitudinal data)。
重复测量设计常用来研究干预措施对效应指标的时序性与量效性变化趋势。例如临床试验中,患者用药前或用药后不同时间点的效应;动物实验中,动物体内某项生理、生化指标在不同时间点的变化趋势;研究青、少年体格发育时,定期重复测量不同营养状态青少年体格发育指标(功能指标或形态指标)等。收集这类设计的资料进一步分析,动态观察药物的量效时间、持续时间;疾病的发展、转归、康复的趋势等。所以,重复测量设计方法主要是在单因素或多因素设计的基础上,将反复测量效应指标的时间作为研究因素纳入分析。
重复测量资料最常见的情况是前后测量设计(premeasure- postmeasure design)。它与配对设计的区别在于,配对设计是一对非处理因素基本相同的受试个体随机分配到两个处理组,两个受试个体同期测量效应指标;可以用配对资料的 t检验、 χ 2检验或秩和检验比较两个处理组间的差别。此处虽将两个同质的个体配成一对,但二者之间彼此独立,并无关联。前后测量设计的时间因素仅取两个水平(处理前后),每个个体只测量两次结果,是针对同一个体不能同期测量其效应指标,两次结果并不独立;因此,不能简单地套用配对资料的统计分析法,而需要按重复测量设计方法作统计学分析。
重复测量设计与随机区组设计的区别在于重复测量的时点不能随机分配给受试对象,时间因素仅为受试对象的伴随因素;各时点之间的效应指标存在相关关系。而随机区组设计的特征是区组内受试个体同质且彼此独立,他们通过随机化方法被分配到不同的处理组中。
二、设计与应用

(一) 实验设计

1.对照组在临床试验中具有举足轻重的地位,这是因为效应指标在无任何干预措施的条件下也会随时间的推移产生变化。例如疾病的自愈或症状的减轻等,因此,重复测量设计试验常设置平行对照组,其目的是充分暴露干预措施的作用。
2.研究因素的设置 重复测量设计最基本方法是要设置一个研究因素和一个时间因素,研究因素可以施加干预并将受试对象进行随机化分组。时间因素的水平设置依据专业知识确定。为便于统计学分析,要求每个受试对象的重复测量时间点必须相同,测量时间间距可按等差或等比级数划分。
3.随机化分组方法 按研究因素与水平将 n个受试对象随机分配到 g个处理组(水平组, g≥2);每个受试对象按重复测量的水平变化固定顺序重复测量 t次( t≥2)。

(二) 应用实例 例3-9

资料见表3-23。
表3-23 实验狗服药后在不同时点血中药物浓度的测定结果
本例设置有两个因素:研究因素为受试对象的性别因素;时间因素为3个不同的时间点,同一受试对象在不同3个时间点分别重复测量3次血药浓度,研究目的是了解不同性别的实验狗在不同时间点中血药浓度有无差异,设计方法为完全随机分组的重复测量设计。效应指标为定量的血药浓度(r/ml)。

例3-10

为研究某食物对血清胆固醇浓度的影响,选择14只窝别、性别和体重基本相同的兔子,随机分成两组,分别喂以正常食物与待研究食物;在实验前,喂养5、10周后,各取血样测量其中胆固醇含量(mmol/L),经用自然对数转换后的资料见表3-24,试分析本次研究的实验设计类型。
表3-24 两组家兔血清胆固醇含量(mmol/L,自然对数值)的比较
本例设置有两个因素,研究因素为喂养实验兔两种不同的食物(两水平)。时间因素为3个不同的时间点(三水平),时距相等均为5周,同一实验兔在不同三个时间点重复测量3次血清胆固醇含量。研究目的是了解不同食物对实验兔不同时间点中血清胆固醇含量有无影响。实验设计类型是完全随机分组的重复测量设计。效应指标为定量的胆固醇含量(mmol/L)。
三、资料分析原则
重复测量数据的统计分析方法有重复测量设计的方差分析、混合效应模型和多水平模型分析等。
1.如果数据经检验符合正态性、方差齐性,且满足“球对称”(sphericity)假设,则可选用重复设计测量资料的方差分析法,此法可检验各因素各水平、时间因素各水平的效应指标差别有无统计学意义,研究因素与时间因素之间的交互作用有无统计学意义。
2.如果数据属于非正态分布或方差不齐,可采用变量变换,满足条件后再进行方差分析。
3.在重复测量设计中,受试者的每一次测量可以看成同一水平的测量资料;受试者或受试者的特征可以看成比每次测量高一水平的测量资料。由于同一受试者的每次测量结果之间存在相关,因此用多重线性回归或Logistic回归等传统方法分析会低估受试者或受试者的特征所致效应的标准误,导致统计分析结果偏倚。现在基于线性混合模型的多水平模型分析可以阐明这些复杂关系,给出不同水平影响因素的正确估计值。因此,重复测量数据的最常用统计分析方法为多水平模型方法。