第九节 正交设计
一、概 念
正交设计(orthogonal design)是在析因设计的基础上发展起来的一种高效、快速的多因素实验设计方法,可同时检验两种及以上因素的独立效应及其交互作用。设计时利用一套规格化的正交表将各研究因素、水平之间的组合进行均匀搭配,选择部分有代表性的水平组合进行实验,通过对这部分实验结果的分析,了解全面实验的情况,找出最优的水平组合,从而减少实验次数,缩短实验周期。
正交设计与析因设计的区别:析因设计是全面试验, g个处理组是各因素各水平的全面组合;正交设计则是非全面试验, g个处理组是各因素各水平的部分组合,或称析因试验的部分实施。例如,对于有 A, B, C, D, E五个因素、每个因素为两水平的试验,按析因设计共有 g = 2 5 = 32个处理;但用正交设计,可选 实施方案,只有 g = 16次试验,或 实施,只有 g = 8次试验。由此可见,当实验因素较多时,采用正交设计可成倍地减少试验次数。但是也要注意,正交设计之所以能成倍地减少试验次数,是以牺牲分析各因素的部分或大部分交互作用为代价的。因此,在正交设计时要根据生物学和医学专业知识,只分析有意义的主效应和部分重要因素的一阶交互作用。
二、设计与应用
(一) 实验设计 1.正交表
正交表是合理安排实验因素,并对数据进行统计分析的主要工具。它根据各因素间的相互关系,挑选出若干必不可少的因素与水平,彼此搭配进行实验。每个正交表都有一个表头符号L N( m k), N表示试验次数即正交表的横行数, k表示最多可安排的因素个数(包括交互项因素)即正交表的纵列数, m表示各因素的水平数。下面以L 8(2 7)正交表为例说明正交表的组成及性质。
L 8(2 7)正交表由两个表组成。一个表是用来安排试验的,见表3-18,每一列都可以安排一个2水平的处理因素,最多可安排7个试验因素。例如,一个有7个研究因素,每一因素有2个水平的试验,析因设计试验共有128次实验,且不考虑交互作用;但是,使用正交设计就只需8次实验。从表3-18可知,1号实验,第1~7列所安排的因素均取1水平;2号实验第1~7列所安排的因素分别取1,1,1,2,2,2,2水平;…;8号实验第1~7列所安排的因素分别取2,2,1,2,1,1,2水平。可以看出正交表有两个特点:①同一列中各因素的水平数的出现次数相等;如表3-18中,1~7列的1和2均各出现4次;②任意两列同一横行中的数字呈有序的数对。在两水平正交表中数对共有4种:(1,1)、(1,2)、(2,1)、(2,2),每种数对出现的次数相等。这两个特点说明正交设计充分表现出它的对称性(分布均衡性),这种对称性既表现在每个因素各水平的对称,也表现在任意两个因素间的对称。正因为如此,用正交表安排实验,尽管只是部分试验,由于对称性,所以仍能得出代表性强的实验结果。
另一个表是表头设计表,见表3-19。当各因素间存在一阶交互作用(两个因素间的交互作用),必须按照表3-19安排试验。例如有 A, B, C, D四个因素,L 8(2 7)正交表的3、5、6列是用来分析一阶交互作用的,不能安排处理因素;第7列是用来分析 ABC二阶交互作用(三个因素间的交互作用)的;在不考虑二阶交互作用的假定下,第7列才能用来安排处理因素。因此,根据表头设计 A, B, C, D四个因素只能安排在L 8(2 7)正交表的1、2、4、7列。
表3-18 L 8(2 7)正交设计表
表3-19 L 8(2 7)正交设计表的表头设计
*:实施比例 = 1为析因设计试验,3个因素(2个水平)用8次试验;实施比例 = 1/2为正交设计试验,4个因素(2个水平)用8次试验。
2.正交实验设计的基本步骤
(1) 根据研究目的,确定观察指标;
(2) 拟定观察指标所有可能的影响因素及其水平数;各因素的水平可以相等,也可以不等,主要因素的水平可以多些,次要的可以少些,但一般情况下,各因素的水平数最好相同,且不要过多,常用2~4个水平;
(3) 根据专业知识确定各因素间是否存在交互作用及观察的交互项;
(4) 根据主客观条件,确定试验次数,如经费的多少,高精尖仪器的有无等;
(5) 综合上述情况选择各种规格化的正交表(见附录三)来安排试验。选用正交表时应注意:①先看水平数。若全是两个水平,可选用L 4(2 3)、L 8(2 7)、L 12(2 11)、L 16(2 15)等表;全是三水平,可选用L 9(3 4)、L 18(3 7)、L 27(3 13)等表;全是四水平,选L 16(4 5)、L 32(4 9)等表;全是五水平,选L 25(5 6)等表;五水平以上,可用正交拉丁方设计。若水平不等时,可选L 12(3 × 2 4)、L 16(4 2 × 2 9)等混合水平的正交表。②研究因素个数与交互作用个数的和不应超过正交表的总自由度(实验次数−1)。③根据实验要求选正交表。要求精度高,可选试验次数较多的正交表;要求精度不高或试验条件有困难时,可选试验次数少的正交表。要分析的交互作用多,可选用列号多的正交表。已知交互作用小,选列数少的正交表。④正交表中列的占用,若用方差分析且无重复试验,则至少要空一列以估计误差;若用直观分析粗略估计,可不空列;
(6) 根据已制好的表头设计(附录三),安排试验因素和交互作用在正交表各列的位置;
(7) 按表头设计要求进行试验,收集数据;
(8) 采用直观分析法或方差分析法或极差法分析数据,获得结论。
(二) 应用实例
正交设计在医学研究中的用途相当广泛,如寻找疗效好的药物配方、医疗仪器多个参数的优化组合、医疗产品的生产工艺、生物体的培养条件等。在具体操作上,也比析因设计简单。
例3-8
过氧乙酸是一种广泛用来杀灭肝炎病毒的消毒剂,但其有效成分极不稳定,以致影响消毒效果。可结合专业知识通过实验找出有关因素各水平(见表3-20)对其稳定性的影响,发现主要因素及其作用的大小,并从中选择各因素各水平的最佳组合,提炼出保持过氧乙酸稳定性的最优条件。请你作出正交设计实验。
表3-20 过氧乙酸稳定性实验研究的因素及水平安排
1.明确试验的目的,选定试验指标 本例旨在寻找提高过氧乙酸稳定性的最佳组合,反映该目的的指标是放置24小时后过氧乙酸残留量(mg/3ml)。
2.选定因素和水平 指标确定后,要分析影响该指标的因素,并进一步选择各因素合理的水平。这必须依赖于专业知识和实践经验。本例已选定了4个因素及每个因素的2个水平(见表3-20),须解决的具体问题是:①4个因素中,哪些对结果的影响较大,由此分析因素的主次;②各因素的2个水平中,哪个较好,比较各水平的优劣。
3.本例具有四个研究因素,各因素均为两个水平,结合专业知识考虑 A × B与 A × D存在一阶交互作用。
4.选定正交表安排试验 首先根据水平数选择表的类型,本例各水平均为2水平,故选用2水平正交表;其次根据因素个数及交互作用个数选择表的大小,本例有4个研究因素及2个交互作用,故选用的表至少有6列;根据研究因素个数与交互作用个数的和应小于实验次数−1,则试验次数应>7。综上可选用L 8(2 7)正交表。
5.在附录三中查L 8(2 7)正交表的表头设计(见表3-21),安排试验因素和交互作用在正交表各列的位置。 AB及 AD存在交互作用的情况下, A、 B、 C、 D只能安排在L 8(2 7)正交表的1、2、4、7列, A × B安排在3列, A × D安排在6列。
6.按表头设计要求进行试验 本例实验结果见表3-21,效应指标是计量资料,即放置24小时过氧乙酸残存量(mg/3ml),每个样品重复测定两次,取其“合计”值参与计算分析。
表3-21 过氧乙酸稳定性的L 8(2 7)正交试验研究实施及其结果
续表
7.可采用直观分析法或方差分析法或极差法分析数据。
三、资料分析原则
正交设计的分析有直观分析法、方差分析法和极差法三种,它们各自的特点见表3-22。此外,现在有许多正交设计软件,可以完成正交设计的分析。
表3-22 正交设计三种分析方法的比较
续表