第二节 常用的优化方法

相比较于单因素试验设计,多因素试验设计更适用于化学分析中常见的多因素多水平的试验研究。本节介绍几种常用的试验设计方法。

一、析因试验设计

析因试验设计是指按析因设计表设计试验方案,考察各因素的主效应及其因素间交互效应的试验设计方法。析因试验设计属于全面试验,考察各试验因素水平的所有组合对试验指标的影响。以两水平的析因试验设计为例,若考察m个试验因素,且每个试验因素取高、低两个水平,需要完成n次试验,其析因试验设计表可用FDn(2m)来表示(表4-1和表4-2)。若m=3,即考察3个试验因素,每个因素取两个水平,试验次数为23=8。析因试验设计中,若考察的试验因素或水平数较多时,试验次数会显著增加。如一个4因素5水平的析因试验设计,试验次数为54=625。因此,析因试验设计较适用于试验因素及其水平数较少的试验设计,如两个因素的析因试验设计。若试验因素或水平数较多时,为减少试验次数,可采用部分析因试验设计的方法,即只对各试验因素水平的所有组合中的一部分组合进行试验。

表4-1 析因设计表FD4(22

表4-2 析因设计表FD8(23

析因试验设计可以考察各因素的主效应及其因素间的交互效应。主效应是指某单一试验因素对试验指标的影响程度。交互效应是指若某一个试验因素(A)对试验指标的影响与另一个试验因素(B)的水平有关,则这两个试验因素间存在交互效应。若不论因素A的取值如何,因素B对试验指标的影响都相同,则这两个试验因素间不存在交互效应。

表4-1是一个两因素两水平的析因试验设计表。表中的第二列可用于考察各试验因素对试验指标的平均影响,第三和第四列可分别考察因素A和因素B对试验指标的影响,第五列可用于考察A、B间的交互效应。表中的“+”“-”分别表示A、B两个因素的高水平和低水平,该设计需要完成4次试验。表4-2所示为三因素两水平的析因试验设计表,可分别考察因素A、B、C对试验指标的影响及三因素间的交互效应。

析因试验设计的数学模型可用多项式来表示。以xi表示各试验因素,y表示试验指标,依据yxi的关系式可计算各因素对试验指标的影响及因素间的交互效应。以两因素(A和B)两水平的析因试验为例,试验指标yxi的关系可表示为:

y=β0+β1x1+β2x2+β12x1x2

式中的β0可反映A和B对试验指标的平均影响;β1β2可分别反映A和B对试验指标的影响;β12可反映A、B间的交互效应。同理,三因素(A、B、C)两水平的析因试验中,yxi的关系可表示为:

y=β0+β1x1+β2x2+β3x3+β12x1x2+β13x1x3+β23x2x3+β123x1x2x3

应用析因试验设计时,首先可依据预试验结果确定试验因素及其水平。其后选择一个合适的析因设计表安排试验,根据试验结果分析各因素的主效应及各因素间的交互效应。

例如:应用高效液相色谱法分析两种维生素。试验中发现,流动相中有机溶剂与盐溶液的配比(A)、流动相的pH(B)以及盐溶液的浓度(C)对组分的分离度均有影响。若采用析因试验设计法考察上述三因素对分离度的影响,每个因素安排高(+)、低(-)两个水平,可选择析因设计表FD8(23)安排试验(表4-3)。因素A的高、低两个水平分别为3∶1和2∶1,因素B的两个水平分别为5.11和4.57,因素C的两个水平分别为0.05mol/L和0.01mol/L。以分离度(y)作为试验指标。

表4-3 高效液相色谱法分离维生素的析因试验结果

各因素的主效应及各因素间的交互效应可按下式计算:

由A、B、C三因素的主效应的计算结果可以看出,A和B的主效应均为负值,C的主效应为正值,说明三因素中A和B取低水平、C取高水平时更有利于两种维生素的分离,因素A对分离度的影响最大,且三因素间均存在交互作用。A、B和B、C间的交互作用均为负值,即其中一个因素由低水平变化到高水平时,会减弱另一因素对分离度的影响。

二、正交试验设计和均匀试验设计

(一)正交试验设计

用正交表安排试验并对试验结果进行数据分析而获得最优试验条件的方法称为正交试验设计法。正交表具有均匀分散、搭配均衡、整齐可比的特性,可用Lntm)表示。其中L表示正交表,n表示需要完成的试验次数,t表示试验因素的水平数,m表示最多允许安排的试验因素的个数。正交试验设计属于部分因子设计,可用于考察各因素的主效应及各因素间的交互效应。

对于正交试验的结果,可通过极差分析比较各因素对试验指标的贡献。以正交表L9(34)(表4-4)为例,首先分别计算各因素取水平1、水平2、水平3时的试验指标之和,以T1T2T3表示。其次计算T1T2T3的平均值,以k1k2k3表示。再计算各因素的k1k2k3中最大值与最小值之差(极差)。比较各因素的极差可对各因素对试验指标的贡献程度进行排序。选出各因素的k1k2k3中数值最大者对应的水平,可求得各因素优化的水平组合。按照选出的各因素优化的水平组合进行试验,可验证极差分析的结果。

表4-4 正交表L9(34

应用极差分析无法确定各因素对试验指标影响的差异是否具有统计学意义。此时可采用方差分析处理正交试验的结果。方差分析是指通过计算各因素对试验指标影响的方差及各因素的F值,判断各因素对试验指标影响的差异是否具有统计学意义。

表4-5中,第2、3、5、8列可分别考察A、B、C、D四因素对试验指标的影响,表中第4、6、7列可分别考察因素A×B、A×C及B×C间的交互作用,此设计共须完成8次试验。由表4-5可知,表中每个因素只安排了两个水平,且未考察因素A×D、B×D、C×D、A×B×C、A×B×D、B×C×D及A×B×C×D间的交互作用。显然如果增加考察的因素和水平数,相应的试验次数也会明显增加。而化学试验研究中需要考察的试验因素的水平数大多不止两个,因此正交试验设计更适用于因素水平数相对较少的试验研究。

表4-5 正交表L8(27

(二)均匀试验设计

均匀试验设计是在正交试验设计的基础上发展而成的一种试验设计方法,保留了正交试验设计均匀分散的特性,即在试验范围内考虑试验点的均匀散布以获得最多的试验信息。与析因试验设计和正交试验设计相同,均匀试验设计也属于同时试验的方法,可参照均匀设计表来安排试验。均匀设计表可用Unqs)表示。其中U表示均匀设计表,n表示试验次数,q表示因素的水平数,s表示最多可安排的因素数。均匀设计表中因素的水平数q等于试验次数n。每个均匀设计表同时附有一张使用表,可按照需要考察的因素数选取使用表中的某几列来安排试验。

应用正交试验设计时,需要进行的试验次数至少为因素水平数的平方,以每个因素安排7个水平为例,应用正交试验设计至少需要完成72=49次试验。而应用均匀试验设计可明显减少工作量。如考察四因素,每个因素安排7个水平,只须完成7次试验(表4-6)。因此相较于析因试验设计和正交试验设计,均匀试验设计更适用于多因素多水平的试验研究。

实际工作中,可依据需要考察的因素及其水平数选择适合的均匀设计表,并参照其使用表安排试验。同时对试验结果进行统计分析,建立各因素与试验指标间的函数关系式,判断各因素对试验指标贡献的大小及各因素间是否存在交互作用。同时可求得使试验指标获得最优值时的试验条件。

表4-6 均匀设计表U7(74

例如:采用磺基水杨酸分光光度法测定抗坏血酸。以在反应体系中加入的磺基水杨酸溶液(x1)、Fe3+溶液(x2)、缓冲溶液的用量(x3)以及显色时间(x4)为试验因素。x1的取值为:0.70~10.90ml;x2的取值为:0.75~5.00ml;x3的取值为:4.00~14.20ml;x4的取值为:15~100分钟。以吸光度(y)为试验指标,选择均匀设计表U18*(1811)并参照其使用表安排试验(表4-7)。

表4-7 抗坏血酸测定的均匀试验结果

比较表4-7中的18次试验结果可发现,第6号和第7号试验测得的吸光度值较大。进一步采用SAS统计软件对试验结果进行统计分析,可得吸光度与各因素的关系式:

y=-0.1303-0.0070x1+0.5359x2-0.0007x12-0.0720x22+0.0040x1x2

结果表明,四因素中Fe3+溶液用量(x2)为主要影响因素,磺基水杨酸溶液用量(x1)为次要因素。缓冲溶液用量(x3)和显色时间(x4)对试验结果的影响较小,未进入回归方程。统计结果还表明,当Fe3+溶液用量为3.88ml,磺基水杨酸溶液用量为6.09ml时,预测吸光度值可达最大值0.8891。可按照上述试验条件进行试验,以验证统计分析的结果。

三、序贯优化方法

单纯形试验设计是一种典型的序贯试验的方法,即先进行若干次的试验,之后,分析取得的试验结果以确定下一步优化的方向,是一种“黑箱”式的试验设计方法。

单纯形是指在n维空间中具有n+1个顶点的凸多面体。在一维空间中,单纯形是一条直线。在二维空间中,单纯形是一个三角形。在三维空间中,单纯形是一个四面体。其中各个棱长都相等的单纯形称为正规单纯形。二维空间中的等边三角形和三维空间中的正四面体即为正规单纯形。

单纯形试验设计法是按照单纯形来设计试验,因此,首先需要构建初始单纯形。初始单纯形的构建可以有多种方法。其一,依据一个给定的顶点和步长,构造一个正规初始单纯形。其二,按照黄金分割法构建初始单纯形。其三,应用均匀设计表构建初始单纯形。

按照第一种方法构建初始单纯形时,需要先依据已有的试验经验和化学知识确定一个顶点(以x1表示),x1α1α2α3,…,αm)中的αi代表要考察的m个试验因素的某一个起始水平。其后,依据经验为每一个因素选定一个合适的步长(即考察试验因素对试验指标的影响时,因素从起始水平移动的幅度)。如此可构建一个初始单纯形。

按照黄金分割法构建初始单纯形时,可在各因素的取值范围内将每个因素分成两个水平:水平1:0.382水平;水平2:0.618水平。然后计算这两个水平的平均值作为中间水平。依据一定的规则构建初始单纯形。

应用均匀设计表构建初始单纯形时,可按照试验需要考察的因素和水平数,选择适合的均匀设计表,按照表中对因素、水平的安排,填入均匀设计表,构建初始单纯形。

初始单纯形确定之后即可开始单纯形的优化。单纯形的优化过程从初始的n+1个顶点开始。其后比较初始的n+1次试验的结果,去掉试验结果中最差的试验点,增加新的可能改善试验结果的试验点。单纯形的优化就是将初始单纯形经过反射、扩展、收缩等一系列的变化,其间不断构建新的单纯形,最终找到使试验结果最佳的试验点,求得各因素的最优水平组合。

试验中若需要考察n个试验因素,首先可按照上述方法构建含有n+1个顶点的初始单纯形。其后按照各顶点的坐标进行n+1次试验。以最简单的两个因素的单纯形试验设计为例,首先构建初始单纯形(一个三角形),三角形的三个顶点的坐标即对应于初始的3次试验中两个因素的不同水平。完成3次试验后,比较其试验结果。以xW表示试验结果中的最坏点,xBxN分别表示试验结果中的最好点和次坏点。计算去掉xW后的各试验点的重心xG,求得一个新的试验点即最坏点xW的反射点xRxR=xG+αxG-xW)。式中的α为反射系数,一般取值为1,即xR=2xG-xW。由求得的新试验点xR与去掉最坏点后剩余的试验点xBxN构成新单纯形,再比较新单纯形中各试验点的试验结果。

在构建的新单纯形中,若反射点xR的试验结果好于xB,是最好点,说明寻优方向正确,可通过计算求得又一个新试验点xExE=xG+γ(xG-xW),式中的γ为扩展系数,一般取值为2,即xE=3xG-2xW。若xE的试验结果好于xR,可由求得的新试验点xExBxN构成新单纯形继续试验。

在新单纯形中,若反射点xR的试验结果介于xWxN之间,说明需要调整寻优方向,可通过计算求得一个新试验点xPxP=xG+βPxG-xW),式中的βP为收缩系数,一般取值为0.5,即xP=1.5xG-0.5xW。若xP的试验结果好于xR,可由求得的新试验点xPxBxN构成新单纯形继续试验。若xP的试验结果比xR差,则需要对原单纯形进行整体收缩再进行试验。

在新单纯形中,若得到的反射点xR的试验结果比原有的最坏点xW还差,则应选取新试验点xAxA=xG+βAxG-xW),式中的βA一般取值为-0.5,即xa=0.5xG+0.5xW。其后比较新试验点xA与最坏点xW的试验结果,若xA的试验结果好于xW,可由求得的新试验点xAxBxN构成新单纯形继续试验。若xA的试验结果比xW差,同样需要对原单纯形进行整体收缩再安排试验。

应用单纯形试验设计时,若最终得到的单纯形中最好点与最坏点的试验结果相同或差异在允许的误差范围内,则单纯形试验结束,对应的单纯形中各顶点的坐标即为各因素的最佳水平。

四、应用

正交试验设计是卫生分析工作中常用的试验设计方法之一,可应用于样品预处理条件以及仪器工作条件的优化。

(一)在优化试验条件中的应用

卫生分析工作中,对试验条件进行优化可有效提高分析结果的灵敏度。预防医学领域中,可通过测量生物材料中某物质的含量来了解该物质可能对人体健康产生的影响。这其中,能否对生物材料中该物质进行有效的提取会直接影响到测量结果的准确度与灵敏度。

例如:采用高效液相色谱法测定小鼠组织中某物质的含量,使用有机溶剂萃取的方法对样品进行预处理。试验过程中发现,对该物质提取效率影响较大的有两种萃取试剂的体积比(A)、萃取试剂加入的体积(B)、涡旋混匀时间(C)和离心时间(D)。为提高提取效率,采用正交试验设计法优化上述试验因素的水平组合。A的取值为:A1=1∶1,A2=1∶2,A3=2∶1。B的取值为:B1=200μl,B2=300μl,B3=400μl。C的取值为:C1=2分钟,C2=3分钟,C3=4分钟。D的取值为:D1=5分钟,D2=10分钟,D3=15分钟,色谱峰面积(y)为试验指标,按L9(34)正交表安排试验(表4-8)。

对试验结果的极差直观分析结果表明,四因素对色谱峰面积的影响大小排序为:A>D>B>C,优化水平组合为A2B3C2D1。9次正交试验中第3号和第5号试验所得的色谱峰面积较大,其对应的水平组合分别为A1B3C3D3和A2B2C3D1。三组因素水平组合不一致,可参照极差分析所得的组合A2B3C2D1做进一步的验证性试验。

(二)在光谱法中的应用

卫生分析工作中,采用仪器分析的方法对物质进行定性和定量分析。这其中,仪器工作条件的优化也是分析工作中很重要的一个环节。

表4-8 峰面积的正交试验结果

例如:应用火焰原子吸收光谱法对某元素进行分析,灯电流、狭缝宽度、乙炔流量和燃烧器高度都可能影响其吸光度的大小。为优化仪器工作条件,以A、B、C、D表示上述四个因素,吸光度(y)为试验指标,选择正交表L9(34)考察四因素对试验指标的贡献度(表4-9)。

表4-9 吸光度的正交试验结果

续表

极差的直观分析结果表明,灯电流为吸光度的主要影响因素,狭缝宽度、乙炔流量和燃烧器高度对吸光度的影响相对较小,因素水平组合为A2B2C1D1。已做的9次试验中第4号及第8号试验的吸光度值较大,因素搭配水平分别为A2B1C2D3和A3B2C1D3。可针对这三种因素搭配水平做进一步的验证性试验。

(三)在色谱法中的应用

色谱分析中,分离度是评价分离效能的重要指标,相邻组分的分离程度可直接影响被测组分的准确定量。因此分离条件的选择是色谱分析法中十分重要的一项工作内容。高效液相色谱法中,固定相的选择、流动相的组成、流速及柱温等对组分的分离度都可能产生影响。

例如:应用高效液相色谱法测定两种单胺类物质。试验中发现,流动相中乙腈和醋酸钠溶液的配比(A)、流动相的pH(B)、醋酸钠溶液的浓度(C)以及柱温(D)对组分的分离度均有影响。采用正交表L9(34)安排试验(表4-10)。A的取值为:A1=1∶1,A2=1∶2,A3=1∶3。B的取值为:B1=4.0,B2=4.8,B3=5.6。C的取值为:C1=0.02mol/L,C2=0.03mol/L,C3=0.04mol/L。D的取值为:D1=25℃,D2=30℃,D3=35℃,分离度(y)作为试验指标。

表4-10 分离度的正交试验结果

续表

极差的直观分析结果表明,乙腈和醋酸钠溶液的配比及醋酸钠溶液的浓度对组分分离度的影响大,柱温及流动相的pH对分离度的影响相对较小,优化的因素水平组合为A1B2C1D2。9次正交试验结果中第1号和第2号试验的分离度的试验结果较好,因素水平组合分别为A1B1C1D1和A1B2C2D2。可做进一步的验证性试验,验证极差分析的结果。

应用试验设计的方法优化试验条件时,试验因素及其水平的选择与确定对于是否能通过试验设计找到最优化的试验条件十分重要。特别是在考察的因素及水平数较少的情况下,若因素水平选择不当,因素的取值范围内未包括最佳的试验条件,则很难获得满意的试验结果。