- 现代卫生化学(第3版)
- 康维钧 毋福海 孙成均 顾海鹰主编
- 11116字
- 2022-04-22 16:40:11
第四节 分析工作质量保证
从实验室质量管理角度出发,要求分析测试所得数据应具有代表性、准确性、精密性、可比性和完整性,能够准确地反映实际情况,为产品质量评价、生产控制、科学研究和行政管理等提供可靠依据。
质量保证(quality assurance,QA)是一项技术与管理工作,它贯穿于样品采集与处理、方法选择、测试过程、试验记录、数据核查、统计处理和结果报告等全过程,是针对影响测试数据有效性的各个环节采取一系列措施,将测量误差控制在一定的允许范围内的全面质量管理体系。
质量保证的工作内容包括质量控制和质量评价。质量控制(quality control,QC)是指为了将测量误差减小到最低水平而采取一系列有效的技术和管理措施的活动;质量评价(quality evaluation,QE)是指采取一定统计手段分析质量控制措施的实施效果,发现分析测试过程中存在的问题并提出改进建议,评价实验室的技术能力水平。
一、实验室质量控制
根据质量保证方案的要求,实验室质量控制应从样品采集与处理、仪器设备、人员能力、环境条件、检测方法、数据处理等环节入手,采取相应控制措施,以保证分析测试数据的有效性,满足测试任务相关方的质量要求。
(一)样品采集与处理
样品采集是分析工作的第一步,如何保证采集的样品在采集、运输和储存过程中,样品待测组分的理化性质保持恒定,样品不损失、不污染,是关系到分析质量好坏的重要环节。
为保证采样工作质量,应规范采样的方法、布点、设备和环境条件等,根据样品特性采取正确的运输、储存和处理方法,保证样品的稳定性和代表性。可通过设置现场空白、运输空白、试剂空白等试验,校正在样品采集、运输、存储和测试过程中引入的本底误差。
(二)仪器设备
对于现代卫生化学来说,仪器分析法所占比例较大。仪器设备是否灵敏和准确,与分析结果准确度密切相关。针对仪器设备的管理贯穿于采购选型、验收调试、使用维护等全过程,关键在于其量值溯源性。一般采取检定、校准和期间核查等手段,确保仪器处于良好的工作状态,消除仪器可能引入的系统误差。
(三)人员能力
试验人员的技术能力和经验是保证测量质量的首要条件。尽管现代化仪器越来越自动化、智能化,但技术判断、经验、技巧、工作人员的专业水平对于减小变动性,使测量变动性保持在可接受的水平上仍是非常重要的。试验人员必须具有与分析项目要求相当的最低能力水平。
人员培训是质量控制的重要方面,应对技术人员进行经常性的基本理论、基本操作和实际样品分析等培训和考核,持续保持实验室技术能力水平。
(四)环境条件
首先实验室内应规定并严格执行各项实验室管理制度,以便于对分析工作质量的有效监督与科学管理。其次,应保持良好的实验室环境,如设置通风橱、超净试验台,安装空气净化装置等,对试验用试剂、器具及时清洗,保持清洁,以避免不良的实验室环境对分析质量产生负面影响。
(五)检测方法
分析方法的不完善或不正确可对分析结果产生较显著的系统误差,因此,选择适当的且能够满足分析要求的分析方法至关重要。标准方法是一个很好的选择,若无可用的标准方法,则可以分析方法的准确度、精密度、灵敏度、检出限等各项指标能否满足分析工作的需要为依据进行选择,同时方法是否简便快速、分析成本的高低也是需要考虑的因素。
(六)数据处理
分析结果的正确统计与处理同样是分析工作中不容忽视的重要环节。如正确记录试验数据,注意有效数字的正确修约;采用显著性检验的方法对数据中明显偏离的测量值进行判断与评估,以决定其是否可保留;严格按照有效数字的运算规则进行运算,正确保留分析结果的有效数字位数;以测量结果的平均值的置信区间的形式给出待测组分的测量结果等。
二、实验室质量评价
实验室质量评价包括实验室内和实验室间质量评价。
(一)实验室内质量评价
实验室内部质量评价是实验室对自己的分析方法和操作程序所进行的持续的、严格的评估。目前常用手段:方法确认、控制图、内部比对等。
1.方法确认
方法确认是指实验室通过试验,提供客观有效证据证明特定检测方法满足预期用途的过程,一般应建立检测方法的性能特性和使用的限制条件,并识别影响检测方法性能的因素及影响程度,确定方法所适用的基质及检测方法的准确度和精密度。实验室可在综合考虑成本、风险和技术可行性基础上,并根据预期的用途来进行分析测试方法确认。常见检测方法特性参数包括:选择性、检出限、定量限、线性范围、基质效应、精密度(重复性和/或再现性)、准确度、灵敏度、稳健度、测量不确定度等(表3-4)。
表3-4 分析测试方法确认参数选择*
*注:摘自《合格评定 化学分析方法确认和验证指南》(GB/T 27417-2017)。
(1)选择性(selectivity):
是指测量系统按规定的测量程序使用并提供一个或多个被测量的测得的量值时,每个被测量的值与其他被测量或所研究的现象、物体或物质中的其他量无关的特性。一般情况下,分析方法在没有重大干扰的情况下应具有一定的选择性。对于化学分析方法,在有干扰的情况下,如:基质成分、代谢物、降解产物、内源性物质等,保证检测结果的准确性至关重要。检测干扰的方法有:①分析一定数量的代表性空白样品,检查在目标分析物出现的区域是否有干扰(信号、峰等);②在代表性空白样品中添加一定浓度的有可能干扰分析物定性和/或定量的物质。
(2)线性范围(linearity of calibration):
是指对于分析方法而言,用线性计算模型来定义仪器响应与浓度的关系,该计算模型的应用范围。通常可参照相关国家标准或国际标准,尽量满足如下要求:①采用校准曲线法定量,并至少具有6个校准点(包括空白),浓度范围尽可能覆盖一个或多个数量级,每个校准点至少以随机顺序重复测量2次,最好是3次或更多;对于筛选方法,线性回归方程的相关系数不低于0.98;对于准确定量的方法,线性回归方程的相关系数不低于0.99。②校准用的标准点应尽可能均匀地分布在关注的浓度范围内并能覆盖该范围。在理想的情况下,不同浓度的校准溶液应独立配制,低浓度的校准点不宜通过稀释校准曲线中高浓度的校准点进行配制。③浓度范围一般应覆盖关注浓度水平的50%~150%。如须做空白时,则应覆盖关注浓度的0~150%。④应充分考虑可能的基质效应影响,排除其对校准曲线的干扰。实验室应提供文献或试验数据,说明目标分析物在溶剂中、样品中和基质成分中的稳定性,并在方法中予以明确。通常各种分析物在保存条件下的稳定性都已有很好的研究,监测保存条件应作为常规实验室确认系统的一部分。对于缺少稳定性数据的目标分析物,应提供能分析其稳定性的测定方法和确认结果。
测量范围(measuring interval):是指在规定条件下由具有一定测量不确定度的测量仪器或测量系统能够测量出的一组同类量的量值。通常应满足以下条件:①方法的测量范围应覆盖方法的最低浓度水平(定量限)和关注浓度水平;②至少需要确认方法测量范围的最低浓度水平(定量限)、关注浓度水平和最高浓度水平的准确度和精密度,必要时可增加确认浓度水平;③若方法的测量范围呈线性,还须满足线性范围的要求。
关注浓度水平是指对判断样品中物质或分析物是否符合法规规定和要求的有决定性意义的浓度,如卫生标准中的容许限浓度。
(3)检出限(limit of detection,LOD):
是指由给定测量程序获得的测量值,其对物质中不存在某种成分的误判概率为β,对物质中存在某种成分的误判概率为α。国际理论化学和应用化学联合会(IUPAC)推荐α(第一类错误概率)和β(第二类错误概率)的默认值为0.05。
对于多数分析方法来说,LOD可分为:仪器检出限(instrumental detection limit,IDL)和方法检出限(method detection limit,MDL)。
IDL指用仪器可靠地将目标分析物信号从背景(噪声)中识别出来时分析物的最低浓度或量。随着仪器灵敏度的增加,仪器噪声降低,相应IDL也降低。
MDL指用特定方法可靠地将分析物测定信号从特定基质背景中识别或区分出来时分析物的最低浓度或量,即用该方法测定出大于相关不确定度的最低值。确定MDL时,应考虑到所有基质的干扰。
确定检出限的方法很多,除下面所列方法外,其他方法也可以使用。
1)目视评价法:
通过在样品空白中添加已知浓度分析物,然后评定能够可靠检测出分析物的最低浓度值。在样品空白中加入一系列不同浓度的分析物,随机对每个浓度点进行约7次独立测试,通过绘制阳性(或阴性)结果百分比与浓度相对应的反应曲线确定阈值浓度。
2)空白标准偏差法:
可通过分析大量的样品空白或加入最低可接受浓度的样品空白来确定LOD。独立测试的次数应不少于10次(n≥10)。计算出检测结果的标准偏差(s),LOD的计算方法详见表3-5。
3)校准方程法:
如果在LOD或接近LOD的样品数据无法获得,可利用校准方程的参数评估仪器的LOD。如果用空白平均值加上空白的3倍标准偏差,仪器对于空白的响应即为校准的截距a,仪器响应的标准偏差即为校准的标准偏差(Sy/x)。故可利用方程yLOD=a+3Sy/x=a+bxLOD,则xLOD=3Sy/x/b。这个方程可广泛应用于分析化学。然而由于这是外推法,所以当浓度接近于预期的LOD时,结果就不如由试验得到的结果可靠,因此建议分析浓度接近于LOD的样品,应确证在适当的概率下被分析物内能够被检测出来。
表3-5 定量检测中LOD的表示方法
注1:最低可接受浓度为在所得不确定度可接受的情况下所加入的最低浓度;
注2:假设样品和空白分别测定,通过样品浓度扣减空白信号对应的浓度进行空白校正;
注3:仅当空白中干扰物质的信号值高于样品空白值的3s的概率远小于1%时适用。
4)信噪比法:
由于仪器分析过程都会有背景噪声,常用的方法就是利用已知低浓度的分析物样品与空白样品的测量信号进行比较,确定能够可靠检出的最小的浓度。典型可接受的信噪比为2∶1或3∶1。
特别需要注意:方法的LOD不宜与仪器最低响应值相混淆。使用信噪比可用来考察仪器性能但不适用于评估方法的LOD。
(4)定量限(limit of quantification,LOQ):
是指样品中被测组分能被定量测定的最低浓度或最低量,此时的分析结果应能确保一定的准确度和精密度。
LOQ也可以分为:仪器定量限(instrumental quantification limit,IQL)和方法定量限(method quantification limit,MQL)。
IQL可定义为仪器能够可靠检出并定量被分析物的最低量。MQL可定义为在特定基质中在一定可信度内,用某方法可靠地检出并定量被分析物的最低量。
LOQ的确定主要是从其可信性考虑,如:测试是否是基于法规要求、目标测量不确定度和可接受准则等。通常建议将空白值加上10倍的重复性标准偏差作为LOQ,也可以3倍的LOD或高于方法确认中使用最低加标量的50%作为LOQ。如为增加数据的可信性,LOQ也可用10倍的LOD来表示。另外在某些特定测试领域中,实验室也可根据行业规则使用其他参数。特定的基质和方法,其LOQ可能在不同实验室之间或在同一个实验室内由于使用不同设备、技术和试剂而有差异。
通常情况下,只有当目标分析物的含量在接近于“零”的时候才需要确定方法的LOD或LOQ。当分析物浓度远大于LOQ时,没有必要评估方法的LOD和LOQ。但是对于那些浓度接近于LOD与LOQ的痕量和超痕量检测,并且报告为“未检出”时,或需要利用检出限或定量限进行风险评估或法规决策时,实验室应确定LOD和LOQ。不同的基质可能需要分别评估LOD和LOQ。
(5)基质效应:
化学分析中基质指的是样品中被分析物以外的组分。基质经常对分析物的分析过程有显著的干扰,并影响分析结果的准确度。例如溶液的离子强度会对分析物活度系数有影响,这些影响和干扰被称为基质效应。
(6)精密度(precision):
是指在规定条件下,对同一或类似被测对象重复测量所得示值或测得的量值间的一致程度。此处“规定条件下”包括重复性测量条件和再现性测量条件。重复性测量条件是指相同测量程序、相同操作者、相同测量系统、相同操作条件和相同地点,并在短时间内对同一或相类似的被测对象重复测量的一组测量条件。再现性测量条件是指不同地点、不同操作者、不同测量系统,对同一或相类似被测对象重复测量的一组测量条件。
在一组重复性测量条件下获得的测量精密度称为重复性;在再现性测量条件下获得的测量精密度称为再现性。
1)重复性(repeatability):对于在重复性条件下进行的适当的测量数据,可用标准偏差(s)、方差(s2)和概率分布函数等表示精密度。如果分析方法中涉及仪器分析,则除了方法重复性外还须确定仪器重复性。重复性体现了测量结果短期变化,同样也适用于评定在单一批次分析中重复测定可能存在的差异。重复性的测定通常应在自由度至少为6的情况下测定。对一个样品测定7次;或对2个样品,每个样品测定4次;或对3个样品,每个样品测定3次。仪器重复性可通过对校准曲线中标准溶液、加标溶液进样测定7次,然后计算平均值、标准偏差。测量应按随机顺序进行以降低偏差。
方法重复性可通过准备不同浓度的样品或浓度与方法回收率研究相近的样品(实际样品、加标空白溶液、加标实际样品),然后在较短的时间间隔内由同一个分析员进行分析测定,并计算平均值、标准偏差和相对标准偏差。
2)再现性(reproducibility):可表示为标准偏差(s)、方差(s2)和概率分布系数,例如在利用两种以上校准标准溶液在一段时间、测定一定数量的试样。这些条件包括在不同时间内测定,在与日常使用方法中条件差别尽可能小的情况下测定(如不同分析员利用不同设备的测试)。对于受控状态的单个实验室通常使用实验室内再现性或期间精密度等术语来表示其再现性精密度。
再现性标准偏差可通过一系列多个样品获得,或多个系列测定结果的合成标准偏差进行计算。测试的自由度可通过系列量和每系列中样品数量进行计算。
(7)准确度(accuracy):
是指被测量的测量值与其真值间的一致程度。测量结果的偏倚一般通过回收试验进行评估。
回收率测定时应考虑以下因素:①不同检测批次之间的变化,如果可能的话,可采用覆盖整个浓度测试范围的不同试样评估偏倚。②最理想的偏倚评估是利用与样品的基质匹配且浓度相近的有证标准物质(CRM)进行测试;其次采用标准物质(RM)来评估回收率,将已知浓度的分析物加到样品中,按照预定的分析方法进行检测,测得的实际浓度减去原先未添加分析物时样品的测定浓度,并除以所添加浓度的百分率;经过协同实验室确定了特征性的物质也可以用于评估偏倚;如果CRM或RM都无法获得,则偏倚只能通过在基质空白中加入一系列浓度的目标物所得回收率来评估。方法回收率的偏差范围可参照表3-6执行。
表3-6 方法回收率偏差范围
(8)灵敏度(sensitivity):
是指测量系统的示值变化除以相应被测量的量值变化所得的商。测量系统的灵敏度可能取决于被测量的量值。所考虑的被测量的量值变化宜大于测量系统的分辨力。
(9)稳健度(ruggedness):
是指试验条件变化对分析方法的影响程度。可通过由实验室引入预先设计好的微小合理变化因素,并分析其影响而得出。分析稳健度时,应关注以下内容:①须选择样品预处理、净化、分析过程等可能影响检测结果的因素进行预实验。这些因素可以包括分析者、试剂来源和保存时间、溶剂、标准和样品提取物、加热速率、温度、pH,以及许多其他可能出现的因素。不同实验室间这些因素可能有一个数量级的变化。因此应对这些因素做适当修改以符合实验室的具体情况。②确定可能影响结果的因素,对各个因素稍作改变。宜采用正交试验设计进行稳健度试验。③一旦发现对测定结果有显著影响的因素,应进一步试验,以确定这个因子的允许极限。对结果有显著影响的因素应在标准方法中明确地注明。
(10)测量不确定度(uncertainty of measurement):
对化学分析结果的不确定度产生影响的因素有很多,如质量、体积、样品因素和非样品因素等,其中样品因素包含取制样和分析样品的均匀性,而非样品因素包含外部数据(通常包括常数和由其他试验得出并导入的量值,如:分子量、基准试剂纯度、标准物质的标准值以及标准溶液的浓度等)和测试过程(包括关键的测试步骤和原理,如样品的前处理、试剂或溶剂的加入、测试所依据的化学反应等)。样品因素和非样品因素存在于所有化学分析中,重量法分析中必然涉及质量因素,而容量分析中必然涉及体积因素。只须能够明确地给出被测量与对其测量不确定度有贡献的分量之间的关系,而这些分量怎样分组以及这些分量如何进一步分解为下一级分量并不影响不确定度的评估。
2.控制图
控制图(control chart)是实验室内部质量评价的一种主要工具。将控制值按特定顺序绘制在图中并与控制限比较,以判断检测过程和结果是否处于控制状态。
(1)控制图原理:
是将控制样品与待测样品放在一个分析批中一起进行分析,然后将控制样品的结果(即控制值)绘制在控制图上,实验室可以从控制图中控制值的分布及变化趋势评估分析过程是否受控、分析结果是否可以接受(图3-4、图3-5)。
控制图是基于控制样品分析结果随机变化的正态分布统计特性。控制图的中位线(central line,CL)代表控制值的平均值或参考值。除中位线外,控制图中通常还有四条线。其中两条称为警告限(warning limit,WL)。警告限与中位线的距离为±2s。在服从正态分布的情况下,约95%的数据将落在警告限之内。另外两条线与中位线的距离为±3s,称为行动限(action limit,AL)。在服从正态分布的情况下,约有99.7%的数据落在行动限之内。从统计学上来讲,在1000次测量中只有3次测量的结果会落在行动限之外。因此,在通常情况下,如果控制值落在行动限之外,分析程序中存在差错的概率是非常高的。
图3-4 一个分析批(含2个控制样品)
(摘自CNAS-GL027:2018)
在控制图中,如果所有控制值都落在上下警告限之间,表明分析程序在规定的限值范围内运行,可以报告待测样品的分析结果。如果控制值落在上下行动限之外则说明分析程序有问题,不得报告待测样品的分析结果,而应采取纠正行动,识别误差的来源并予以消除。如果控制值落在警告限之外但在行动限之内,则应根据特定的规则进行评估。
控制图的构建过程包括:确定控制对象、取预备数据、数据处理(计算统计量)、绘制控制图、控制值点绘、状态判断、控制图维护等。
图3-5 X控制图与正态分布曲线之间的关系
(以Zn检测为例,摘自CNAS-GL027:2018)
(2)控制图类型:
控制图类型有X控制图(均值图)、I控制图(单值图)、R控制图(极差图)、MR控制图(移动极差图)、EWMA控制图(指数加权移动平均值图)等。
X控制图又称平均值-标准偏差控制图。以单个分析结果或多个分析结果的均值绘制的X控制图可用于监控控制值的系统效应和随机效应。如果使用与待测样品类似的标准物质作为控制样品,则可以监控偏倚(bias)。与均值图相比较,单值图难于区别批内和批间精密度。
其他控制图可参见GB/T 27407-2010、GB/T 32464-2015、GB/T 32465-2015、CNASGL027:2018等国家标准或准则。
(3)控制图的使用:
在日常工作中,如果控制值落在控制限之外,或观察到在一个时间段内控制值呈现一种特定的、系统性的变化模式时,应特别警惕。控制数据有三种情况:方法受控、方法受控但统计失控、方法失控。
1)方法受控:
如果控制值落在警告限之内,或控制值落在警告限和行动限之间但其前两个控制值落在警告限之内,则认为方法受控。在这种情况下,可以报告分析结果。
2)方法受控但统计失控:
如果所有控制值落在警告限之内(最后3个控制值中最多有1个落在警告限和行动限之间),但连续7个控制值单调上升或单调下降、或连续11个控制值中有10个落在中位线的同一侧,则认为方法受控但统计失控。在这种情况下,可以报告结果,但问题可能正在发展。应尽早发现重要的变化趋势,以避免将来发生更为严重的问题。
3)方法失控:
如果控制值落在行动限之外,或控制值落在警告限和行动限之间且其前两个控制值中至少有一个也落在警告限和行动限之间(三分之二规则),则认为方法失控。在这种情况下,不得报告分析结果。所有在上一个受控的控制值之后分析的样品均应重新进行分析。
3.实验室内部比对
实验室内部比对试验是指设置2个或2个以上的试验组,按照预先规定的条件就同一或类似的检测对象进行检测的组织、实施和评价。比对方式:人员比对、方法比对、设备比对、留样再测、其他形式。比对结果评价方法:
(1)当每组平行测量次数n≥6时,可先对两组数据作方差分析(F检验),再做t检验,对两组等精度测定结果是否存在显著性差异。
(2)当每组平行测量次数n<6时,可先对两组结果做测量不确定度评定,再按(式3-1)对人员、方法、设备(2台)、留样再测的比对结果进行评价。
式中,y1:比对方测定值;y2:参考方测定值;U1:比对方测量不确定度;U2:参考方测量不确定度。
满足(式3-1)表示比对试验结果满意,否则不满意。
当规定了人员比对的允许差时,可将具有较高准确度的一方(比如熟练检测人员)测定值作为参考方,比对结果按(式3-2)进行评价。
式中,yi:比对方测定值;y:参考方测定值;D%:允许差(%)
满足(式3-2)表示比对试验结果满意,否则不满意。
当对多台相同准确度等级设备进行比对时,比对结果按(式3-3)进行评价。
式中,yi:第i台设备的测定值;:多台相同准确度等级设备测定值的平均值;n:参加比对的设备台数;U:参加比对的多台相同准确度等级设备的测量不确定度,k=2。
满足(式3-3)表示比对试验结果满意,否则不满意。
(二)实验室间质量评价
实验室间质量评价方式包括能力验证、实验室间比对和测量审核等。
1.能力验证
能力验证(proficiency testing,PT)是指利用实验室间比对,按照预先确定的判断评价参加者能力的活动。能力验证活动应当遵循科学合理、操作可行、非营利性和避免不必要的重复验证的原则。2006年国家认监委依照有关国家标准、国际准则,颁布了《实验室能力验证实施办法》,统一监管和综合协调能力验证活动。目前我国已发布实施了20余项与能力验证相关的标准或规则。
能力验证机构一般由组织机构(如CNAS)、实施机构、项目负责人、协调者、技术专家组、统计专家组、计划联系人等组成。
(1)能力验证计划:
能力验证组织机构应制订实施计划,内容包括实施机构的联系方式,参加者数量及类型,参加条件,潜在的误差来源,样品特性或预期的量值范围,样品制备和均匀性、稳定检验(包括方法及程序),样品储存运输和分发,丢失或损害时采取的措施,检测/校准方法,日程安排,数据处理和采用的统计分析,指定值及不确定度的确定方法,指定值的计量溯源性,结果评价标准,反馈给参加者的数据等的描述,对计划的结果及结论公布的范围,参加者反馈结果的标准化报告格式等。其要点是统计设计、样品制备、测量方法、数据处理和结果评价等。
(2)能力验证提供者(proficiency testing provider,PTP):
是指对能力验证计划建立和运作中的所有任务承担责任的组织。PTP应按照有关规范开展能力验证活动,建立并保存能力验证档案及相关记录;其技术能力和服务领域应当符合相关国家标准或者技术规范的要求,并通过CNAS认可。
(3)能力验证参加者:
ILAC要求实验室应制订“能力验证参加计划”。实验室应基于管理和技术方面的风险、实验室质量控制、管理部门和认可机构的要求和能力验证计划的可获得性等进行制订。
能力验证参加者应当向能力验证提供者及时反馈相关信息,并保存相关记录。能力验证结果离群的,应当采取相应的纠正措施。能力验证提供者应当要求其在规定期限内进行整改并验证整改效果,也可视情况暂停或者撤销其相关项目的资质认定或者认可。
(4)能力验证样品:
用于能力验证的比对样品的一致性至关重要。在实施能力验证计划时,组织方应确保能力验证中出现的不满意结果不归咎于样品之间或样品本身的变异性。因此,对于能力验证样品的检测特性量,必须进行均匀性和/或稳定性检验。
批量制备的样品通常必须进行样品均匀性检验。对于稳定性检验,则可根据样品的性质和计划的要求来决定。对于性质较不稳定的检测样品如生物制品,以及在校准能力验证计划中传递周期较长的测量物品,稳定性检验是必不可少的。
均匀性检验或稳定性检验的结果,可根据有关统计量表明的显著性或样品的变化能否满足能力验证计划要求的不确定度进行判断。
能力样品均匀性和稳定性检验方法可参照《能力验证样品均匀性和稳定性评价指南》(CNAS-GL003:2018)进行。
(5)能力验证结果评价:
评价方式大致可分为定性、定量或者二者组合。
1)定性评价:
定性类能力验证侧重于对能力验证物品的一个或多个特性进行鉴别或描述,其结果多为性状判定或描述,具有较强的逻辑性和推理性,在质变线附近较易受到主观因素的影响。不同的专业和行业有不同的评价要求和评价形式。通常只须根据参加者的检测结果与指定值是否准确一致,即可给出合格或不合格、满意或不满意的能力评价。但在某些能力验证计划中,要求对参加者进行多方面的综合评价,参加者的报告须提供给多位专家,最后协商给出公议的结论,并附有参加者整体的评价或评分。
2)定量评价:
定量类能力验证以一定的数值为描述手段,其结果在一定范围内趋于一致,结果评价标准相对统一,具有明确的溯源性。为了尽量减少参加者结果中离群值的影响,往往采用稳健统计方法,即对给定概率模型假定条件的微小偏离不敏感的统计方法,其统计参数有中位值、标准化四分位距、Z比分数、En值等。如采用经典统计方法,则需要预先剔除离群值和方差齐性检验。
· Z比分数:是指由能力验证的指定值和能量评定标准差计算的实验室偏倚的标准化度量,也称Z值或Z分数。其计算公式:
式中:x:实验室测量值;M:中位值;IQR:四分位距;0.7413:四分位距标准化系数。
当,表示满意结果;当,表示有问题结果,给予警告信号;当,表示不满意结果,给予行动信号。
参加者收到“警告信号”后,应检查测量程序有无问题。若参加者收到“行动信号”,则应采取纠正措施,全面检查有关的测量过程。
· En值:即比率值,用于表示参加者测量结果与指定值差异。指定值确定方法有配方法、有证参考值、独家定值、专家公义值、参加者公义值。
式中:x:参加者结果;X:指定值;Ux:参加者结果的扩展不确定度,k=2;UX:指定值的扩展不确定度,k=2。
当时,表示满意结果;当,表示不满意结果。
在校准能力验证计划中,常使用En值来评定参加者结果。En值也经常被用于测量审核的结果评价。
当所有参加者按计划提交检测结果后,能力验证计划组织者或提供者进行数据处理和分析,最后给出能力验证报告。
此外,能力验证结果评价指标还有偏差(D)或百分相对差(D%)。
2.实验室间比对
实验室间比对是指按照预先规定的条件,由两个或多个实验室对相同或类似物品进行测量或检测的组织、实施和评价。
(1)比对目的:
①确定实验室对特定检测或测量的能力并监测其持续能力;②识别实验室存在的问题并采取纠正措施,可能与人员能力或设备校准有关;③确定新方法的有效性和可比性;④鉴别实验室之间的差异;⑤确定一种方法的能力特性,通常称为共同试验;⑥给标准物质赋值,并评价其适用性;⑦使客户抱有更高的信任度等。
(2)比对计划:
实验室间比对计划制订与运作过程与能力验证一样,只是参加者比较少、由比对发起实验室组织实施。一般由实验室技术负责人拟定年度比对计划,选择检测能力强、已通过认证认可实验室作为比对实验室,采取委托检测或协作检测方式执行比对计划。
(3)比对样品:
可采用均匀样品的分割样、有证标准物质等。
(4)结果评价:
对于几家实验室开展的比对试验,可采用偏差(D)或百分相对差(D%)、En值进行评价。当对于几十家或更多的实验室开展比对试验,即为能力验证活动,常采用Z比分数等进行评价。
偏差(D)或百分相对差(D%):一般将能力水平比较高的实验室结果作为参考值,或者指定值,并约定彼此之间的最大允许误差(MPE)。
式中:xi:参加者报告结果,xpt:参考实验室结果或指定值。
当-MPE≤Di≤MPE,表示满意结果;,表示不满意结果。
当,表示满意结果;,表示不满意结果。对于不满意结果的实验室给予行动信号,要求采取纠正措施。
3.测量审核
测量审核是指使用已知指定值的测量对象,利用实验室间比对按照预先确定的判据评价单一实验室的测量能力。测量审核是能力验证计划的有效补充,测量审核数据是CNAS等机构判断实验室能力的重要技术依据。
参加者若选择测量审核,即“一对一”的能力验证计划,须核查测量审核样品来源、稳定性、指定值和能力评定标准差(用En值评定时没有能力评定标准差)的确定方式。测量审核样品通常来源于有证标准物质/标准样品、能力验证剩余样品或者定制样品等。测量审核结果评价参照能力验证的方法进行。
(叶怀庄)