五、能力验证结果的统计处理和能力评价
提供给实验室的检测物品之间的所有差别已降至最小,因此结果的变异性主要有两个来源:实验室间的变异(包括测量方法间的变动)和实验室内部的变异。我们将通过在这两种类型的变异上来评价实验室的结果和提供反馈。
为了评定实验室间和实验室内这两种变异性,实验室必须进行多于一次(如两次)的相同检测。因此,只要可能,验证计划应设计成能够获得成对的相关结果。这可以用样品对来实现,如不可能,也可以通过对一个样品检测两次的结果来获得。
如果使用成对的样品,它们可以是等同的(即“均一对”)或者存在轻微的差别(分割水平对)。由样品对获得的结果分成两类:均一对,其结果预期是相同的(即两个样品完全相同或同一样品检测两次);分割水平对,其结果稍有差异。
均一对和分割水平对这两种类型结果的统计分析是相同的。有些验证计划不可能获得结果对,即只能获得单一样品的单个结果,在这种情况下,统计分析较为简单,但不能区分出两种不同类型的变异。
在能力验证计划设计过程中另一个重要的统计考虑是,假设分析的结果服从正态分布。正态分布是统计分布中最常见的类型。
正态分布是一个连续的、对称的“钟形”曲线,并被定义为大约有68%的值位于平均值的一倍标准偏差内,95%的值位于两倍标准偏差内,99%的值位于三倍标准偏差内。因此,计划组织者(特别是技术专家)必须注意,所有获得的结果应近似于正态分布。
另外,对于具有连续数字的结果,技术专家必须仔细考虑给出所需的单位和小数位数(或有效数字),否则数据可能出现大量的重复值。另一个应该避免的问题是当特性量是在非常低的水平上测试时,结果往往是不对称的(即偏向零)。
数据准备
在开始进行统计分析之前,应采取措施确保所采集的数据是正确、合理的。
必须确保正确地输入所有提交的结果。一旦收到了所有结果(或已超过上报结果的最后期限),必须仔细复查输入的数据。通过这个检查过程,一般可以识别出数据中的粗大误差和潜在问题。
在某些情况下,结果需经过转换,例如:微生物计数的统计分析通常按结果的对数计算,而不是按原始的数据计算。当所有结果已被输入并经过检查(必要时经过转换),然后制作显示结果分布的数据直方图,以检验正态性假设。
检查直方图可以看出结果是否连续和对称。如果不是,统计分析可能无效。还可能出现一个问题,即在直方图上出现两组有差异的结果(即双峰分布),这通常是由于使用了产生不同结果的两种检测方法。在这种情况下,应对两种方法的数据进行分离,然后对每一种方法的数据分别进行统计分析。
总计统计量
完成了数据准备,就可以用总计统计量来描述结果。至少应包含七种综合的统计量———结果数、中位值、标准四分位数间距(IQR)、稳健的变异系数(CV)、最小值、最大值和极差。
其中最重要的统计量是中位值和标准化IQR———它们是数据集中和分散的量度,与平均值和标准偏差相似。使用中位值和标准化IQR是因为它们是稳健的统计量,即它们不受数据中离群值的影响。
结果数是从一个特定检测中得到的结果总数,符号为N。
中位值是一组数据的中间值,即有一半的结果高于它,一半的结果低于它。如果N是奇数,那么中位值是一个单一的中心值,即X。如果N是偶数,那么中位值是两个中心值的平均,即是)。例如,如果N是9,中位值是第5个值,如果N是10,那么中位值是第5和第6个值的平均值。
标准化IQR是一个结果变异性的量度。它等于四分位间距(IQR)乘以因子0.7413,其与一个标准偏差相类似。四分位间距是低四分位数值和高四分位数值的差值。低四分位数值(Q1)是低于结果的四分之一处的最近值,高四分位(Q3)是高于结果四分之三处的最近值。在大多数情况下Q1和Q3通过数据值之间的内插法获得。IQR=Q3-Q1,标准化IQR=IQR×0.7413。
稳健CV是变异系数,稳健CV=×100%。
最小值是最低值(即X[1]),最大值是最高值(即X[N]),极差是它们之间的差值(即X[N]-X[1])。
计算了能力验证计划中的总计统计量后,为了及时地将信息反馈给实验室,可把中位值,标准化IQR以及实验室的结果列成表格,作为中期报告发至参加实验室。中期报告发布之后,组织者不应对数据再做改动和添加(如迟到的结果)。
A.8中给出了一个最终报告中的总计统计量的例子。例中使用了一个样品对,样品A和样品B是一对分割水平样品。
注:因子0.7413是从“标准”正态分布中导出。
稳健Z比分数和离群值
为了统计评价参加实验室的结果,可使用基于稳健总计统计量的Z比分数(中位值和标准化IQR)。如果是样品对的结果(在大多数情况下),将计算两个Z比分数,即实验室间Z比分数(ZB)和实验室内Z比分数(ZW)。它们分别基于结果对的和与差值。
假设结果对是从A和B两个样品中获得的。把样品A所有结果的中位值和标准化IQR分别写为中位值(A)和标准化IQR(A),(样品B也类似)。仅对一个样品A的结果而言,简单的稳健Z比分数(用Z表示)为:
当根据样品对的结果A和B计算ZB和ZW时,首先计算结果对的标准化和(用S表示)和标准化差值(Z),即:
S=(A+B)/√2和D=(A-B)/√2(保留D的+或-号)
通过计算每个实验室的标准化和及标准化差值,可以得出所有的S和D的中位值和标准化IQR,即中位值(Z),标准化IQR(D)等(这些总计统计量通常在报告表中列出,便于参加者自己计算Z比分数)。
随后计算实验室间Z比分数(ZB)和实验室内Z比分数(ZW),即
在报告中列表给出计算的Z比分数(见A.8),并依据这些Z比分数来评定实验室的结果。把离群值定义为Z(包括ZB和ZW)绝对值大于等于3的结果或结果对,在表中,离群值在其Z比分数边上以(§)标出。
当实验室的Z比分数处在有问题的区间(即2<|Z|<3)时,应鼓励实验室认真地检查它们的结果偏差较大的原因。
对认为是离群的结果进行说明时,必须考虑Z比分数的符号和能力验证计划的设计。对于均一对和分割水平对,一个正的实验室间离群值(即ZB≥3)表明该样品对的二个结果太高。而一个负的实验室间离群值(即ZB≤-3)表明其结果太低。
对于样品对,实验室内离群值(即|ZW|≥3)表明其二个结果间的差值太大。
对于一个样品(X)的验证计划,一个简单的稳健Z比分数是离群值时,Z比分数的符号可以表明结果太高(正)或太低(负),但不能确定离群是由于实验室间变动还是实验室内变动,或者是由二者所造成。
图形显示
能力验证计划的报告除了包括结果、Z比分数表和总计统计量之外,通常还应包含一定数量的图表。两个最常使用的图形是Z比分数序列图和尤登图。
这些图能帮助组织者解释结果,而对于参加者也是非常有用的,特别是那些带有离群值的参加者,他们能够看到他们提交的结果与其他实验室结果的差异。
Z比分数序列图
将下述例子制作Z比分数序列图。按照大小的顺序显示出每个实验室的Z比分数(ZB和ZW),并标有实验室的编号,使每个实验室能够很容易地与其他实验室的结果进行比较,如图12和图13所示。
图12 Z比分数序列图
图13 Z比分数序列图
实验室综合表
在最终报告中,对检测样品中每个检测特性都应有一份综合表。该表包含了参加者的所有结果,同时带有相关的统计量和Z比分数。如必要,还包含了对实验室的说明,如表5所示。
表5 铅精矿中Cu的测定结果和统计处理
注:加§号的数值为离群值,即│Z│≥3;加*号的数值为可疑值,即2<│Z│<3。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。