定量分析会得到一系列测量值或数据,必须对这些数据进行整理及统计处理后,才能对所得结果的可靠程度做出合理判断并予以正确表达。
在校正系统误差和去除错误测定结果后,测量结果的不一致是由偶然误差引起,可以运用统计学的方法来计算,估计偶然误差对分析结果影响的大小,并较为正确地表达和评价所得结果。亦即,在对分析数据进行统计处理之前,需要先进行数据整理,去除由于明显原因引起的、相差较远的错误数据。对可疑数据可采取Q检验或其他检验规则决定取舍,并按照所要求的置信度,求出平均值的置信区间,必要时还要对两组数据进行显著性检验。
2.3.1 偶然误差的正态分布
在分析过程中,对同一试样进行多次重复测量,当测量次数 (n)足够多时,所得测量值的波动情况 (偶然误差)符合正态分布 (高斯分布)规律:
式中,y代表概率密度,x表示测量值,μ是总体平均值,σ为总体标准差。以x为横坐标,y为纵坐标,就得到测量值的正态分布曲线,见图2-2。
μ和σ是正态分布的基本参数,其中μ→∞。μ是测量值的平均值,对应于曲线最高点的横坐标值,它表示测量值的集中趋势。当系统误差为零时,μ即是真值。σ为曲线两拐点之间距离的一半,表示数据的分散程度。μ决定曲线在x轴的位置。σ相同μ不同时,曲线的形状不变,只在x轴平移,如图2-3所示。σ确定曲线的形状,σ小,数据集中,曲线瘦高;σ大,数据分散,曲线较扁平,如图2-4所示。
图2-2 测量值或误差的正态分布曲线
图2-3 精密度相同,真值不同的三个系列测定的正态分布曲线
x-μ代表偶然误差。在图2-2中,若用x-μ取代测量值x作横坐标,就得到了偶然误差的正态分布曲线。该曲线清楚地反映出偶然误差的规律性:其曲线两侧对称,说明正负误差出现概率相同;曲线自峰值向两旁快速地下降,说明小误差比大误差出现的概率大;曲线最高点对应的横坐标x-μ值等于零,表明偶然误差为零的测定值出现的概率最大。
图2-4 真值相同,精密度不同的三个正态分布曲线
图2-5 标准正态分布曲线测定的正态分布曲线
由于μ和σ不同时正态分布不同,曲线的形状也随之而变化。为了使用方便,可作一变量代换,令:
用u作变量代换后的上式转化成只有变量u的函数表达式:
这样,曲线的横坐标变为u,纵坐标为概率密度,用u和概率密度表示的正态分布曲线称为标准正态分布曲线,曲线的形状与μ和σ的大小无关(图2-5)。
在实际工作中,测量次数都是有限量的,其偶然误差的分布不服从正态分布,而服从t分布。
2.3.2 t分布
在分析测试中,通常都是进行有限次数的测量,称之为小样本试验。由于小样本试验无法得到总体平均值μ和总体标准偏差σ,因此,只能根据得到的样本平均值x-与样本标准偏差S来估算测量数据的分散程度。由于x-和S都是随机变量,这种估算必然会引入误差。在处理少量试验数据时,为了校正这种误差,可用t分布对有限次测量的数据进行统计处理。
t分布曲线 (图2-6)与正态分布曲线相似,但由于测量次数少,数据的集中程度较小,离散程度较大,t分布曲线的形状变得平坦。t分布曲线仍以概率密度y为纵坐标,以统计量t为横坐标。用样本标准偏差S代替总体标准差σ时必然引起误差,英国化学家和统计学家Gosset W S提出用t值代替u值,以补偿这一误差。t定义为:
图2-6 t+分布曲线
表2-2 不同自由度及不同置信度的t值
2.4.3 平均值的置信区间
当对某样本进行无限多次测量时,偶然误差的分布遵循正态分布规律,偶然误差(σ)与测量值 (x)出现的区间与相应概率见表2-3。
表2-3 偶然误差与测量值的相应概率
由图2-7可知,当用单次测定结果z来估计总体平均值μ的范围时,则μ包括在区间 (x±σ)范围内的概率为68.3%,在区间(x±2σ)范围内的概率为95.5%,在区间(x±3σ)范围内的概率为99.7%。在一定的置信度时,以测定结果为中心的包括总体平均值在内的可靠性范围称为置信区间,它的数学表达式为:
μ=x±uσ(2-11)
若用样本平均值x-估计总体平均值μ可能存在的区间,可用下式表示:
在实际工作中,通常只能对试样进行有限次数的测定,若用少量测量值的平均值x-估计总体平均值μ的范围,则必须根据t分布进行处理,求得样本标准偏差S,再根据所要求的置信度及自由度,由表2-2中查出t值,然后按下式计算平均值的置信区间:
图2-7 误差正态分布的概率
【例2-5】用滴定法测定大青盐中Na Cl的含量,9次测定标准偏差为0.096%,平均值为97.76%,估计真实值在95%和99%置信度时应为多少?
解:(1)已知置信度为95%,f=9-1=8,查表2-2得:t=2.31
(2)已知置信度为99%,f=9-1=8,查表2-2得:t=3.36
由上可知,总体平均值 (真实值)在95%置信度时的置信区间为97.69%~97.83%;在99%置信度时的置信区间为97.65%~97.87%,因此,置信度越高,同一体系的置信区间就越宽,即所估计的区间包括真值的可能性也就越大。
在实际工作中,置信度不能定得过高或过低。如置信度过低,置信区间就窄;置信度过高会使置信区间过宽,从而导致这科学一判断失去意义。分析化学中通常取95%的置信度,有时也可根据具体情况采用90%,99%的置信度。
2.3.4 显著性检验
在定量分析中,常常需要对两份试样或两种分析方法的分析结果的平均值与精密度间是否存在着显著性差别作出判断,如果存在差别,还需要判断这些差别是由偶然误差还是系统误差引起的。这些问题都属于统计检验的内容,称为显著性检验或差别检验。显著性检验的方法有很多种,在定量分析化学中最常用的是F检验和t检验,分别用于检验两个分析结果是否存在显著的系统误差和偶然误差。
1.F检验
F检验 (Ftest)主要通过比较两组数据的方差S2,以确定它们的精密度是否有显著性差异,并用于判断两组数据间存在的偶然误差是否有显著不同。
F检验的步骤是首先计算出两个样本的方差S21和S22,它们分别代表方差较大和较小的两组数据,然后按下式计算F值:
计算时,规定方差大的S21为分子,方差小的S22为分母。将计算所得F值与表2-4所列F值 (置信度为95%)进行比较,若F>F表,说明两组数据的精密度存在显著性差异;反之,则说明两组数据的精密度不存在显著性差异。
表2-4所列F值是单边值,直接用于单侧检验,即检验某数据的精密度是否 “≥”或 “≤”另一组数据的精密度,此时置信度为95%,显著性水平为0.05。如果是进行双侧检验,判断两组数据的精密度是否存在显著性差异时,即一组数据的精密度可能 “≥”,也可能 “<”另一组数据的精密度,显著性水平为单侧检验的两倍,即显著性水平为=0.10,此时置信度P=1-0.10=0.90,即90%。
表2-4 置信度为95%时的F值
续表2-4
【例2-6】用两种方法测定某试样中的某组分,A法测定6次 (n=6),标准偏差为S1=0.055;B法测定4次 (n=4),标准偏差为S2=0.022。问A法的精密度是否显著地优于B法的精密度?
解:已知
n1=6,S1=0.055;n2=4,S2=0.022
f1=6-1=5,f2=4-1=3
由表2-4查得F表=9.01,而
由此可见,F<F表,故S21与S22间无显著性差别,即在95%的置信水平上,两种方法的精密度之间不存在显著性差异。
2.t检验
t检验 (t test)是检查、判断某一分析方法或操作过程中是否存在较大的系统误差的统计学方法,主要用于以下几方面:
(1)样本平均值与标准值 (相对真值、约定真值等)的比较
在一定置信度时,平均值的置信区间为:
可以看出,如果这一区间可将标准值μ包含在其中,即使x-与μ不完全一致,也能做出x-与μ之间不存在显著性差异的结论,因为按t分布规律,这些差异是偶然误差造成的,而不属于系统误差。因此为:
进行t检验时,先将所得数据x-,μ,S及n代入上式,求出t值,然后再根据置信度和自由度由t值表(表2-2)查出相应t值,将两者相比较,如果t≥t表,则说明x-与μ之间存在显著性差异;反之,则说明不存在显著性差异。由此可得出分析结果是否正确、新分析方法是否可行等结论。
查表2-2得,当置信度为95%,f=8时,t表=2.31。t<t表,故与μ不存在显著性差异,说明该新方法可靠,系统误差很小。
(2)两组平均值的比较
对以下两种情况,可采用t检验法判断两组平均值之间是否存在显著性差异:①同一试样由不同分析人员或同一分析人员采用不同方法、不同仪器进行分析测定,所得两组数据的平均值。②对含有同一组分的两个试样,用相同的分析方法所测得的两组数据的平均值。
式中,SR称为合并标准偏差或组合标准差 (pooled standard deviation)。可由下式求出:
或
【例2-8】用两种方法测定同一批苦杏仁中苦杏仁苷的百分含量,所得结果如下:
B法:n2=4,=3.23%,S2=0.10%
问两种方法间是否有显著性差异 (置信度90%)?
解:
由表2-4查得F表=9.12。F<F表,两种方法的精密度之间不存在显著性差异。
根据式 (2-18)求合并标准偏差:
自由度f=n1+n2-2=7,查表2-2得,当置信度为90%,f=7时,t表=1.90。t<t表,说明两种方法之间无显著性差异。
使用显著性检验时,须注意以下问题:
①显著性检验的顺序是先进行F检验而后进行t检验。先由F检验确认两组数据间的精密度无显著性差异后,才能使用t检验判断两组数据的平均值是否存在系统误差。因为只有当两组数据的精密度无显著性差异时,准确度的检验才有意义,否则将会得出错误的判断。
②单侧与双侧检验。检验两个分析结果间是否存在显著性差异时,用双侧检验;若检验某分析结果是否明显高于 (或低于)某值,则用单侧检验。t分布曲线两侧对称,双侧及单侧检验的临界值都常见,可根据要求选择,但多用双侧检验。F分布曲线为非对称,也有单侧检验和双侧检验的临界值,但多用单侧检验。
2.3.5 可疑值的取舍
在分析工作中,当重复多次测定时,常常会发现有个别数据与其他数据相差较远,这一数据称为可疑值 (也称离群值或极端值)。对可疑值的取舍主要是区分该值与其他测定值的差异是由 “过失”还是由偶然误差所引起。如果确定是由于实验中发生 “过失”造成的,则应弃去;而在原因不明的情况下,就必须按照一定的统计方法进行检验,然后再确定其取舍。由于化学分析实验中一般测量次数都比较少 (3~8次),不适宜用总体标准偏差来估计。通常采用舍弃商法 (Q检验法)或Grubbs法 (G检验法)来检验可疑数据。
1.舍弃商法 (Q检验法)
当测量次数不多 (n=3~10)时,按下述检验步骤来确定可疑值的取舍:
①将各数据按递增顺序排列:x1,x2,…,xn-1,xn,可疑数据将出现在序列间的开头x1或末尾xn;
②求出最大值与最小值的差值 (极差),即xmax-xmix;
③求出可疑值与相邻近值之差的绝对值,即|xi-x邻|;
④用可疑值与相邻近值之差的绝对值除以极差,所得商称为舍弃商Q(rejection quo-tient):
⑤根据测定次数n和要求的置信水平 (如95%)查表2-5得到Q表。
⑥判断:若Q>Q表,则弃去可疑值,否则应予以保留。
表2-5 不同置信水平下Q的临界值
【例2-9】测定某药物中Ca2+含量,所得结果如下:1.25%,1.27%,1.31%, 1.40%。问1.40%这个数据是否应保留 (置信度为95%)?
已知n=4,由表2-5查得Q表=0.84,Q<Q表,故1.40%这个数据应保留。
2.G检验 (Grubbs)法
检验步骤:
①计算包括可疑值在内的测定平均值;
②计算可疑值xi与平均值之差的绝对值;
③计算包括可疑值在内的标准偏差S;
④按下式计算G值:
⑤查表2-6,得到G的临界值Ga,n。当G>Ga,n,则该可疑值应当舍弃,反之则应保留。
判断G值的临界标准时,要考虑到对置信度的要求。表2-6提供了临界值Ga,n可供查阅。
表2-6 G检验临界值 (Ga,n)表
【例2-10】例2-9中的实验数据,用G检验法判断时,1.40%这个数据是否应保留(置信度为95%)?
解:已知n=4,计算得到 =1.31%,S=0.066%
查表2-6,得Ga,n=G0.05,4=1.46。G<Ga,n,故1.40%这个数据应保留。此结论与Q检验法相符。
综合以上讨论,在分析过程中获得一系列实验数据后,应对数据作出评价。首先要判断数据是否有效,可采用Q检验法或G检验法对可疑数据进行取舍;其次要判断数据测定过程中是否存在系统误差和偶然误差,即进行精密度检验 (F检验)和准确度检验 (t检验)。
【例2-11】某样品用标准方法测定4次,结果为:8.89%,8.95%,9.01%, 8.95%。采用新方法测定5次,结果为:8.99%,8.94%,9.10%,9.06%,8.80%。试用统计检验评价新方法的可靠性。
解:(1)计算统计量
标准方法:n1=4,=8.95%,S1=0.049%
新方法:n2=5,=8.98%,S2=0.12%
(2)G检验
新方法测定结果中,测定值8.80%与其他数据相差较远,为可疑值,对其进行G检验:
查表2-6,G0.05,5=1.67。G<G0.05,5,故8.80%应保留。
(3)F检验
查表2-4得F0.05,(4,3)=9.12。
F<F0.05,(4,3),说明两种方法精密度无显著性差别,可进行t检验。
(4)t检验
将S1,S2,n1,n2代入下式中,求得合并标准偏差,并进行t检验:
查表2-2进行双侧检验,t0.05,7=2.36。t<t0.05,7,说明新方法没有引入系统误差。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。