首页 理论教育 影响近红外定量分析模型的因素

影响近红外定量分析模型的因素

时间:2023-02-12 理论教育 版权反馈
【摘要】:近红外定量分析模型本质上仍是基于统计分析建立的模型,该模型是否能良好地反映近红外光谱与所要测得化学性质间的关系受到多重因素的影响。所以,在应用近红外技术进行定量或定性分析时,需要定时进行模型维护。液体样品的澄清度、透明度也会影响到样品近红外光谱的质量。

7.4.2 影响近红外定量分析模型的因素

近红外光谱技术的广泛应用得益于计算机技术与化学计量学建模方法的结合。要想很好地利用近红外光谱技术、提高分析效率、获得良好的分析结果,需要建立性能良好的近红外定量分析模型。近红外定量分析模型本质上仍是基于统计分析建立的模型,该模型是否能良好地反映近红外光谱与所要测得化学性质间的关系受到多重因素的影响。现对影响近红外定量分析模型评价指标(r、RSMEV、R2及RSMEC)的主要因素总结如下。

(1)近红外检测极限的影响。近红外光谱国际公认的检测极限为0.1%,如果样品浓度低于该阈值,近红外检测器的灵敏度不足以反映出对象存在的性质差异,会导致近红外模型预测偏差较大。因此,对于含量低于近红外检测极限的物质不宜采用近红外技术进行定量预测。

(2)参考方法精度的影响。采用统计方法建立近红外定量分析模型,从数学上而言可以追求很小的RSMEC、RSMEV,使模型具有很好的拟合与预测功能。但需要牢记的是近红外定量分析只是一个间接方法,其建模样本因变量的化学值仍需借助传统分析方法(如HPLC、GC、流动注射分析等方法)获取。因此,用于建立近红外定量模型的因变量值本身就受传统分析方法的制约,存在有测试误差。作为一个间接方法,近红外模型的RSMEC、RSMEV值只要达到传统方法所对应的精度即可,追求过低的RSMEC、RSMEV只是数学上的游戏并不能使近红外模型实际精度高于参考方法的精度。

因此,在建立近红外定量模型之前,对所用参考方法的精度进行了解和评价对于选择合适的近红外模型参数、合理评价近红外模型是非常有益的。

(3)建模样本的代表性及数目。要建立一个好的近红外定量预测模型,必须有足够数量的有代表性的建模样本。具体取多少建模样本合适,缺乏权威的数据与报道,理论上而言,建模样本越多,从统计意义上而言会提高统计模型的可靠性。但如果建模集样本的代表性不好,其化学性质分布在一个很小的区间中,以其为基础建立的近红外定量模型必定不具备广泛的代表性,只能在很窄的区域里使用。

文献[6—7]表明选择合适的校正集(建模集)样本并在校正集优化筛选过程中考虑建模集样本与预测集样本间的相关性有助于改进多元校正模型的预测功能。因此,一个好的近红外定量模型要求建模样品的覆盖范围要尽可能宽且尽可能避免化学信息基本相同的样品出现,而且建模样本数一般不能太多,以免在增加信息量的同时增加干扰信息,降低模型的预测性能。大多数近红外仪厂家所提供的定量分析软件里没有建模样本筛选的功能。如果用户对于样品化学值的分布事先不了解,这会给初次建模带来较大的困难和工作量。

文献[8]提出根据样品近红外光谱的第一主成分筛选校正集样本是一种比较简便可行的方法。

(4)建模方法的影响。对于相同的建模集,采用不同的建模方法会得到不同的近红外定量分析模型,方法的不同会对模型性能产生影响。不进行实际运算和比较,很难判断何种方法会获得最佳模型。一般来说,PLSR会给出比较稳健和良好的结果,但有些时候其他方法会给出比PLSR更好的结果。

(5)预测样本性质波动与模型的维护。从近红外技术的原理不难得知,近红外定量分析模型只能对其建模集样本能够覆盖的预测集样本进行良好的预测——这犹如我们建立一个HPLC分析方法时会给出标准工作曲线的线性范围,即物质浓度在线性范围内的样本可以采用该工作曲线分析其对应物质的浓度,若分析结果超出工作曲线的线性范围,则结果不予采信。对于化学指标超出建模集样本覆盖范围的预测样本,近红外模型是否可以给出可靠和足够精确的分析结果很难判断。所以,在应用近红外技术进行定量或定性分析时,需要定时进行模型维护。即在模型使用一段时间后,定期将新的样本加入的建模集中并剔除建模集中一些老样本后重新建模,采用新的近红外模型进行预测。例如烟草行业采用近红外技术进行烟叶中主要物质化学值测试时,通常在每年采收新烟叶时进行模型的维护。将当年的新烟叶中有代表性的样本加入到建模集中,把建模集中比较老的样本(如几年前的)剔除后重新建模,以使模型能较好代表当年的新样本情况。

文献[9]采用PLSR方法建立近红外定量模型并根据模型的残差计算建模样品的主成分空间的统计参数Q与T2的临界值Qlimimg688,在用所建模型进行新样品性质预测时,先将新样品近红外光谱在建模样品的近红外光谱的主成分空间投影,采用新样品主成分与设定的误差极限预测该样品的Q与T2值,若Q<Qlim,T2img689,则认为该样品与建模样本相似,可以采用所建近红外模型预测其性质;如新样品的Q>Qlim,T2img690,则认为该样品与建模样本不相似,测试其对应的化学性质并将其加入建模集中重新建模。这一方法在日常模型运用时可及时发现异常的新样本并将其加入建模集,可起到对模型及时维护和更新的作用。

(6)环境、样品状况的影响。不同的环境温度、湿度对物质近红外的吸收特性都有影响,因此应该保持环境温度、湿度的一致性,减小环境的影响,保证较小的系统误差。

此外,对于固体样品,样品的粒度会影响样品的近红外吸收特性,当样品粒度不均匀时,不同粒度样品的近红外散射系数不同,造成吸光度的变化,从而降低近红外光谱质量,影响近红外光谱分析数学模型的预测精度[10]。如文献[3]采用细粉末烟叶样品所建近红外烟碱预测模型的各项评价指标均较粗粉末样品所建模型好,且实际预测准确性高。

液体样品的澄清度、透明度也会影响到样品近红外光谱的质量。无论是固体还是液体样品,水分都会对近红外吸收产生很大影响,文献[11]研究表明面粉中水分与面粉的蛋白质、粒度、灰分含量均呈负相关且相关系数的绝对值均达到0.95以上。由此可见水分对样品中物质含量的影响很大,如果目标不是测样品的含水量,而待测物质浓度又不高并且低于样品中水分含量时,对样品含水量进行平衡处理是很重要的。

图7-3为我们对烟叶粉末样品进行水分平衡处理前后的样品连续多次重复测试的n根光谱的标准方差光谱SVSRS(Standard Variance Spectrum of Repeat Spectra),其计算公式见式(2-11)。显然,经水分平衡处理后烟叶样品的SVSRS降低,说明处理后样品中水分造成的近红外响应的波动降低,提高了光谱质量。文献[12]考察了烟叶样品水分质量分数对近红外模型预测烟叶常规化学成分含量结果的影响,发现样品含水量>10%时,各常规化学成分的测定误差随样品含水量的降低而减小;当样品含水量<10%时,样品水分差异引起的近红外模型对总糖、总氮和烟碱的测试误差可以忽略不计。

img691

图7-3 水分平衡处理前后烟末样品精密度测试近红外一阶导数光谱的标准方差

(7)光谱预处理方法及波长区间的影响。由于仪器、背景、样品性质及一些随机因素的影响,得到的样品原始近红外谱图一般都需经过适当的预处理以有效地去除噪声等干扰因素的影响,使有用信息凸现出来,从而提高建模质量。本书2.5.3介绍了几种常用的光谱预处理方法。

虽然光谱的预处理可以在一定程度上起到滤噪、去除背景干扰影响的作用,光谱区间的选择对近红外模型选定建模的性能仍有较大影响。通常近红外仪上自带软件也有区间优化功能。但在应用近红外光谱建模时掌握一些基本的区间选取原则仍是非常有益的。

一是应当剔除信号不稳定的光谱区间,不稳定的信号意味着该区间提供的信息不可靠,采用其作为自变量去预测样品的化学性质显然是不合适的。二是剔除光谱信息没有变化的平滑区间,因为该区间的近红外响应基本是一常数,说明无论样品中的物质有何变化在这段光谱无法体现。因此没有必要选取该区间光谱进行建模。

例如,图7-4为在三台不同型号近红外仪上连续采集的n根某烟末样品近红外光谱的标准方差光谱SVSRS,由图可知,对于Ⅰ和Ⅱ两个型号近红外仪,其在3 700cm-1之前的光谱波动很大,不宜采纳。

图7-5为不同提取时间下丹参水提液的近红外光谱,在水的特征吸收带1 940nm附件出现了饱和平头峰,因此在建模时应剔除该饱和区间。近红外仪自带软件在选择建模区间时选取了1 300~1 600nm和2 200~2 400nm建立丹参水提液中丹酚酸B和丹参酮IIA的定量分析模型。

img692

图7-4 不同仪器同一样品精密度测试近红外一阶导数光谱的标准方差(局部)

img693

图7-5 不同提取时间下丹参水提液的近红外光谱

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈