首页 理论教育 化学计量学的研究对象与内容

化学计量学的研究对象与内容

时间:2023-02-12 理论教育 版权反馈
【摘要】:化学计量学作为一种方法学学科,其主要研究对象是各类数据,因此数据的处理分析以及信息挖掘是化学计量学的主要研究内容。化学量测的最终目的是获取所研究对象的定性或定量信息。尺有所短,寸有所长,化学计量学有传统化学方法没有的优点,但也存在其局限性,只有合理、正确地应用化学计量学理论和方法,才有可能解决好实际化学问题。总之,化学计量学所包含的内容是极其丰富的,目前各种传统的化学教科书中基本没有反映这些内容。

1.4 化学计量学的研究对象与内容

化学计量学为化学量测提供了理论和方法,为各类波谱及化学量测数据的解析、化学化工过程的机理研究和优化提供了新途径。如图1-1所示,化学计量学涵盖了分析化学的全过程,包括采样理论和方法、实验设计与化学化工过程的计算机模拟、化学定量构效关系、化学信号处理、分析信号的校正与分辨、化学模式识别、化学数据库、人工智能与化学专家系统等,是一门内涵相当丰富的化学学科分支。

img3

图1-1 化学计量学涵盖了分析化学的全过程

采样与实验设计理论比较成熟,有关报道多为应用研究。化学计量学作为一种方法学学科,其主要研究对象是各类数据,因此数据的处理分析以及信息挖掘是化学计量学的主要研究内容。

本书作为化学计量学的入门读物,旨在通过实例介绍相关基础方法的原理和应用。为使读者具备运用化学计量学方法进行数据分析和信息解析的能力,本书只介绍了一些比较基本的方法和内容,至于化学计量学中前沿和比较繁难的主题,有兴趣的读者可以参阅其他相关资料与文献。

本书主要内容包括:数学基础知识与MATLAB简介、相关分析及其应用、回归分析及其应用、实验设计与实验数据的处理、主成分分析及其在回归分析中的应用、化学校正理论及光谱定量分析技术、化学模式识别及其应用、如何用好化学计量学。

学习本书内容需要线性代数、统计分析的基础知识。考虑到初学者的基础不同,为了方便起见,本书第2章进行了有关数学基础知识的简要回顾并对MATLAB的使用进行简单介绍。

我们对所研究的对象通常采用一些变量进行描述,这些变量是否独立、相互间有无关联对于建立数学模型有很大影响。相关分析是对变量进行评估和筛选的一种有效方法。只有当自变量和因变量之间存在相关性时进行定量或定性分析才可能建立有意义的统计模型。所以相关性分析是在进行数据分析和处理之前对其进行初步评价和筛选的简单可行的方法,本书的第3章对有关内容和应用进行介绍。

对于所获得的分析与测试数据,化学计量学最常用的方法就是采用各种统计回归的方法建立以测试数据(或来自测试数据的量)为自变量、待求信息为因变量的回归模型,从而达到用回归模型预测所需信息的目的。常用的统计回归方法有很多,如多元线性回归(MLR,Multiple Linear Regression)、二次回归、主成分回归(PCR,Principal Component Regression)、最小二乘(LS,Least Square)、偏最小二乘回归(PLSR,Partial Least Square Regression)等。这些均是建立定量数学模型的常用数学方法,在具体应用时,需要根据研究对象的特点选择合适的方法。本书第4章主要介绍线性回归方法,主成分回归及偏最小二乘回归在第6章进行介绍。

化学实验设计的目的是用较少的实验次数尽可能多地获得实验因素与目标之间关系的信息。传统化学工作者采用一次一个变量的实验设计方法不仅费时、不经济,而且对于多因素问题往往难以达到总体优化。化学计量学中的实验设计一般都是以多因素实验为基础的,其中正交实验设计是一种常用的优化实验设计方法,已为广大化学、化工及其他研究领域的工作者所采用。而后来出现的均匀设计比正交设计具有工作量更小的优点。单纯形优化(Simplex)是一种序贯实验设计方法,它简单、信息量多,在分析化学中的色谱、光谱等实验条件优化以及在化工过程生产条件优化等方面有很多应用。本书第5章对这方面内容进行介绍。

主成分分析或基于主成分分析的多变量统计方法,可处理多因素相互影响的复杂体系,对于信息重叠、相关性较强的化学信息可借助主成分分析进行信息压缩与独立信息的抽提。此外,主成分分析在众多变量中提取起主要作用的因素,有助于进一步认识事物的本质。主成分分析的方法常与模式识别、多元校正(回归)等方法联合解决化学中的问题,本书的第6章以主成分分析为核心,介绍其在信息压缩、多元校正(回归)中的应用,主成分分析在模式识别等定性分析中的应用在第8章进行介绍。

实际的化学量测系统一般都是多组分共存的体系,组分之间的干扰是难免的,化学量测得到的往往是多组分信息重叠的混合图谱,必须将这些复杂信号进行分辨、解析后,才能得到系统中各单一组分的信息。传统的化学量测常采用繁琐、冗长的化学分离或掩蔽等方法获得单一组分的信息。但在很多情况下,仅靠化学方法解决多组分系统的分辨常常是很困难的。第7章介绍的多元校正理论可以根据多元物系的图谱信息进行多组分同时测定而不必进行化学分离实验。

化学量测的最终目的是获取所研究对象的定性或定量信息。这些信息有些可用实验直接测得,但有些信息是一种隐含的性质,难以直接用化学方法测量而得到。例如,我们可以测定某矿石样品中的各种元素含量,但无法直接测定它属于不同矿石中的哪一类。像这种分类或判别等问题,常常是不能直接测定的一些隐含性质。一般来说,对于单因子或两因子的判别分类问题,人们有较强的判别能力,但对于多因子系统的判别分类则需要借助模式识别技术。模式识别是以多元统计分析及相关数学理论和方法为基础发展起来的提取研究对象中隐含信息的多因子判别分析方法。聚类分析、判别分析、非线性映照等方法在化合物的结构-性能关系研究、疾病辅助诊断、环境污染源分析、质量控制等方面得到成功应用,本书的第8章对模式识别方面的内容和应用进行介绍。

尺有所短,寸有所长,化学计量学有传统化学方法没有的优点,但也存在其局限性,只有合理、正确地应用化学计量学理论和方法,才有可能解决好实际化学问题。为此,本书第9章对相关原则进行了讨论。

总之,化学计量学所包含的内容是极其丰富的,目前各种传统的化学教科书中基本没有反映这些内容。一些欧美国家已将化学计量学设为本科高年级与研究生的必修课,并开发了相关的软件用于科研与教学。我国一些高校也开设了这门课程,作为化学类专业的学生及教师、科研工作者,了解其内容并在一定程度上掌握某些与所从事领域相关的专题是十分必要的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈