首页 理论教育 别及其应用

别及其应用

时间:2023-02-12 理论教育 版权反馈
【摘要】:人们通过建立各类化合物的各种红外光谱、极谱、质谱、核磁等谱图数据库,借助于计算机模式识别方法,可自动鉴定样品的结构。用计算机模式识别方法总结规律预报未知,虽然不如彻底的理论方法严格和有明确的机理及解释,但却有广泛的适应面,能够在现有知识、理论不够完善的情况下发挥作用。另外需要指出的是,用模式识别的方法找出的规律都是经验规律,不同于基于理论推导产生的模型。

第8章 化学模式识 别及其应用

本书前几章中,我们关心的是如何根据某些实验数据(自变量)去获得另外一些数据或信息(因变量),或对得到的数据进行简化、综合分析,采用了多元统计与回归分析中的一些方法来建立变量间的定量关系或进行变量间的相关性分析,进一步根据分析结果或建立的模型来确定我们所关心的一些性质的具体的数值(如最佳实验条件,物质的组成或含量等)。

但是,在日常生活、科学研究或生产活动中,我们还经常碰到一些分类和识别的问题。如判断一个人的胖瘦;对烟、酒、茶叶进行分级或者鉴定化妆品、药品、文物的真伪等。这些问题的共同特点是研究对象通常采用多个指标来描述,而对研究对象的分类与识别无法根据其中的某个指标来简单判断。例如:判断人的胖瘦仅凭体重是不够的,还需要考虑身高、腰围等数据综合评价,对于更为复杂的问题,如茶叶分级传统的做法是根据色、香、味、气等因素由专业人员根据经验进行判定,整个过程难以量化和描述。若根据茶叶的理化性质进行分级,则需要检测茶叶中的氨基酸、咖啡碱、水浸出物、粗纤维、叶底、茶汤等理化指标,然后通过综合处理这些检测数据,对茶叶进行分级。再比如:一个人是属于高个还是矮个,只要我们给定一个界限H,大于H者为高,小于H者为矮。而要判断一个人是否健康,就不那么简单了,要涉及心脏、肝、肺、四肢、五官等各项指标,以这些指标为特征,对人群进行健康程度划分,这时用人脑、眼直观判别分类就很困难。

这一类问题通常叫做定性分析,也叫做模式识别。在很多情况下,由于研究对象的特性不是由一种因素决定的,而是与多种因子有错综复杂的关系,单靠简单分析往往难于有效地抽提经验规律。借助于计算机信息处理技术往往能帮助我们总结规律,预报未知。计算机模式识别(Computational pattern recognition)技术就是一种解决这类问题的有用手段。

例如,在鉴定一种未知的化合物时,我们通常对它做各种红外光谱、核磁、极谱等图谱信息,并根据这些谱图综合判断化合物的结构及分子式。由于化合物及其谱图数据众多,进行这种综合判断即使是有经验的专家也非易事。人们通过建立各类化合物的各种红外光谱、极谱、质谱、核磁等谱图数据库,借助于计算机模式识别方法,可自动鉴定样品的结构。目前红外仪、质谱仪、核磁共振仪及气质联用等仪器均配有专门的数据库及对谱图进行模式识别的软件,软件可根据检测的样品谱图在所配备的数据库中寻找与其最接近的物质分子并给出匹配度指标。

再例如,人们已积累了大批物质的化学结构数据和物理、化学特性或生物活性的数据,却常常未能详尽地查明结构与性质关系的详细机理。为了掌握结构与性质关系的规律,以便更有效地合成、试制新材料、新药物,可用计算机模式识别方法总结经验规律,预报未知物的特性,有目的地研制新物质。

用计算机模式识别方法总结规律预报未知,虽然不如彻底的理论方法严格和有明确的机理及解释,但却有广泛的适应面,能够在现有知识、理论不够完善的情况下发挥作用。在用计算机模式识别方法解决问题时,我们仍需要借助于与研究对象相关的理论知识,去估计、判断影响研究对象的大致因素,用这些因素的参数构筑多维空间(即模式空间)描述研究对象的特征,才能用模式识别的方法总结规律。

另外需要指出的是,用模式识别的方法找出的规律都是经验规律,不同于基于理论推导产生的模型。使用这种方法需要大量实验数据作为信息来源,计算机本身不可能创造、产生信息,它只是信息的“加工厂”。人们根据已有的数据来“训练”计算机,使其“认识”规律,才能预报未知。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈