6.2.4 基于概念的学习
在人工智能领域中,概念学习有着特殊的含义,通常被认为是从环境中获取结构描述(这个描述就叫做一个概念、一个模型或一个假设)。这里仅讨论智能信息系统中的概念学习、研究领域对象(如文献、专业术语、用户、提问等)及其关系的学习方法。
从应用的推理方式来看,有两种常用的概念学习方法:归纳概念学习和演绎概念学习。
1.归纳概念学习
归纳概念学习就是从经验实例中推导出一般结论。给出背景知识(BK)和概念的实例集合(E),当满足以下条件可以推导出概念C:
(a)BK\→E实例不是背景知识的逻辑结论
(b)BK∪E\→~C概念与实例、背景知识不矛盾
(c)BK∪C→E实例是概念和背景知识的逻辑结论
有时,由于描述空间的复杂性、缺乏专业知识或表达定义的困难,无法提供概念的显示描述,则实例归纳学习就很有用。应用该学习方法,可从专家或用户提供的实例中学习,还可从数据库的事实学习,发现和构造模型与规则,用来描述新的概念。
例如,智能信息系统可根据用户提供的背景知识和查询实例,应用归纳学习方法,建立用户分类模型。假设每个用户实例包括用户名、职业、学历、使用的专业概念、交互方式、系统经验等属性,在收集实例时,应识别重要的属性,减少次要的属性个数,删除无用条件,并给每个属性赋予重要程度值。如此处理,不仅提高了学习的经济性(减少了存储空间与计算量),而且可避免学习处理的错误导向。对于获取用户分类模型的任务来说,用户实例中的专业概念和系统经验是最重要的属性,他们描述了用户的领域知识水平和应用系统的技能。对每个实例的属性赋予重要程度值后,应用实例归纳学习方法(不同于简单的统计),可以判别哪些用户是专家,哪些用户是无经验的新手,以建立用户分类模型,并在查询实用过程中,逐步精练,直到满足所期望的要求为止。
应用归纳学习方法,还可以根据概念之间的相似和相邻关系推导出新的概念和新的关系。例如,已知事实
sim(c1,c2)表示概念c1和c2相似
sim(c1,c3)表示概念c1和c3相似和相似传递规则
if sim(X,Y)and sim(X,Z)
then sim(Y,Z);可以归纳推导出概念c1和c3之间的相似关系。
2.演绎概念学习
演绎概念学习也称解释型学习。演绎概念学习应用抽象的概念定义和领域理论,解释为什么一个观察实例表示一个给定概念。基于这种解释,可推导出一个可使用的概念定义。
已知:
一个抽象的概念描述;
概念的一个实例;
领域理论和操作标准;
确定:
一个包含该实例的可用概念描述。
其中,实例可从领域理论中演绎出来,而归纳概念学习中的实例不能从背景知识演绎出来。
应用演绎概念学习方法,可对一个实例进行内部分析,来同化大量信息。学习处理对于知识库中与实例相关的部分进行操作,清晰地解释假设或规则。为此,它必须解释有关效果,证明所给的实例,然后概括这种解释,以用于其他实例。
这两种概念学习方法对应着概括和分析方法。两者都涉及查找,但存在以下不同点:归纳方法应用较一般的描述,而演绎方法应用推理语言表达概念;归纳方法用较复杂的顺序控制查找,而演绎达到目标则终止;归纳的结果是学习到的新概念,演绎结果是查找路径本身。
在概念学习系统中,为了从实例推导概念,必须具有问题领域中起关键作用的知识。依据拥有背景知识的多少,概念学习可分为知识贫乏型学习和知识丰富型学习。
(1)知识贫乏型学习
当学习过程中具有很少或没有明显的领域知识可用时,可采用知识贫乏型学习方法。它不要求精细的知识表示和推理,依赖于事件的发生。该学习方法可细分为以下三种类型。
①参数学习:该方法预先描述模型的数字参数,用统计方法利用知识。例如,在向量模式信息检索系统中,使用标引词和权值(词在文献中的重要性或出现频率)描述文献,给检索词加权(重要程度)描述提问。学习方法集中于权值的操作,主要根据用户对检索结果的相关反馈信息,修改提问或文献中词的权值。例如提高相关文献中词的权值,降低不相关文献中词的权值,或将该词删除,从而寻找正确的权值。同时还可利用文献的词频统计信息,构造词表知识库,并在使用过程中,不断利用相关反馈,修改词表中的词和词之间的关系。
②基于相似性的学习:该方法对于可能的概念描述空间,根据实例结构之间的相似性或差异,寻找最好的描述。这种学习处理应用基于统计方法的似然推理。例如利用相似测量,查找文献与提问的最佳匹配模式,以及获取概念之间的相似关系和从属关系。
③分级学习:每当学到一个概念,该方法就扩展描述语言。它允许使用旧的概念建立新的概念描述,因此,背景知识可不断增加。
(2)知识丰富型学习
这种类型的学习主要依赖于知识库和推理,即利用计算机中存储的大量信息进行学习。它又细分为以下两种不同方法。
①基于模型的学习:模型(如框架、模式等)常常描述问题领域的深层知识结构。它可被用于同化新知识,使学习机制建立关于对象或未来事件的期望值。当有实例违背模型的期望值,则学习机制将查找一个解释,从而扩展新知识。利用模型可以执行定性模拟,自动产生任何可能概念或行为的实例,然后应用这些实例进行归纳学习,产生可用的新概念或决策规则。因此,基于模型的学习综合运用了解释和归纳学习方法。
利用这种学习方法,可对较窄的专业领域建立标准的语法模型和语义模型,然后利用模型结构来定义新的概念。当一个语句满足这种结构模型,则要求获取处理,概括出新词汇,还可以归纳出新的词间关系或构词规则,建立和扩展专业词表。例如IOTA智能信息检索系统应用词的同现率统计和伪语法模型,从自然语言文本获取专业知识,建立专业知识库。同理,利用问题领域的分类模型(如文献分类模型),对用户初始提问信息进行解释、修改和扩充,可以产生理想的提问描述。
②通过发现学习:它是系统自身的操作,执行实验来扩展系统的知识库。它可利用演绎方式或归纳方式,查找感兴趣的事物,检验概念的实例来形成猜测,或证明这些猜测。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。