首页 理论教育 知识检索过程

知识检索过程

时间:2023-03-04 理论教育 版权反馈
【摘要】:在形成初步的检索结果后,即进入结果优化阶段,向用户显示结果,获取反馈信息。此时系统将根据用户的反馈信息调整查询式并进行新一轮的知识检索。由此可见,系统提供的知识检索过程是一个循环反复的反馈和优化过程,试图在交互中不断逼近用户的真实需求,达到检索的最佳效果。

9.2.3 知识检索过程

KRetrieval原型系统在本体知识组织的基础上实现基于概念的知识检索,其检索过程如图9-3所示。

img90

图9-3 KRetrieval检索过程示意图

由图9-3可以看出整个检索过程可以分为查询式转换、知识检索和结果优化三个阶段。系统获取用户输入的检索概念后,依据概念知识库中的领域知识,对检索概念集合进行转换、联想和扩充。在形成新的相关概念集合之后,进入文献知识检索阶段,对索引知识库进行访问,获取与相关概念匹配的文献集合,进而访问文献知识库,获取详细的文献知识信息。在形成初步的检索结果后,即进入结果优化阶段,向用户显示结果,获取反馈信息。此时系统将根据用户的反馈信息调整查询式并进行新一轮的知识检索。由此可见,系统提供的知识检索过程是一个循环反复的反馈和优化过程,试图在交互中不断逼近用户的真实需求,达到检索的最佳效果。

1.用户查询式转换

前面讨论了通过语言本体和领域本体来优化用户查询式,以提高检索质量。应用这种方法的前提是用户的查询概念与系统概念属于同一个概念空间,这样系统才可能正确理解用户概念的语义。但是实际应用中常常出现的情况是:某个特定用户查询概念在系统概念空间中不存在,或者与系统概念有语义上的差异,这就需要对用户查询概念及概念空间进行转换。转换过程需要的知识就是用户本体库中的概念及其关系。

查询式概念的转换通过执行一套名称转换规则来实现。转换过程描述如下:

(1)假设用户的查询概念项集合为K(K1,K2,…,Kn),对于其中的每Ki,在概念名称映射列表中查找与其匹配的记录,获取Ki的映射概念集合(X,Y,Z,…)和映射关系。

(2)根据映射关系执行下面的规则:

如果X为Ki的同义词,则用X替代Ki;

如果X为Ki的上位词,则用X替代Ki;

如果X和Y均为Ki的上位词,则用X and Y替代Ki;

如果X为Ki的全义词,则用X替代Ki;

如果X和Y均为Ki的全义词,则用X or Y替代Ki;

如果X为Ki的上位词,Y为Ki的全义词,则用X and Y替代Ki;

如果X同时为Ki和Kj的全义词,则用X替代Ki和Kj(i≠j).

2.语义知识检索

系统将用户的查询式进行优化和转换后得到一个相关概念集合,然后应用语义检索方法执行对本体实例对象的检索。其检索算法的描述是:首先建立一个空的相关实例文献列表,对于相关概念集合中的每一个概念Ci,依次查找索引知识库,获得与Ci相关的实例文献,加入实例文献列表中,每一篇文献的权重与Ci的权重相同,如果待加入的文献已经包含在实例文献列表中,则权重累加。最后,将获得的全部文献按权重排序,将权重较大的一组文献作为检索结果。

3.检索结果的优化

用户本体库中的用户兴趣知识可用于对知识检索结果进行优化处理,保留符合用户兴趣的数据,去除与用户兴趣相关度不大的数据。

假设检索器获得的初始检索结果集为Dr,对于每一条事实数据,首先通过自动分类器进行分类学习,选择代表其内容的若干相关概念(这个过程和学习用户相关概念的过程类似),然后检索器检查这些概念的用户兴趣相关度,并通过这些相关度的平均值来计算用户对该文档可能的兴趣程度。具体来说:假设检索器获得的某结果数据的初始权重为wr,与该数据最相关的概念集合为Cr,Cr中的概念的用户兴趣相关度用UCir表示,则经过调整后的结果数据的权重为:

img91

其中,n为Cri中所含概念的总数。由此可见,在结果数据的新权重中加入了对用户兴趣因素的考虑。依据新的权重,对检索结果中的数据重新进行排序,去掉阈值以下的文档,即可完成针对具体用户的个性化检索。

检索结果可以使用两种方式组织:一种是按概念分类的可视化组织方式,依次显示概念扩展阶段获得的相关概念、概念的相关度、概念的分类号以及与该概念相关的文献,并根据概念相关度的大小排序。另一种是按文献的方式,即检索结果按文献进行分类,依次显示文献检索阶段获得的相关文献、文献的相关度、文献的分类号以及与该文献相关的概念,并根据文献的相关度大小排序。无论是哪一种显示方式,用户都可以获得相关概念的集合和实例文献集合。还可以在其中选择实际相关的概念,或者输入新的检索概念,进行二次检索,直到用户满意为止。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈