智能搜索引擎系统的总体框架模型如图10-1所示。该模型采用扩展式的客户端/服务器结构,包括表示层、应用层和数据层三层应用服务。
图10-1 智能搜索引擎体系结构
1.表示层
表示层主要的功能是给用户提供一个友好的人机界面,管理和实现用户和系统的交互,将用户提交的检索请求传递给应用层和数据层所在的服务器,同时负责接收服务器端的检索结果,并显示给用户。
2.应用层
应用层是实现智能搜索的主要应用逻辑,由智能搜索模块与用户模型库两部分组成。智能搜索模块能实现对用户搜索的“代理”,“理解”用户的提问,主动获取满足用户需求的信息并推荐给用户。用户模型库能与智能搜索模块进行交互,是其功能实现的依据和保障。
(1)智能搜索模块
智能搜索模块的结构如图10-2所示。它由各种Agent及共享知识库、本体库和本地信息库构成。
图10-2 智能搜索模块
①用户Agent:能对用户输入的检索提问进行解析、细化,形成初步检索式;能接收用户对检索结果的反馈;通过检测用户与系统交互过程中用户的检索行为,分析用户行为的意图,获取用户感兴趣的相关信息及其感兴趣的程度;将检索结果提交给用户。
②学习Agent:负责对用户Agent收集的用户信息进行分析和处理,实现用户模型的建立及其动态维护。
③处理Agent:对检索提问进行预处理,在用户模型库中查找相关或相似信息,借助本体知识对检索提问进行规范化处理;对搜索Agent在远端搜索到的信息进行处理并存入本地信息库;对搜索到的结果按用户需求进行分析、过滤,并将有用信息选择、推荐给用户;定期根据用户的偏好对本地信息库进行整理、分类。
④检索Agent:负责执行本地搜索,完成本地信息库的知识检索服务。
⑤搜索Agent:负责执行远程搜索,获取符合检索提问的相关信息,同时对用户感兴趣的站点进行监测,以便通知用户所监测站点的最新更新内容。
⑥控制Agent:对各个Agent的执行顺序和交互行为进行控制和协调。
⑦本体库:用于存储领域集、关键字集以及本体的相关知识等。
⑧本地信息库:主要存储搜索Agent从远端带回的并经过处理了的信息。
(2)用户模型库
用户模型库包括用户知识模型和领域知识模型。领域知识模型主要包含有关领域的知识,可以帮助实现处理Agent对用户检索提问的预处理;同时领域知识模型可以存储相关领域的成功搜索案例。用户知识模型中的信息则是有关系统用户的信息,如用户的知识背景、兴趣爱好等个性描述信息。搜索引擎通过和用户进行交互操作,对用户的信息进行收集、学习,建立用户的用户知识模型和领域知识模型,并及时发现用户信息的变化以更新用户知识模型,适应用户需求的动态变化。
3.数据层
数据层主要由信息搜集与处理模块构成。图10-3显示了信息搜集与处理模块的基本结构。该模块的工作原理是:通过网络爬虫、网站提交等方式收集网页,建立原始网页数据库,然后利用领域知识库和兴趣库对原始网页数据库通过信息抽取与组织模块形成各个类型的网页索引数据库。其中信息抽取与组织模块主要负责分析、提取原始网页数据库中存储页面的相关信息,依据一定的相关度算法及数据挖掘与聚类技术,建立各个类型的网页索引数据库。数据层能够实现对Internet上的信息的“先”处理,即将数据“归类”,以简化搜索Agent的搜索过程,并利用兴趣库及领域知识库,结合用户的兴趣,以便实现主动推送服务及专题信息的搜索。
图10-3 信息搜集与处理模块
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。