【摘要】:网络中存在的信息量非常巨大,为了提高搜索效率,在搜索过程中,可以构造适当的启发式策略,来指导Agent的路径选择和搜索范围,使文档的搜索具有较强的目的性,以便删除不相关的结点。下面以图10-5所示的Web页面链接结构,说明采用启发式模式进行深度优先的搜索步骤:按照上述步骤,直至漫游完A1的全部页面分支。这里有两个前提:一是漫游到叶子结点后,将返回起始页面;二是页面的兴趣值如果小于给定值,也返回起始页面。
10.4.2 基于兴趣的启发式搜索策略[7]
图10-4 两类搜索引擎网络搜索顺序比较示意图
网络中存在的信息量非常巨大,为了提高搜索效率,在搜索过程中,可以构造适当的启发式策略,来指导Agent的路径选择和搜索范围,使文档的搜索具有较强的目的性,以便删除不相关的结点。下面以图10-5所示的Web页面链接结构,说明采用启发式模式进行深度优先的搜索步骤:
图10-5 基于兴趣的启发式搜索策略示意图
(1)预先设定一个兴趣阈值IT和兴趣基准IB。
(2)计算起始页面A1的目标相关度IA1作为页面A1的兴趣值,并设定当前兴趣值I=IA1。
(3)如果I≥IT,则继续漫游后续页面B1,否则结束漫游过程。
(4)漫游B1页面,计算页面B1的相关度IB1,令此时的兴趣值为I=I+(IB1-IB)。
(5)如果I≥IT,则继续漫游后续页面C1,否则返回A1,取I=IA1,开始漫游B2分支。
(6)按照上述步骤,直至漫游完A1的全部页面分支。这里有两个前提:一是漫游到叶子结点后,将返回起始页面;二是页面的兴趣值如果小于给定值,也返回起始页面。
采用兴趣漫游模式能大幅度提高搜索效率,并可通过调整兴趣基准来控制搜索范围。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。