2.4.4 基于目标的智能体
知道当前的环境状态并非总是足以帮助决定做什么。例如,在路口,出租车可以向左转,向右转,或者直行。正确的决策取决于出租车要去哪里。换句话说,智能体不仅需要当前状态的描述,而且需要某种目标信息来描述想要达到的状况——例如,要到达乘客的目的地。智能体程序会把这种信息和可能行动的结果信息(和反射型智能体用来更新内部状态的信息相同)结合起来,以选择达到目标的行动。图2.13展示了基于目标的智能体的结构。
图2.13 基于模型和目标的智能体。它既追踪记录世界的状态,又记录它要达到的目标集,并选择能(最终)导致达成它的目标的行动
有时候基于目标的行动选择是直接的,当单个行动马上能产生目标满足的结果时。而有时候需要更多的技巧,当智能体不得不考虑一条曲折而漫长的行动序列来找到达成其目标的途径时。搜索(第三到六章)和规划(第十一和十二章)是致力于寻找达成智能体目标的行动序列的人工智能子领域。
注意此类决策与前面描述的条件-行动规则有根本的不同,因为它涉及到对未来的考虑——包括“如果我如此这般做了会发生什么?”以及“那样做会让我感到高兴吗?”这样的问题。在反射型智能体设计中,这种信息没有被明确表示出来,因为内建的规则直接把感知映射到行动。反射型智能体在看到刹车灯的时候就刹车。而原则上,基于目标的智能体会推理如果前面的车辆刹车灯亮起表明它将要减速。对于已知的世界通常发展的方式,能够达到不碰撞其它车辆的目标的唯一行动就是刹车。
尽管基于目标的智能体显得效率低些,但是它更灵活,因为支持它决策的知识都被显式地表示,并且可更改。如果开始下雨,智能体将会更新关于它的刹车操作效率有多高的知识;这将自动引起对所有相关行为的修改以适应新的条件。另一方面,对于反射型智能体,我们不得不重写很多条件-行动规则。基于目标的智能体的行为在要前往不同的地点时改变起来很容易。而反射型智能体关于什么时候转弯和什么时候直行的规则仅对于单一目的地是可行的;要前往新的某处,很多规则都要替换。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。