如果各博弈方策略的选择和行动不仅有先后顺序,而且后选择、后行动的博弈方在自己选择行动之前,可以看到前面的过程,这种博弈称为“动态博弈”,也称为“多阶段博弈”、“序贯博弈”。
在动态博弈中,一个博弈方的一次行动称为一个“阶段”。由于每个博弈方在动态博弈中可能有不止一次行动,因此,每个博弈方在一个动态博弈中就可能有数个甚至许多个博弈阶段。动态博弈一般用扩展形表示。
博弈方甲要开采一个价值4万元的金矿,缺1万元的资金,向乙借1万元,许诺开采到金子后与乙平分。如图5-1所示,这是一个两阶段的动态博弈。
图5-1 两阶段动态博弈
甲提出借钱的建议,但是第一阶段行动的不是博弈方甲,而是博弈方乙,乙的策略是{借,不借};如果乙选择了策略“借”,甲方可以开金矿,并且得到预期的4万元;现在轮到甲方采取行动,他的策略是{分,不分}。括弧中前一个数字代表乙的得益,后一个数字代表甲的得益,这种表示方法也称为“博弈树”。
博弈树把博弈的三要素形象地挂在了树上。博弈树把博弈方可以采取的所有可能的行动,博弈方所有可能的结果都在树上表示出来。
博弈树由节点和棱(也称枝)组成,节点又分为决策节点和末端节点,博弈树一般采用从上向下,或者从左向右的画法,将动态博弈的决策过程以及博弈方的决策都在博弈树的决策节点上表示出来。博弈树由棱来连接节点,决策节点是博弈方作出决策的地方,每一个决策节点都与在该决策节点上进行决策的博弈方相对应;每棵树都有一个初始决策节点,也称根节点,这是博弈开始的地方;末端节点是博弈结束的地方,一个末端节点就是博弈的一个结果;每一个末端节点都与一个得益向量相对应,这个向量按分量次序排列博弈的所有博弈方在这个结果下的博弈所得。换言之,得益向量以分量的形式,给出当博弈沿着导向这个结果的棱“进行到底”的时候,每个博弈方所获得的得益。博弈方的个数,就是得益向量的维数。这里的圆圈表示“决策节点”,小黑点表示“末端节点”,括弧中的数字表示博弈方选择相应的“行动路径”到达这些末端节点时所得到的得益。
扩展形方法还可以表示更复杂的动态博弈,如图5-2给出的“仿冒和反仿冒博弈”。
图5-2 仿冒和反仿冒博弈
B企业的产品被A企业仿冒了,如果B企业进行制止,A企业就停止仿冒;如果B不制止,那么A就继续仿冒。两个企业在仿冒和制止仿冒的问题上,有一个行动和利益的相互依存的博弈关系,是一个动态的博弈问题。假设仿冒最多进行2次,括弧中前一个数字代表仿冒企业的得益,后一个数字代表被仿冒企业的得益。
还有一些动态博弈,由于博弈的策略是无限的,无法用扩展形表示,一般可以用文字描述和数学函数表示。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。