相对于这种以一定概率分布在一些策略中随机选择的混合策略,确定性的具体的策略称为“纯策略”,而原来意义上的纳什均衡,即任何博弈方都不愿单独改变策略的纯策略组成的策略组合可称为“纯策略纳什均衡”。当然,纯策略也可以看作是混合策略的特例。纯策略可以看作是选择相应纯策略的概率为1,选择其余纯策略的概率为0的混合策略。混合策略可以看作是纯策略的扩展。
引进了混合策略的概念以后,我们可将纳什均衡的概念扩大到包括混合策略的情况。对各博弈方的一个策略组合,不管它是纯策略组成的还是混合策略组成的,只要满足各博弈方都不会想要单独偏离它,我们就称为一个纳什均衡。如果确实是一个严格意义上的混合策略组合构成的纳什均衡,称为“混合策略纳什均衡”。
我们仍以硬币博弈为例,假定博弈方1推断博弈方2会以q的概率出“正面”,以1-q的概率出“反面”,即博弈方1推断博弈方2将使用混合策略(q,1-q)。据此推断,博弈方1出“正面”可得的期望得益为q·(-1)+(1-q)·1=1-2q,出“反面”的期望得益为q·1+(1-q)·(-1)=2q-1。由于当且仅当q<1/2时,1-2q>2q-1,则q<1/2时,博弈方1的最优纯策略为出“正面”;q>1/2时为出“反面”;当q=1/2时,博弈1出哪一面都是无差异的。同样,博弈方2也必须以1/2的概率出“正面”和“反面”,才能使对方无机可乘。猜硬币博弈中两个博弈方都以(1/2,1/2)的概率分布随机选择“正面”和“反面”的混合策略组合,就是一个混合策略纳什均衡。
期望得益:
这是零和博弈。
下面给出几个分析混合策略纳什均衡的例子。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。