首页 百科知识 混合策略纳什均衡

混合策略纳什均衡

时间:2023-07-17 百科知识 版权反馈
【摘要】:混合策略纳什均衡_经济学原理 修订版如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。我们可以根据上述条件构造如图8-5所示的支付矩阵,每一种游戏依据其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略,使得每人都赚得最多或亏得最少;另一种是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。

如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略。纯策略的收益可以用效用表示,混合策略的收益只能以预期效用表示。混合策略中的纳什均衡是指:均衡时,给定对方选择策略的概率,每个选手选择的含有概率的策略都是最优的。混合策略最形象的例子是“剪刀、石头、布”的游戏和猜硬币游戏。在这样一个游戏中,不存在纯策略均衡。对每个人来说,出“剪刀”“布”还是“石头”的策略应当是随机的,不能让对方知道自己的策略,甚至是策略的倾向性。一旦对方知道自己出某个策略的可能性增大,那么在游戏中输的可能性也就增大了。下面以猜硬币游戏来说明混合策略问题。

B和A玩硬币游戏,B提出:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情况你给我2元就可以了。”这个游戏公平吗?

我们可以根据上述条件构造如图8-5所示的支付矩阵,每一种游戏依据其规则的不同会存在两种纳什均衡,一种是纯策略纳什均衡,也就是说玩家都能够采取固定的策略(如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;另一种是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡。

图8-5 硬币游戏

假设A出正面的概率是x,反面的概率是1-x。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,不然对手总是可以改变正反面出现的概率让我们的总收入减少,由此列出方程就是3x+(-2)(1-x)=(-2)x+1(1-x)。

解方程得x=3/8,也就是说平均每8次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3x+(-2)(1-x)中就可得到每次的期望收入,计算结果是-1/8元。

同样,设B出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)(1-y)。

解得y也等于3/8,而B每次的期望收益则是2(1-y)-3y=1/8元。这告诉我们,在双方都采取最优策略的情况下,平均每次B赢1/8元。

其实只要B采取了(3/8,5/8)这个方案,不论A再采用什么方案,都是不能改变局面的。如果全部出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元;如果全部出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当A也采用最佳策略时,至少可以保证自己输得最少。否则,A肯定就会被B采用的策略针对,从而赔掉更多。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈