首页 理论教育 混合策略纳什均衡的求解

混合策略纳什均衡的求解

时间:2023-02-14 理论教育 版权反馈
【摘要】:混合策略和混合策略均衡的概念一方面可用在不存在纯策略纳什均衡的博弈问题中,这种问题各博弈方之间的利益总是有严格对立性。另一方面,在没有确定性结果的博弈,即存在多个纯策略纳什均衡的博弈,这种博弈中博弈方之间的利益有相当的一致性的情况中,也可以运用混合策略和混合策略纳什均衡求解。作为混合策略纳什均衡的例子,我们用经典例子——性别战博弈为例,这个例子表明一个博弈可以有多个纳什均衡。

观察图3-3表示的博弈。

应用划线法发现,这个博弈没有纯策略下的纳什均衡。应用概率分布的方法来寻找混合策略下的纳什均衡。

本博弈中,两博弈方决策的第一个原则是不能让对方知道或猜到自己的选择,因而必须在决策时采取随机性;第二个原则是他们选择每种策略的概率一定要恰好使对方无机

可乘。

图3-3 混合策略博弈

设博弈方1选A的概率为pA,选B的概率为pB,博弈方2选C的概率为pC,选D的概率为pD。根据上述第二个原则,博弈方1选A和B的概率,一定要使博弈方2选C的期望得益和选D的期望得益相等,即:

这是博弈方1的混合策略。

同理,求得博弈方2的混合策略为pC=0.8,pD=0.2。

博弈方1以(0.8,0.2)的概率随机选择A和B,博弈方2以(0.8,0.2)的概率随机选择C和D,由于这时谁都无法通过改变自己的混合策略(概率分布)而改善自己的得益(期望得益),因此这样的混合策略组合是稳定的,是一个混合策略纳什均衡。

用如下方法{(0.8,0.2),(0.8,0.2)},该混合策略纳什均衡的期望结果(即双方的期望得益)分别为:

虽然单独一次博弈的结果可能是四组得益中的任何一组,但是,多次独立重复博弈的平均结果却应该是双方各得2.6。

混合策略和混合策略均衡的概念一方面可用在不存在纯策略纳什均衡的博弈问题中,这种问题各博弈方之间的利益总是有严格对立性。另一方面,在没有确定性结果的博弈,即存在多个纯策略纳什均衡的博弈,这种博弈中博弈方之间的利益有相当的一致性的情况中,也可以运用混合策略和混合策略纳什均衡求解。

作为混合策略纳什均衡的例子,我们用经典例子——性别战博弈为例,这个例子表明一个博弈可以有多个纳什均衡。关于这一博弈的传统表述(该博弈从20世纪50年代就开始使用了),是夫妻二人试图决定安排一个晚上的娱乐内容。丈夫和妻子必须在去听歌剧和看拳击赛中选择其一,夫妻都希望二人能在一起度过一个夜晚,而不愿分开,但丈夫希望能一起看拳击比赛,妻子则希望能在一起欣赏歌剧,如图3-4的博弈矩阵所示:

图3-4 性别战博弈(甲)

令(q,1-q)为丈夫的一个混合策略,其中他选择歌剧的概率为q,且令(r,1-r)为妻子的一个混合策略,其中她选择歌剧的概率为r。如果丈夫的策略为(q,1-q),则妻子选择歌剧的期望收益为q·2+(1-q)·0=2q,选择拳击的期望收益为q·0+(1-q)·1=1-q。从而,在q>1/3时,妻子最优反应为歌剧(即r=1);q<1/3时,妻子的最优反应为拳击(即r=0);q=1/3时,任何可行的r都是最优反应。类似地,如果妻子的策略为(r,1-r),则丈夫选择歌剧的期望收益为r·1+(1-r)·0=r,选择拳击的期望收益为r·0+(1-r)·2=2(1-r)。从而,r>2/3时,丈夫的最优反应是歌剧(即q=1);r<2/3时,丈夫的最优反应是拳击(即q=0),r=2/3时,任何可行的q值都是最优反应。最优反应对应的交点之一,即妻子的混合策略(r,1-r)=(2/3,1/3),丈夫的混合策略(q,1-q)=(1/3,2/3)就是原博弈的一个纳什均衡{(2/3,1/3),(1/3,2/3)}。

这个混合策略的纳什均衡也可以由图3-5所示的方法求得。

图3-5 性别战博弈(乙)

这是混合策略的反应函数图,图中虚线为最优反应函数r*(q)和q*(r)有三个交点:(q=0,r=0)、(q=1,r=1)及(q=1/3,r=2/3)。另外两个交点分别代表两个纯策略纳什均衡{拳击、拳击}和{歌剧,歌剧}。尽管混合策略不像纯策略那样直观,但它确实是一些博弈中博弈方的合理行为方式。扑克比赛、垒球比赛、划拳,以及齐威王和田忌赛马的故事,就是这样的例子。在这类博弈中,博弈方总是随机行动以使自己的行为不被对手所预测。经济学上的监督博弈也是这样的例子。监督博弈是猜谜博弈的变型,它概括了诸如税收检查、质量检查、惩治犯罪、雇主监督雇员等这样一些情况。这类博弈的特点是不存在纯策略纳什均衡。在经济活动中,有许多与性别战博弈相似的博弈问题,制式问题是其中典型的例子。电器和电子设备往往有不同的原理或相关技术标准,称为不同的制式。如果生产相关电器或电子设备的厂商采用相同的制式,产品之间就能够相互匹配,零配件也可能相互通用。如果同一种产品有两种不同的制式,两个厂商之间就有一个选择制式的博弈问题。这类博弈的特点是存在多个纯策略纳什均衡。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈