占优策略均衡

时间：2023-07-17 百科知识版权反馈

【摘要】：占优策略均衡_经济学原理修订版均衡一般指某种稳定的状态。可见，要解一个博弈问题，首先需确定博弈的策略均衡。占优均衡可以用一个经典的案例“囚徒困境”来进行说明。囚徒困境是一个双人博弈，它描述的是这样一种假设情况：两个人因涉嫌犯罪而被捕，但警察没有足够的证据指控他们确实犯了罪，除非他们两个人中至少有一个坦白交代。因此，无论对方是否坦白，他都会选择坦白。在囚徒博弈中，这一策略组合构成一个占优策略均衡。

均衡一般指某种稳定的状态。而博弈论中的均衡是策略均衡，它是指由各个局中人所使用的策略构成的策略组合处于一种稳定状态，在这一状态下，各个局中人都没有动机来改变自己所选择的策略。每一个局中人从中得到的支付是确定的，每个局中人的最优决策也是确定的。可见，要解一个博弈问题，首先需确定博弈的策略均衡。

占优策略是指无论其他参与者采取什么策略，某博弈者都有一个最佳策略。如果所有参与者选择的都是自己的占优策略，该博弈均衡又被称为占优策略均衡，即由博弈中的所有参与者的占优策略组合所构成的均衡就是占优策略均衡。占优均衡可以用一个经典的案例“囚徒困境”来进行说明。

囚徒困境是一个双人博弈，它描述的是这样一种假设情况：两个人因涉嫌犯罪而被捕，但警察没有足够的证据指控他们确实犯了罪，除非他们两个人中至少有一个坦白交代。他们被隔离审查并被告知：如果两人都不坦白，因证据不足，每人都将坐1个月的牢；如果两人都坦白，每人都将坐6个月的牢；如果只有一个人坦白，那么坦白者将立即释放，不坦白者将坐9个月的牢。图8－2列出了这个博弈的支付矩阵。这里我们用坐牢时间的长短表示局中人的支付。

pagenumber_ebook=112,pagenumber_book=102

图8－2　囚徒困境

在这个博弈中，对囚徒1来说，如果对方选择坦白，那么他也将坦白，两个人都坐6个月牢（因为如果他不坦白的话，等待他的将是9个月的刑期）；如果对方选择不坦白，他也会坦白，这样他会立即释放，而对方将坐9个月的牢。因此，无论对方是否坦白，他都会选择坦白。以囚徒2来说，情况也是一样。这里，“坦白”就是两个囚徒的占优策略。

在囚徒博弈中，（坦白，坦白）这一策略组合构成一个占优策略均衡。但是，这一均衡给双方带来的支付低于策略组合（不坦白，不坦白）带来的支付。这一结果被称为是囚徒困境。囚徒困境带给我们的启发是，个人的理性选择有时不一定是集体的理性选择。换言之，个人的理性有时将导致集体的无理性。现实生活中有很多囚徒困境的例子，如国家间军备竞赛、厂商间的价格战、公共物品的搭便车问题等。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈