第一节 进化博弈论
在传统的非合作博弈论中,通常假设博弈中的局中人是完全理性的,他们不仅知道博弈过程的全部细节,而且还知道其他局中人的行为偏好特征。因此,实现纳什(Nash)均衡的过程也是通过局中人的一次性决策完成的。而进化博弈论则认为,博弈是由一个较大群体中的行为主体,在群体压力的支配下,通过不断选择和调整其行为与策略的多次过程而最终实现纳什均衡的,并非一次性完成的。进化博弈中的行为者通常是“有限理性的局中人”。
一般的博弈论分析的是某些较为固定的行为主体之间进行特定的博弈,而进化博弈论则假定一个博弈局为一个群体、一个社会,它包括许许多多的行为主体。这个群体中的行为主体数量可以是有限的,也可以是无限的。
进化博弈不同于一般博弈论中的重复博弈。重复博弈中的行为主体是固定的,且均为理性的行为主体,行为人对过去各自所采取的策略(或行动)是熟知的,也就是说,行为人要根据过去与对手的博弈经验而采取新的策略。而进化博弈论中行为人与“对手”的每一次博弈都是随机的,没有与特定“对手”博弈的专门记忆。各个行为人只知道整个群体中采取某种策略有多少,据此来决定自己在博弈中采取何种策略。
进化博弈论的核心概念就是所谓的“进化稳定策略”(ESS),其在进化博弈论中的地位与一般博弈理论的纳什均衡相似。这个概念源自于生物进化理论。其基本意思是:假设存在一个全部采用某一个特定策略的群体和一个采用不同策略的变异个体,如果这个变异个体能得到的“收益”比群体中的个体得到的要高,那么就称这个变异策略能侵入这个群体;反之,就称群体原来的策略是不可侵入的进化稳定策略。
其严格定义是:令s*为两人对称博弈G的一个策略。如果对任意的s≠s*和任意的ε(0<ε≤1),其支付函数均满足:
u[s*,(1-ε)s*+εs]>u[s,(1-ε)s*+εs]
式中:ε为博弈对手选择变异策略s的概率(或群体中选择变异策略s的个体的比
例);
u[s*,(1-ε)s*+εs]和u[s,(1-ε)s*+εs]分别表示当群体原来的策略为s*、又进入少量s策略时行为主体(即个体)选择策略s*和策略s的收益状态。
则称s*是一个“进化稳定策略”(ESS)。它表示的是群体抵抗变异策略入侵的一种稳定状态。
定义中的数学表达式表达的是采用原来的策略要优于变异的策略,这就意味着变异的策略最终会消失。
“进化稳定策略”(ESS)的一个等价定义为:若策略s*是一个ESS,当且仅当:
(1)s*构成一个Nash均衡,即对任意的s有:
u(s*,s*)≥u(s*,s)
(2)如果对于s≠s*存在u(s*,s*)=u(s*,s),则必有:
u(s*,s*)>u(s*,s)
条件(2)是指,如果上述纳什均衡策略s*是不严格的,那么虽然一个行为主体单独变异不会损害自己的利益,但当其他个体也变异时就会损害自己的利益,因此更可以保证策略的稳定性。从与纳什均衡关系的角度来看,条件(2)实际上也说明ESS是精练的纳什均衡。ESS的最重要特征,是它考虑到一个变异者遇到它的同类(即另一个变异者)的可能性。在一般博弈均衡中,却遇不到这样的情况,因为博弈结构不同。用这种方法可以剔除掉一些纳什均衡。很显然,ESS的定义要比纳什均衡的定义要严格一些。ESS必定为纳什均衡,而反之却不一定。
进化博弈论对于分析社会经济制度中存在的惯例、规则以及它们的演化是一种较为有效的工具。可以预见,尽管进化博弈论目前还只是博弈论和经济学中的一个崭新领域,但随着它的进一步完善与深化,它不仅将在经济学中而且将在整个社会科学中有着广阔的应用空间。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。