The Daily Brief

Monday, December 05, 2005

 

纳什均衡


纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。

在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什均衡。

一个策略组合被称为纳什均衡,当每个博弈者的均衡策略都是为了达到自己期望收益的最大值,与此同时,其他所有博弈者也遵循这样的策略。


例子

一个著名的例子就是囚徒困境,囚徒困境是一个非零和博弈。 大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被判刑一年,而对方将被判刑十年;如果两人均招供,将均被判刑五年。 于是,两人同时陷入招供还是不招供的两难处境。其實如果两人均不招供,将最有利,只被判刑三个月。

囚犯甲的博弈矩阵

囚犯甲
招供不招供
囚犯乙招供判刑五年甲判刑十年;乙判刑一年
不招供甲判刑一年;乙判刑十年判刑三个月

基于经济学中Rational agent的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑三个月就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。



Comments: Post a Comment



<< Home

Archives

March 2004   December 2005   February 2006   March 2006   July 2006  

This page is powered by Blogger. Isn't yours?

My Photo
Name: