--“囚徒困境”博弈的启示
榕城老应
6。后记和参考
这个题目写完,朋友问:“你说的有益进一步学习的材料在那里?别不是忽悠老实人吧?” 我说:“搜索呀!这里关键词都是正规术语,无论谷歌还是百度都认得呀!”
好吧,为让大家省点力气搜索,我将主要的参考资料介绍如下。
关于博弈的基本概念,囚徒困境问题,纳什均衡,重复博弈,触发策略,冷酷策略和无名氏定理(the Folk Theorem)在一般博弈论的大学和研究生的教科书都有介绍。下面的链接是 Shoham 根据Osborne 和 Rubinstein 给出无名氏定理的数学证明的框架,十分简明清晰,对了解无名氏定理很有帮助( http://www.cs.ubc.ca/~kevinlb/teaching/cs532a%20-%202003-4/folk.pdf )
进化稳定策略(Evolutionarily Stable Strategy),简称ESS,最好的参考书当然是John Maynard Smith 1982年那本书《Evolution and the Theory of Games》,有中译本,2008年的《演化与博弈论》。
Nowak,Sasaki,Taylor,Fudenberg等人 2004年《自然》论文 “Emergence of cooperation and evolutionary stability in finite populations" 见链接( http://www.fas.harvard.edu/~ped/people/faculty/publications_nowak/Nature04a.pdf )
Brembs 1996年 OIKOS Mini-Review论文的链接 ( http://expertvoices.nsdl.org/cornell-info204/files/2010/04/brembs-1996-prisoners-dilemma-solutions.pdf )
对“囚徒困境(Prisoner's Dilemma)和合作现象研究最多的是密知根大学的政治学教授Robert Axelrod。他早在1970年便设计了那个著名的电脑囚徒困境策略竞赛。1981年与生物学家W. D. Hamilton在《科学》期刊上发表了“The Evolution of Cooperation”论文。1984年Axelrod更是将几篇论文编辑成书,同样也以《The Evolution of Cooperation》之名发表。这部书成为一本经典,在二十多年来产生了重大影响,形成一个新的领域。中译本《合作的进化(修订版)》也在2007年出版。很可惜,我一直等到写完这个题目贴出后,才读到这本书,让我费了不少时间从不同地方挖掘到这些结果。对这个题目感兴趣想进一步学习的人,一定要看这本书。除了这里最后一节Nowak和Brembs的两篇论文结果外,这本书阐述了这里前面四节的非常相似的内容,而且附有两次电脑仿真实验数据结果。所不同的,他是政治学者,原创者,热情地用电脑仿真和博弈论来证明和鼓吹合作可以从霍布斯丛林中产生。我是普及者,在这里则始终用博弈的逻辑引导读者思考这个问题。
Robert Axelrod的第二本书,1997年的《The Complexity of Cooperation:Agent-Based Models of Competition and Collaboration》集合了他几篇的论文,作为上一本书的延续。在这里他继续发挥了所擅长的,用计算机模拟人群决策的研究。主要内容有:遗传算法演化新策略,在噪音环境下TFT策略的几个变种,社会规范的产生,阵营和标准的形成,霸权的兴衰和文化的传播。中译本在2008年出版,书名为《合作的复杂性——基于参与者竞争与合作的模型》。喜欢他计算机模拟人群决策研究方法的人,可从这书进一步了解他工作的成果。