博弈生存：阐发博弈论思想的普及读本

摘要: 导言　　《博弈生存》再版前言　　人是行动的动物，因而是策略选择的动物。我们每天的所见所闻无时不体现出人行为的策略选择性。社会中的每个人都在努力用自己的理性选择策略来达到自己的生存目的。这也是研究多个 ...

　　我们往往用支付矩阵来表示参与者在各种策略组合下的支付，有时用函数来表示。囚徒困境的支付矩

阵为：
　　甲乙不招认招认不招认各判刑3个月乙：判刑10年，
　　甲：当场释放招认甲：判刑10年
　　乙：当场释放各判刑5年我们再来分析一交易过程的支付矩阵。在一卖主甲和一买主乙之间的“买—

卖”博弈中——这是一讨价还价过程，假定通过讨价还价后确定了一价格。在此价格下，卖者卖成后获得

的效用为6，卖不成的效用为0；买者买成的效用为4，买不成的效用为0。而如果他们之间的交易不成功，

无论是买主还是卖主都要等待和进行讨价还价，假定等待和讨价还价的成本均为1，则支付矩阵为：
　　乙甲买成买不成卖成(6，4)(5，0)卖不成(0，3)(0，0)
　　第四，对于博弈参与者来说，存在着一博弈结果。
　　所谓结果是参与者最终对策略的选择造成的确定性的支付。如在曹操败走华容道的博弈中，诸葛亮在

“埋伏大路”与“埋伏通往华容道的小路”之间进行选择，而曹操在“走大路”和“走通往华容道的小路

”之间进行选择。在这个博弈中，双方猜测对方的行为，看谁猜得准。博弈的最终结果是，诸葛亮派关羽

埋伏在通往华容道的小路，而曹操选择走小路，被诸葛亮抓住。这就是曹操与诸葛亮之间的博弈的结果。
　　第五，博弈涉及均衡。
　　均衡是经济学中的重要概念。那么什么是均衡，它的含义是什么？
　　均衡即是平衡的意思，在英文中是equilibrium。在经济学中，均衡意即相关量处于稳定值。在供求

关系中，如果在某一商品市场的某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能将商品

卖出去，此时我们就说，该商品的供求达到了均衡。此时的价格可称之为均衡价格，产量可称之为均衡产

量。均衡分析是经济学中的重要分析。
　　那么什么是博弈论的均衡呢？所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一种结果，但不

是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。
　　纳什均衡是一种最常见的均衡。它的含义是：在对方策略确定的情况下，每个参与者的策略是最好的

，此时没有人愿意先改变或主动改变自己的策略。
　　在上面的“买—卖”的博弈中，（卖出，买进）是一纳什均衡，这个博弈可以解释为什么在现实中讨

价还价后买卖能做成，因为这对双方来说都是最优选择。同时在“买—卖”博弈中，其均衡对双方来说是

全局最优的。
　　第六，重要的均衡——纳什均衡。
　　纳什均衡（Nash Equilibrium）是博弈分析中的重要概念。1950年身为研究生的纳什写了一篇论文—

—《n人博弈的均衡问题》，该文只有短短一页纸，可就是这短短一页纸成了博弈论的经典文献。在这篇

论文中，纳什给出了博弈均衡的定义，这样的均衡被人们称之为纳什均衡。
　　那么什么是纳什均衡呢？简单说就是，一策略组合中，所有的参与者面临这样的一种情况：当其他人

不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。在纳什均

衡点上，每一个理性的参与者都不会有单独改变策略的冲动。
　　在囚徒困境中存在惟一的纳什均衡点，即两个囚犯均选择“招认”，这是一稳定的结果。
　　有些博弈的纳什均衡点不止一个。如下述“夫妻博弈”（或称性别之战）中有两个纳什均衡点。丈夫

帕特和妻子克里斯商量晚上的活动。丈夫喜欢看拳击，而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜

晚，双方的支付矩阵如下：
　　丈夫妻子歌剧拳击歌剧(2，1)(0，0)拳击(0，0)(1，2)
　　在这个“夫妻博弈”中有两个纳什均衡点：（歌剧，歌剧），（拳击，拳击）。在有两个或两个以上

纳什均衡点的博弈中，其最后结果难以预测。在“夫妻博弈”中，我们无法知道，最后结果是一同欣赏歌

剧还是一起去看拳击。
　　是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点——所谓纯策略是指参与者在

他的策略空间中选取惟一确定的策略。但至少存在一个混合策略（mixed strategy）均衡点——所谓混合

策略是指参与者采取的不是惟一的策略，而是其策略空间上的一种概率分布。这就是纳什于1950年证明了

的纳什定理。我们下面将在“警察与小偷的故事”例子中给出混合策略的说明。
　　我国研究纳什均衡的专家谢识予博士在《纳什均衡论》中用通俗的话表达了纳什均衡含义：给定你的

策略，我的策略是最好的策略；给定我的策略，你的策略也是你最好的策略。这就是说，双方在对方的策

略下自己现有的策略是最好的策略。即：此时双方在对方给定的策略下不愿意调整自己的策略。这里的策

略包括混合策略。
　　纳什均衡是博弈论中的重要概念，同时也是经济学的重要概念。诺贝尔经济学奖获得者萨缪尔森有一

句幽默的话：你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词：供给与需求。博弈论

专家坎多瑞（Kandori）引申说：要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是“纳什

均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大，对其他社会科学

意义同样重大。我在书后的附录中用数学语言给出了纳什均衡及纳什均衡存在定理。

　　博弈的类型

　　根据参与者能否形成约束性的协议，以便集体行动，博弈可分为合作性博弈和非合作性博弈。纳什等

博弈论专家研究得更多的是非合作性博弈。
　　所谓合作性博弈是指参与者从自己的利益出发与其他参与者谈判达成协议或形成联盟，其结果对联盟

方均有利；而非合作性博弈是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活动

就是合作性的博弈，而囚徒困境以及在第八章讨论的公共资源悲
　　剧都是非合作性的博弈。
　　博弈又分静态博弈和动态博弈。静态博弈指参与者同时采取行动，或者尽管参与者行动的采取有先后

顺序，但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指参与者的行动有先后顺序，并

且后采取行动的人可以知道先采取行动的人所采取的行动。
　　从知识的拥有程度来看，博弈分为完全信息博弈和不完全信息博弈。信息是博弈论中重要的内容。完

全信息博弈指参与者对所有参与者的策略空间及策略组合下的支付有“完全的了解”，否则是不完全信息

博弈。严格地讲，完全信息博弈是指参与者的策略空间及策略组合下的支付，是博弈中所有参与者的“公

共知识”的博弈。对于不完全信息博弈，参与者所做的是努力使自己的期望支付或期望效用最大化。
　　这只是对博弈论的简单介绍。关于其中的详细内容，读者需参阅有关书籍。

　　博弈案例(1)

　　1囚徒博弈与我国应试教育的困境
　　囚徒困境可以用来说明许多现象。我国目前的应试教育就是一个囚徒困境。
　　囚徒博弈是完全信息下的静态博弈，两个小偷各种策略组合下的支付是他们之间的“公共知识”（我

们在下一章中将讨论什么是“公共知识”）。
　　我们上面已经分析了囚徒对局下各个策略下的结果或支付，以及它的均衡。它的均衡是双方均选择“

招认”的策略。

1 234 5 6 7 8 9 10 ... 26 / 26 页下一页

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (1 人)

老油子的哥

收藏分享邀请

说点什么...

已有0条评论

博弈生存：阐发博弈论思想的普及读本

刚表态过的朋友 (1 人)

说点什么...

最新评论...

撰写领导讲话稿要善于推陈出新

钓鱼

紧急召见

致女上司的公开道歉信

博弈生存：阐发博弈论思想的普及读本

刚表态过的朋友 (1 人)

说点什么...

最新评论...

撰写领导讲话稿要善于推陈出新

钓 鱼

紧急召见

致女上司的公开道歉信

钓鱼