我们往往用支付矩阵来表示参与者在各种策略组合下的支付,有时用函数来表示。囚徒困境的支付矩 阵为: 卖”博弈中——这是一讨价还价过程,假定通过讨价还价后确定了一价格。在此价格下,卖者卖成后获得 的效用为6,卖不成的效用为0;买者买成的效用为4,买不成的效用为0。而如果他们之间的交易不成功, 无论是买主还是卖主都要等待和进行讨价还价,假定等待和讨价还价的成本均为1,则支付矩阵为: “埋伏大路”与“埋伏通往华容道的小路”之间进行选择,而曹操在“走大路”和“走通往华容道的小路 ”之间进行选择。在这个博弈中,双方猜测对方的行为,看谁猜得准。博弈的最终结果是,诸葛亮派关羽 埋伏在通往华容道的小路,而曹操选择走小路,被诸葛亮抓住。这就是曹操与诸葛亮之间的博弈的结果。 关系中,如果在某一商品市场的某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能将商品 卖出去,此时我们就说,该商品的供求达到了均衡。此时的价格可称之为均衡价格,产量可称之为均衡产 量。均衡分析是经济学中的重要分析。 是说博弈的结果都能成为均衡。博弈的均衡是稳定的,因而是可以预测的。 ,此时没有人愿意先改变或主动改变自己的策略。 价还价后买卖能做成,因为这对双方来说都是最优选择。同时在“买—卖”博弈中,其均衡对双方来说是 全局最优的。 —《n人博弈的均衡问题》,该文只有短短一页纸,可就是这短短一页纸成了博弈论的经典文献。在这篇 论文中,纳什给出了博弈均衡的定义,这样的均衡被人们称之为纳什均衡。 不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略,他的支付将会降低。在纳什均 衡点上,每一个理性的参与者都不会有单独改变策略的冲动。 帕特和妻子克里斯商量晚上的活动。丈夫喜欢看拳击,而妻子喜欢欣赏歌剧。但两人都希望在一起度过夜 晚,双方的支付矩阵如下: 纳什均衡点的博弈中,其最后结果难以预测。在“夫妻博弈”中,我们无法知道,最后结果是一同欣赏歌 剧还是一起去看拳击。 他的策略空间中选取惟一确定的策略。但至少存在一个混合策略(mixed strategy)均衡点——所谓混合 策略是指参与者采取的不是惟一的策略,而是其策略空间上的一种概率分布。这就是纳什于1950年证明了 的纳什定理。我们下面将在“警察与小偷的故事”例子中给出混合策略的说明。 策略,我的策略是最好的策略;给定我的策略,你的策略也是你最好的策略。这就是说,双方在对方的策 略下自己现有的策略是最好的策略。即:此时双方在对方给定的策略下不愿意调整自己的策略。这里的策 略包括混合策略。 句幽默的话:你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。博弈论 专家坎多瑞(Kandori)引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什 均衡”。由此可见纳什均衡在现代经济学中的重要性。纳什均衡不仅对经济学意义重大,对其他社会科学 意义同样重大。我在书后的附录中用数学语言给出了纳什均衡及纳什均衡存在定理。 博弈的类型 根据参与者能否形成约束性的协议,以便集体行动,博弈可分为合作性博弈和非合作性博弈。纳什等 博弈论专家研究得更多的是非合作性博弈。 方均有利;而非合作性博弈是指参与者在行动选择时无法达成约束性的协议。人们分工与交换的经济活动 就是合作性的博弈,而囚徒困境以及在第八章讨论的公共资源悲 顺序,但后行动的人不知道先采取行动的人采取的是什么行动。动态博弈指参与者的行动有先后顺序,并 且后采取行动的人可以知道先采取行动的人所采取的行动。 全信息博弈指参与者对所有参与者的策略空间及策略组合下的支付有“完全的了解”,否则是不完全信息 博弈。严格地讲,完全信息博弈是指参与者的策略空间及策略组合下的支付,是博弈中所有参与者的“公 共知识”的博弈。对于不完全信息博弈,参与者所做的是努力使自己的期望支付或期望效用最大化。 博弈案例(1) 1囚徒博弈与我国应试教育的困境 们在下一章中将讨论什么是“公共知识”)。 招认”的策略。 |
说点什么...