关灯
0

博弈生存:阐发博弈论思想的普及读本

摘要: 导言   《博弈生存》再版前言   人是行动的动物,因而是策略选择的动物。我们每天的所见所闻无时不体现出人行为的策略选择性。 社会中的每个人都在努力用自己的理性选择策略来达到自己的生存目的。这也是研究多个 ...
文稿修改演播室


  1991年苏联的垮台在一定程度上是军备竞赛的结果。苏联将整个力量放在军备竞赛上,而民用建设无

法跟上,国力不济,最终退下阵来。里根的“星球大战”计划其目的就是要拖垮苏联。
  一旦进入骑虎难下的博弈,及早退出是明智之举,然而当局者往往做不到,这就是所谓当局者迷。这

种骑虎难下的博弈经常出现在国家之间,也出现在企业或组织之间,当然个人之间也经常碰到。20世纪60

年代,美国介入越南就是一个骑虎难下博弈。赌红了眼的赌徒输了钱还要继续赌下去以希望返本,也是骑

虎难下博弈,其实,赌徒进入赌场开始赌博时,他已经进入了骑虎难下的状态,因为,赌场从概率上讲是

肯定赢的。从理论上讲,赌徒与赌场之间的博弈如果是多次的,那么赌徒肯定输的,因为赌徒的“资源”

与赌场的“资源”相比实在太小了。如果你的资源与赌场的资源相比很大,那么赌场有可能输的;如果你

的资源无限大,只要赌徒有非0的赢的可能性,那么赌徒肯定会赢的。因此,像葡京这样的赌场要设定赌

博数额的限制。
  博弈论专家将这里的骑虎难下博弈称为协和谬误。20世纪60年代,英国和法国政府联合投资开发大型

超音速客机,即协和飞机。该种飞机机身大、设计豪华并且速度快。但是,英法政府发现:继续投资开发

这样的机型,花费会急剧增加,但是这样的设计定位能否适应市场还不知道;而停止研制将使以前的投资

付诸东流。随着研制工作的深入,他们更是无法作出停止研制工作的决定。协和飞机最终研制成功,但因

飞机的缺陷(如耗油大、噪音大、污染严重等等),它不适合市场,最终被市场淘汰,英法政府为此蒙受

很大的损失。在这个研制过程中,如果英法政府能及早放弃飞机的开发工作,会使损失减少,但他们没能

做到。
  4.警察与小偷的故事——混合策略问题
  纳什在《n人博弈的均衡点》这篇论文中,给出了均衡存在的简单证明,纳什说,在n个人的博弈中至

少存在着一个均衡,在这点上双方均不愿意先改变策略。这里的均衡点有可能是混合策略点。人们称它为

纳什定理。
  什么是混合策略?
  警察部门负责一城市中某一区的治安。警察要对该区的A、B两地进行巡逻。假定该区有一群小偷,要

实施偷盗。警察要防止小偷的偷盗,但因为设备有限,只有一部警车,因此,警察只能一次在一个地方巡

逻。而对于小偷而言,他们也只能去一个地方。假定A地需要保护的财产价值为2万元,B地的财产价值为1

万元。若警察在某地进行巡逻,而小偷也选择了去该地,因警察在场,小偷无法偷盗该地的财物;若警察

没有去某地巡逻而小偷选择了去该地,则小偷偷盗成功。警察怎么巡逻才能使效果最好?
  一个明显的做法是,警察对A地进行巡逻,小偷去B地,这样,警察可以保住2万元的财产不被偷窃,

小偷的收益为1万元。但是这种做法是警察的最好做法吗?有没有对这种策略改进的措施?
  我们可以将警察与小偷之间的这个支付写成如下的支付矩阵。警察巡逻某地,偷盗者在该地无法实施

偷盗,假定此时小偷的得益为0(没有收益),此时警察的得益为3(保住3万元)。
  这个博弈也是常和博弈,它没有纯策略纳什均衡点,而有混合策略均衡点。这个混合策略均衡点下的

策略选择是每个参与者的最优(混合)策略选择。
  由此可见:纯策略是参与者一次性选取的,并且坚持他选取的策略;而混合策略是参与者在各种备选

策略中采取随机选取的。在博弈中,参与者可以改变他的策略,而使得他的策略选取满足一定的概率。
  当博弈是零和博弈与常和博弈时,即一方所得是另外一方的所失时,此时只有混合策略均衡。对于任

何一方来说,此时不可能有纯策略的占优策略。
  5《三国演义》中的空城计与信息不对称的博弈
  如果我们用博弈论的眼光看《三国演义》,三国演义完全是一部记载着许多博弈案例的著作。当然,

罗贯中不可能用“博弈”一词。如果我们用一词来概括《三国演义》,这个词就是“计”。计,即计策或

策略也。用计,即用策略赢对方。用计算敌,不仅要自己选择恰当的计策,而且要算准对方用什么计策,

这不就是博弈?现在让我们看《三国演义》中著名的空城计博弈。
  诸葛亮误用马谡,致使街亭失守。司马懿引大军十五万蜂拥而来。当时孔明身边别无大将,只有一班

文官,五千军士,已分一半先运粮草去了,只剩二千五百军士在城中。众官听得这个消息,尽皆失色。孔

明登城望之,果然尘土冲天,魏兵分两路杀来。孔明传令众将旌旗尽皆藏匿,诸军各收城铺。打开城门,

每一门用二十军士,扮作百姓,洒扫街道。而孔明乃披鹤氅,戴纶巾,引二小童携琴一张,于城上敌楼前

凭栏而坐,焚香操琴。司马懿自飞马上远远望之,见诸葛亮焚香操琴,笑容可掬。司马懿顿然怀疑其中有

诈,立即叫后军作前军,前军作后军,急速退去。司马懿之子司马昭问:“莫非诸葛亮无军,故作此态,

父亲何故便退兵?”司马懿说:“亮平生谨慎,不曾弄险。今大开城门,必有埋伏。我兵若进,中其计也

。”孔明见魏军退去,抚掌而笑,众官无不骇然。诸葛亮说,司马懿“料吾生平谨慎,必不弄险;见如此

模样,疑有伏兵,所以退去。吾非行险,盖因不得已而用之”,我兵只有二千五百,若弃城而去,必为之

所擒。
  这就是为后人广为传颂的空城计。这是一个信息不对称的博弈。
  这里,司马懿不知道自己和对方在不同行动策略下的支付,而诸葛亮是知道的,他们对博弈结构的了

解是不对称的,诸葛亮拥有比司马懿更多的信息,当然有。这种信息的不对称完全是诸葛亮“制造出来的

”。因此这是一个信息不对称的博弈。
  在这里,孔明可以选择的策略是“弃城”或“守城”。无论是“弃”还是“守”,只要司马懿明确知

道他自己的支付,那么孔明均要被其所擒。孔明惟一的办法就是不让司马懿知道他自己的策略结果。他的

空城计是降低司马懿进攻的可能收益,使得司马懿认为,后退比进攻要好。
  司马懿孔明进攻后退守城(被擒,大胜)(逃脱,不胜不败)弃城(被擒,大胜)(逃脱,不胜不败)
  在信息不充分的情况下,博弈参与者不是使自己的支付或效用最大,而是使自己的“期望支付(或效

用)”最大。比如:如果让你在“有50%的可能获得100元”与“有10%的可能获得200元”两者之间进行选

择,你当然选前者,因为前者的“期望所得”为:50%×100=50元,而后者为:10%×200元=20元。理性的

人是选择前者的。
  在孔明—司马懿的博弈中,孔明了解双方的局势,制造空城假象的目的就是让司马懿感到进攻有较大

的失败的可能。如果我们用概率论的术语来说,诸葛亮的做法是加大司马懿对进攻失败的主观概率。此时

,在司马懿看来,进攻失败的可能性较大,而退兵的期望效用大于进攻的期望效用。即:司马懿认为进攻

的期望效用低于退兵的效用。诸葛亮惟有通过这个办法,才能让司马懿退兵。
  司马懿想,诸葛亮一生谨慎,不做险事,只有设定埋伏才可能如此镇定自若,焚香操琴。此时,司马

懿觉得“退”比“进攻”更合理,或者说期望效用更大。于是后军变前军,前军变后军,后退而去。结果

是诸葛亮得以逃脱。
  司马懿对局势的判断不是没有道理的,他对诸葛亮的判断是基于以前的认识,这就是“归纳法”,我

们会在第六章中讨论归纳法在博弈中的作用及其局限。
  空城计博弈是不完全信息博弈,我们说过《三国演义》是一本博弈实战教材,在该书中有完全信息博

弈实例吗?当然,曹操与诸葛亮的华容道博弈就是一个完全信息博弈。

1

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (1 人)

说点什么...

已有0条评论

最新评论...

本文作者
2013-7-13 09:02
  • 4
    粉丝
  • 4315
    阅读
  • 0
    回复
作者其他文章
资讯幻灯片
热门评论
热门专题
排行榜

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )