关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 " d+ p2 x3 c1 _  h& _3 ]
% h- o7 c+ X) [* K) t% t
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 M- c2 D' s: x: v! }* z, |
  以下三个定义:
) ^+ b; J6 t6 Q( e) L1 @  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' ~0 r0 f7 j2 {) B) Q$ f  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 J7 @* s4 j0 \) Z
  所谓的双方优势策略则是指双方利益总和最大的策略。  
. }- x: @+ `. {7 ]  _[编辑本段]严格优势策略举例分析: t0 g( V; @0 k+ k
  一、经典的囚徒困境
2 n( E% S6 \8 ^: X  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( B$ P, U# T- [0 q( G7 I  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # u% O1 Y+ O3 F6 F, E1 m/ N# ~
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
  V2 x3 D( k; S  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
7 H+ X2 A& b4 @/ {9 F8 ^  若二人都互相检举(互相“背叛”),则二人同样判监2年。9 T0 {) a) N8 {. x$ u  D
  $ L/ O1 m% g$ c8 I8 {
用表格概述如下:
  K% U0 D: Q$ p% }- N
+ h* @6 v9 u+ y) e/ D" F: G/ L% r    甲沉默(合作)  甲认罪(背叛)  
8 z' U/ Z9 Q* G$ L5 @3 i" O- K乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ! N) V8 G9 _5 ?" s
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
6 e# ?2 [, h* F9 e8 Y/ M% ]+ G3 z& H) E7 M( ^& l. P
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 1 M6 l4 u/ G/ k/ x
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* Y4 \$ b' b) b. y# s. }& Q: F: B  若对方沉默、背叛会让我获释,所以会选择背叛。
8 Z7 M3 E! `' ?% r- g  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
# Q3 z) |) y, O' v- b  B" c) ^; Q. Y  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! w3 a0 c7 r5 |, [( A
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; z8 U/ W# |+ u0 R  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。" C+ }/ E7 ], D, N- H& n
[编辑本段]二、智猪博弈理论
& e/ v  o. ]  t: l1 M  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & m3 E7 R; P, ~3 O. a- r, ^7 C* P* S
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 / h" c! u& N# z: `
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# v# I$ F* C* g  H, Y7 `( L6 _. I  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; O0 ^8 }1 S2 I' f; a
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 1 P  X: l! y, A" ?8 P
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + l# o! S+ r9 c- N
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 G9 k* n3 P+ `+ C8 C  
1 C3 G; [# S" ]* X0 i5 v' {" x) l) _7 `三、关于企业价格策略
* n$ b( `: e  f/ P4 U2 j
1 K, ?% H6 |; a# I* k" L  c  
) e, \8 D! ?. ~# U2 g7 M  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' o5 r9 h) P+ `1 g1 T2 F1 q  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 a8 _  x+ I! p" q$ Y  以下三个定义:
+ v" D- @$ h/ F5 N2 N, ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。   l. ?' {! T% t2 H2 E& F' B
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 a! P5 O8 g# J) B  所谓的双方优势策略则是指双方利益总和最大的策略。  + z2 j9 E! L6 p0 e# H5 S
[编辑本段]严格优势策略举例分析  {8 Q. t1 Y1 O2 b2 O0 v
  一、经典的囚徒困境 ! V( R4 q: X5 y
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 _5 n1 H" ~5 O$ J# Q2 q+ F
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
* f) q8 }5 }- D) [  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
8 u5 ?8 N/ d6 ~4 s, }! z" M% I, q  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * S# B4 A' l5 \* I, M9 R0 [
  若二人都互相检举(互相“背叛”),则二人同样判监2年。9 U6 ?6 g& j, s+ z* F, S0 l
  
! \1 Q. l$ E1 N+ s5 k6 n" r# F用表格概述如下:
( g  ?. C9 F% K8 t- ?* m2 {! u6 U& t1 W9 R& `1 n7 E
    甲沉默(合作)  甲认罪(背叛)  1 v$ y# b% s/ W
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
1 f, c) z! e3 |1 H4 C" S; ~乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
) g$ j2 @* r: U- z
6 R2 y1 w: S' \0 J$ R, t  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 p1 H7 O6 N$ E0 o
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + W3 }0 M/ A$ G
  若对方沉默、背叛会让我获释,所以会选择背叛。
) ?! @3 k, O% J: a: a( Y  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- ?/ m5 O. n" F5 l  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' s9 k" _6 `6 ]* K  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
& E% R, g( e* g( y  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。% W7 \7 ^: ]8 ?2 O/ K
[编辑本段]二、智猪博弈理论
+ [" a  N" h: R6 v6 R) _. S  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 V7 y7 V9 _0 n
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . _; t0 U: g; t: k2 }/ Y
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# F( M* h* o' b, @. ]) ?( H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 # `+ a9 l1 v; l8 r( P
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
7 ?' G  }: I+ J5 Q  D  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ' E' [% S+ _3 g7 e0 m% j" u
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
1 u! _- k9 a- R  
( Y' ]' \8 V' C' Q9 |5 r三、关于企业价格策略( [" h/ U) X3 f& I; G7 Y
3 v) L; j! M# T& C  F( m" X
  6 j7 D- o7 z1 ?9 ?6 l/ \* ~
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? : v4 v5 X( T' ]8 _" ~$ O* s( t
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 p8 C* \9 T. H: f
  以下三个定义:5 ~* d8 b# F3 N7 B
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 + L* A* v* F; J" Y5 Z/ c8 l: s) f
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
2 ]/ P2 S! o: T  N  Q  所谓的双方优势策略则是指双方利益总和最大的策略。  
+ U, W, l  D: R8 _[编辑本段]严格优势策略举例分析
' |% b& r6 A0 u) _: g: k  一、经典的囚徒困境
0 C8 V( F: x* @  m' t' t+ j6 |  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' ~9 N. R6 r& j" J, l
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / P1 n0 b$ f. p% R; C" E  ?0 Z
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 b! Z# H- I6 G4 y* u  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 2 g& D5 H1 h' m9 J. n, t
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 S6 S5 ?6 i5 H* L' K# i) d    ~( K" M) Q9 Y: u8 o6 p( U
用表格概述如下:. l1 `0 m- V3 g2 [6 b
+ B6 g& o4 ?1 h' J! L5 s, H* S+ o
    甲沉默(合作)  甲认罪(背叛)  3 y; @' N1 h/ I5 \- ^
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  * v/ j3 G& P/ m' T$ A4 I  H3 ]6 ]
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  9 D: |; o! ]/ A# k, @
, T  m; t1 X1 J# n( Z2 q
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
: y( I7 V' h9 q  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & i! t" ^8 ]2 x# a/ @8 F
  若对方沉默、背叛会让我获释,所以会选择背叛。 5 U- l. S+ |7 x, L2 J6 z
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 p+ R7 [+ f6 Q6 \8 F0 K; j, J
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # Z' l7 @# I" _  r
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# Z2 w) P5 u$ u" K' x7 k  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
0 A% [. L/ }+ h( x$ y' H$ G: q[编辑本段]二、智猪博弈理论* S$ m% x& Q( W0 e) b
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 1 {0 L$ u$ _! C/ _+ |
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % t0 ?, x2 j) N- d* O9 p' R+ }
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # s; N- @# l: ?- m0 l* E
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % Q/ H& J& A5 v/ x6 w) \. t
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # t4 O4 d9 X& J6 w
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 5 j0 \2 W$ g0 B' h6 {+ X6 L' S
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 C$ \0 c8 @! `% H  
1 `* A3 S5 ^7 ^  T. y/ ~5 g+ o& t三、关于企业价格策略
6 Z; L! |/ Y: ?4 E! l' H1 [% |! x# v
  
5 x, J. {$ }6 t7 ]$ l  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
! j1 P" E# m/ D  e/ V  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
5 v' z+ ]+ ?0 H  以下三个定义:! q; g  K" M# w" _6 H
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
! S* J$ A% o- L  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" |( L% b0 g" P. G9 U* g  所谓的双方优势策略则是指双方利益总和最大的策略。  9 }3 X" v, @% P2 ^! ]+ a+ v0 e
[编辑本段]严格优势策略举例分析. w. p4 P, ]/ j0 E
  一、经典的囚徒困境 & P3 T3 f3 \. i' r6 h7 ~7 S
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ W, M( m: o( z; h; @6 a. ^9 @  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: , n0 }! {7 [6 c1 }. D! X, y. u
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( y& \9 ]; P; r' \4 w0 o9 d$ k. [
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * F* {6 p2 M, K% e
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
$ B/ G5 }" B5 a  & D3 k  c( D1 M( J; y  K0 ]' l
用表格概述如下:
" Y* q9 u# f+ N1 V
6 b: D1 f- u2 R4 P1 x    甲沉默(合作)  甲认罪(背叛)  8 y. _8 Z2 P* P
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
$ a# j" S+ A+ ~( l3 R乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ( S5 g6 _% L8 ?9 s, r* V7 V

+ [* i6 u+ I9 |/ {0 A2 s; q  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
( U: [3 ^( A5 Y+ m! e  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( G; u, h# o% h9 s
  若对方沉默、背叛会让我获释,所以会选择背叛。
2 C9 }# g- D: {& e' y0 e  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
* H4 n  l" N* L8 ^. e# R$ L  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( _1 c5 u! @2 f8 L2 ~" R: l
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
$ _' X  }5 |7 D5 @( R/ W2 S, T  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 Y4 d( Y4 z/ W. C7 V7 C
[编辑本段]二、智猪博弈理论
- ^  p# c' ^! @. \' c  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; g& I' y/ a  c$ D3 O& U5 s! F; U  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; n7 |* e$ S, y. k: R" p- `1 T5 F* w  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
3 N4 y- ?) V1 n5 G  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' h6 J" ^. Y3 Q& i( |& y6 q5 d7 j  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 \, J2 t* s7 H' p+ P
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / @0 \6 `, s; C! H! B0 Q9 b
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 ?& ?$ Y4 q8 F: |
  
; u$ a  Y" E& S/ w; X- q三、关于企业价格策略
$ e, H4 k5 A% O9 o" S
- ^9 v' W" x+ f" Y  1 a( T- d9 K/ Y4 x8 Z3 P
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ N. Z& a$ J- \& d% Z, u7 N2 V  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )