关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * X2 i9 f. o2 H
1 I" J: X& M  }: ?2 A! h
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, X: G( Z: c: p( O  以下三个定义:/ H+ a7 f* Y' @% j' q! D
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 s0 ]! k& j- s6 p- L
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( E* x% g0 v7 T; A6 c; ?, J
  所谓的双方优势策略则是指双方利益总和最大的策略。  
  G4 h& e1 \& F1 F& J* d: C& Q[编辑本段]严格优势策略举例分析
" _6 B3 }8 L8 w2 C3 a* `/ H  一、经典的囚徒困境
) y/ |2 V* r' v, s2 m  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ N+ N) D6 P6 z! g+ C  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : x* l) I/ d4 ~, T0 i9 c6 u
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 q2 w6 X& [" Z1 ]
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ i+ M9 N3 Z2 X2 {  若二人都互相检举(互相“背叛”),则二人同样判监2年。
% n$ a1 X4 D+ [) Z- z% v0 m  
) ]$ M% T5 {' G用表格概述如下:
  a9 `& O4 b5 H3 q& q. J
: x8 A! s. @7 l9 K2 l    甲沉默(合作)  甲认罪(背叛)  9 G% i( i& D& @
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  8 c9 N: X- e4 Q. {% \, `
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 ?! ]) z* P2 ^9 h
1 P# D/ c+ A6 B& t3 ?  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* t2 A1 c7 q' r; s' g  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * ~; k# Q4 o- M+ W$ z& m
  若对方沉默、背叛会让我获释,所以会选择背叛。 6 M4 U3 _; D: r8 }; f  A" ?) c' f
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 ]' `& `7 D% b& P: R
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 $ n3 h1 J& N* |6 v1 u  u
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; S% L6 ]; `( c$ `
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 `- a" G( a5 \% S( t0 [3 y) |/ `[编辑本段]二、智猪博弈理论0 C# D2 ^' r7 G- D
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 u/ f' ~/ G# ~8 N, ~( K9 t9 p; ~
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * ~' Z% K/ U$ p$ S: X# f  S
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ j9 {" j& _2 C- @1 ?/ a! X  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : x2 l( Y0 n5 p2 X9 @
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* L0 R( t( P2 S7 ?5 q2 g8 I  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( p3 [/ F/ ~! T( L9 m; B" Q  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。: q/ g, [: r2 e7 v6 l9 R6 I( s4 J5 y
  : }, n" d+ m# z
三、关于企业价格策略
$ `4 A4 S0 _+ @0 @1 @
- ^. Z8 u$ s# r/ P  W, X  . t" C3 ]* W7 c0 z: P
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 5 `9 f* P/ H, @, C$ }  P% m
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 r& Q  ^- ]. [0 Q) ^- a  以下三个定义:
0 g. o/ \9 F4 U7 A$ T  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # `8 |- ~: w, Z; j: t* [
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。   C/ x0 _4 V2 [$ x7 W
  所谓的双方优势策略则是指双方利益总和最大的策略。  + v% W8 e1 m4 Q
[编辑本段]严格优势策略举例分析# d# M4 j6 b  ]. {9 s
  一、经典的囚徒困境
  w/ [2 U$ h5 \+ T- _/ X  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 W: W! w; q, ]. N  ~  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 X1 `+ m9 t* Y" k: k  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; B0 S& Y2 b! i! Z# ^6 Q2 x  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 j4 D! P' L: j$ P" F
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 Y  i+ b& O% G2 H  ! |/ z- b6 @4 V' N; ^$ M+ K1 h; u
用表格概述如下:4 ?$ o1 t9 P6 |* N
/ t( H+ e% Z5 a! ?
    甲沉默(合作)  甲认罪(背叛)  / p, G$ H- T- V* m5 M% C; u
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
6 I/ ?4 d  ~7 w$ v( h" d乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
$ g( O0 `  d& t7 s8 t1 B  y4 n- Q4 w5 f: }7 O
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 m  W/ c+ \- V5 \
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % s5 j4 I) D1 r6 j+ |
  若对方沉默、背叛会让我获释,所以会选择背叛。 $ [4 N, w6 R. U" r7 w
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 i; i' f. U# b2 r  D- t  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# H  D1 b- k' N; R0 V! x  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 X: G6 o. [* \; `( L
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 j8 Z7 h! D/ N! }( [. A
[编辑本段]二、智猪博弈理论
! \& f$ L; J3 ]* i  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   @2 o2 I! Y; t5 H: E
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; _3 j4 P. Q+ {9 u  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
  Z) E- v. p8 B4 |/ B  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' x7 E. d2 ^8 ?" {3 m& `  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( E: C1 m- ~1 @1 o9 C$ @  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # n+ _9 O# z/ X
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" u# I3 T7 \5 v/ y7 C% p  c
  6 W8 u! R$ S. w% L6 a
三、关于企业价格策略
: u4 T% c% @5 W; }* N% o& ?- p
) F6 Q$ J4 z2 S2 ?4 L) w& E- c  
: H0 r" a  e1 S+ ~  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 l3 w% S) Q+ N; v! `
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' A9 h7 S# N% m+ Q  以下三个定义:* N7 @' s' a6 {4 E, j* }: w& p
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 \; `' f' g) D6 g) M! I8 h5 V. m
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. Y( z# j  a% @, {: R! j" T- z  所谓的双方优势策略则是指双方利益总和最大的策略。  9 v1 n+ y8 X$ n9 O  q/ e
[编辑本段]严格优势策略举例分析
' Q3 J( @7 f9 B. a+ n- R2 g- j  一、经典的囚徒困境
6 P- ^* }8 ?! V6 D% a4 r- x  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " Y4 t$ O# r9 X5 T2 s1 n2 Q# _' n; h
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ X: N" o& P; S# ~$ N; O  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 U0 _" w1 f( X: E
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; m0 F7 A/ y- i, f* h! l  若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 @+ r5 R: Y' x' Z* R% j* ^  Y  
3 ]4 F: a' P+ p5 p7 ~: U2 ]' [用表格概述如下:
9 [* `5 _; k2 y4 D& }8 E* b/ Y0 \( u( N: ~9 o
    甲沉默(合作)  甲认罪(背叛)  7 ^8 x$ A$ L' H- u- K" N) B
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
& g; _& O' i# P9 Q7 z4 o乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  9 Q/ R/ o7 g: c& Z) r

& B4 k: n8 _4 y  q0 V) R  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ t) W. C; b3 r- s0 w# u. c8 e  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
  g3 a9 a% W0 r; V, d  若对方沉默、背叛会让我获释,所以会选择背叛。
: U$ N) ?( ]4 w" p7 h  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + k! H$ t( @& ~6 o
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( i6 i1 d: i$ ?1 k1 p9 a  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 }; Y9 ], C$ I$ d  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ K  d% l1 O+ ~; H+ h" ?- q3 ^[编辑本段]二、智猪博弈理论
& @2 g5 {, i% W  o* y  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : F, \" r2 @* c0 _; g& @6 ]
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. h) E9 _4 L" T9 s& m  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 Z+ _6 M* g8 U5 m& @2 |
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 O: l! B* _8 [- e  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 B1 L* J+ w. n( c+ E! b: k  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; O, l, r- E+ |5 R  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: U. m3 K% n8 n$ _, l5 ?. k  2 x4 P# M) D  ^/ s' k
三、关于企业价格策略
0 b; Q" ]) W. [! E
# H8 a6 [3 c  \9 D0 u  
5 P- L" I2 x: }5 v1 w8 r) o  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 F1 ^! W7 c( ?; }: N$ z9 U4 L
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 G& q4 V+ ]2 i- F% b) ^  以下三个定义:
3 z+ `# ]. M8 e# W; ?. F5 {  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 I' T/ O7 s- n( H0 |/ Z; t
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* k4 t" p5 e/ R; [  所谓的双方优势策略则是指双方利益总和最大的策略。  & k0 o. `2 t1 |6 F. o4 V2 t; e+ M
[编辑本段]严格优势策略举例分析' I5 w1 S! A$ T) v* F5 F7 V( I8 t0 p
  一、经典的囚徒困境
' J" I: j" f4 [) \4 N8 B8 M2 I$ [: @  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 R# h! e, v6 A3 U* u2 c6 G  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
  K# H! m# E: T0 H6 K! p  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ T# n- t1 a+ Q6 s
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) R3 O, w. p4 q5 l( j0 @! R
  若二人都互相检举(互相“背叛”),则二人同样判监2年。$ ^- E7 k$ v5 o
  
; Z# t0 ^+ p5 A) M用表格概述如下:. @# \1 C0 ?  T1 Y' o9 l9 e

# v$ c, B( t. ~    甲沉默(合作)  甲认罪(背叛)  
) v7 j- R' ]% I( l乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
2 G+ P% z# D* Y4 L! L乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  1 G* b5 U2 A4 s3 k
- G5 K& Q- p+ r
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) E$ r( I. `+ h8 Y/ O) F  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 o# \9 G: [' V1 b7 G  若对方沉默、背叛会让我获释,所以会选择背叛。
# r/ a: ^6 B2 z$ x, _4 J; u! R. V  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 ^9 U$ H- @- @* u& j* n& j  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : w  `2 W8 C% p
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; J* U$ q) {. K+ O. J- q  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 X( j4 u7 \: n- s& Y3 q[编辑本段]二、智猪博弈理论+ r' A2 w/ r8 I% ~- E. {
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# }; M. h, o  B9 ^; ?; ?# D. l  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- Z$ j& K4 v. ]' I' W# M/ E  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # y2 Z, y* ~7 |
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( C- n5 O, w' M! I" c' _7 a
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) ?+ }! Q7 [2 f
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 e" d9 E9 b- [+ _+ B  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ U. F/ Q$ ?/ |9 M6 n
  
8 i7 Y  @: ]3 Z5 X/ h$ W三、关于企业价格策略. E, ^  L9 `" s

3 l, C$ i- R. S3 U  a$ ?7 V: B+ g  $ L3 e4 K5 q/ A5 ^  ]9 Z
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( F- @+ g5 h7 b: I  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )