关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
! H7 f: ^; w4 w1 W4 \1 I
% F( m% S3 K/ E0 J严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) f* ^* U# {1 R! c  以下三个定义:
  Y7 N. j0 a  g, K% l/ y  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% Q7 \3 r" @1 `( t4 S. A: B( m0 c  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 b- c5 }; b' H) t* q  ]  所谓的双方优势策略则是指双方利益总和最大的策略。  ' _9 ?: `  S# ?  ~: M
[编辑本段]严格优势策略举例分析: L8 V3 T6 N8 y  d& J3 B8 c
  一、经典的囚徒困境 ( U$ ~* D  f+ n
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : e8 A5 Y4 T% f/ I9 X. a: w
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
" |3 C, S1 G* ^  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . y, o& P4 \8 a7 c9 e
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ v' J+ B3 K8 K3 W  若二人都互相检举(互相“背叛”),则二人同样判监2年。  m  a, T8 Y/ N
  3 D5 D/ \! S( w0 l% C4 t* J5 V
用表格概述如下:+ N: _) J' y/ o

) j1 ]4 p+ M9 l. m" E1 p2 F/ u    甲沉默(合作)  甲认罪(背叛)  " ^4 D4 p: v, g# L
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
- G+ U. I) y8 \* ~乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ( a/ n; A2 y% p" B9 b8 i7 y! }

7 M- H4 k& O/ c4 O  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 E5 Y5 A) S. ?- }, H$ a
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
8 R" X8 @: U+ d3 [. z3 h  若对方沉默、背叛会让我获释,所以会选择背叛。
2 V5 ~! [6 J7 k) n) I; {  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 H9 Q- z# @  ?2 Y+ [  X( ]
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : {. X- m& H1 D2 _* R
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % R# d9 N2 X5 A' ?; R
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
8 q0 z4 O. P: g( X2 D( f/ ?[编辑本段]二、智猪博弈理论
5 Q9 D2 u" ?) a5 L# a) h  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
' w1 ~% ?9 Q8 \: g# n2 t& x  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 P5 \3 v! B* c/ t+ ?* U2 x$ L, q
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 d- T8 x+ F4 ^% |1 O3 Z. {  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : |  R( B0 M- Z0 ~- X3 y1 m! C
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! }) D3 i) \- {& |
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 + [" p9 @7 t5 B3 n+ O6 i
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 v# n% h; W- a+ S
  
9 C5 W" u4 O5 P- u" T8 }) U三、关于企业价格策略+ i% S& Y1 Q* a5 V3 Z' f
+ g$ q) S' Z* H3 i5 Q# v: D
  
; m$ v% T  B' \  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" T- w* Q: e3 m; H; f  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 Y2 n- g' L5 K$ N$ ?7 @7 Q
  以下三个定义:0 @0 S$ @* O! t  D' y% @* _8 v
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# F4 k" M( ^  }9 [# e, Z) Z, Q. R  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 X1 F5 q% w/ v# }7 C1 v5 `3 C( ~7 G  所谓的双方优势策略则是指双方利益总和最大的策略。  
4 U5 l+ w& c5 W4 r[编辑本段]严格优势策略举例分析; r+ |" B8 g% y# g
  一、经典的囚徒困境 / `( G, Y2 h" u0 p
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# o( V9 W) O- O$ h* }7 k$ |; m) ~6 X  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : S3 p4 r% J" h( h
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
1 n% {; X4 Q! F* F, B  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) S: l. i2 s# }$ E3 m6 M
  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ ]$ @$ _9 R' Z" O. B9 }
    t" w; I* m/ @. f8 w
用表格概述如下:$ x, v5 Z& @8 h2 K6 M2 D' g
3 E" b6 n8 k# ^& ]
    甲沉默(合作)  甲认罪(背叛)  
0 u. I! B) k  o' u! n! R乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
  [& `9 ^" I! {3 G( y乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
2 V$ G2 d; w) T
8 N  S5 C0 K4 E  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 9 w! I* F' \/ n$ D5 a# w
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ' K" J4 ~/ {& y1 f; J
  若对方沉默、背叛会让我获释,所以会选择背叛。
# ~# H' Z8 ^9 {$ l/ ~  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 % v( y8 [2 v9 N2 ]5 j; K
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
) s) q5 h! x% q1 ?1 @% _  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 , a; {, q- i2 c! k
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( S3 B* A6 ?! G0 v[编辑本段]二、智猪博弈理论( e6 Z1 [" w" d3 _
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
; C9 F# s5 ]- m0 d" M  R  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
& N1 Y% y: _0 A# I6 V  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" o% a# f! P7 v# Y1 I/ H  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 - E+ \& U  ^, B) ~- F7 b
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % p5 y7 ~4 ^* ^" D' D, R
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 . S2 q$ f* ]7 f' z1 g0 O
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。' f- C: n+ n: a! t+ J$ V8 x, i) f! g
  ( @2 C% g, J. {' v+ X7 m& p- ]
三、关于企业价格策略( p3 s) N0 c6 ^4 N6 Q' a8 P

1 C; _" K4 N" D0 e3 m" H7 |* }+ x5 U  
' N: m7 `; h8 j( l4 |7 }' b: ]/ ]  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 7 ]( Z; `4 i- B# }& J+ w
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. c3 y0 x9 h- Z
  以下三个定义:
, E% }& a  f# O  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
4 Z5 [8 F, |/ G! f& F  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; }: x8 e, ^, f
  所谓的双方优势策略则是指双方利益总和最大的策略。  
1 z# T* j! h/ h- g  G[编辑本段]严格优势策略举例分析9 [+ Q& I& D4 B3 V& ^0 D
  一、经典的囚徒困境
  d& k3 A2 y' M  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 F: w* l0 H+ g! ]/ o  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
! q, d% J9 V5 o0 d& E5 N  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
. l0 x. ~7 a3 b7 j) `3 y; W9 g$ U  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 / |5 n# \0 e5 n7 V4 V6 |
  若二人都互相检举(互相“背叛”),则二人同样判监2年。% @7 L/ g$ W9 S4 c# a% Q, L
  / M; a' A' Q$ Q1 P, s( F6 P
用表格概述如下:
1 i/ `' L* T* @8 m
: {/ A8 ]9 \$ ^# z! {& w    甲沉默(合作)  甲认罪(背叛)  
! @& E* B6 Q+ h- v乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  : d" w3 ~( W, [4 x  |4 B* D
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
/ a5 W' V# D; w  X4 i
" J0 f) ^  p8 W) w8 B8 I  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 3 c, Y9 ^8 ]6 c& @# U& y
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ i% p: L( ]( \$ |$ H+ n6 o  l4 Q  若对方沉默、背叛会让我获释,所以会选择背叛。
% v* t+ z( ^- F9 ^  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 0 V8 W8 j+ {0 A: w: b- s7 _
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# p, B9 W; ?5 t4 O( d) A  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 T3 ~8 n* p, l& x! _5 r/ j  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
( ~0 K9 \3 O) ~! S/ |[编辑本段]二、智猪博弈理论
- j' ~' t- z: ~( g: s  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 I5 M! p& p! @# a7 ]  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & @& r* L: S' p$ v, {; y
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 o4 R: z2 w+ S  ~
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 & P! L) `4 O, ]2 {9 y
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 & o+ V" o% \5 q! ^/ F
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # m$ O2 s6 M9 Y2 ^5 [. \
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。3 h! R: a* Z! \
  5 ^- N! X! c+ ?' L2 s/ O. ?
三、关于企业价格策略
  I; j3 c, z+ D: O$ w
' S/ Q5 e: _# D    X$ F1 N: V! s) u) F1 a' S8 ~
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " Q0 A, \- z- ?
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ A1 K& B3 ]+ p. j: ^
  以下三个定义:. ^$ s. `5 b4 r# T* S0 l$ z. S% B" _
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' _4 s$ K! e8 i7 B
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 4 J7 P6 |; w. W9 a# q
  所谓的双方优势策略则是指双方利益总和最大的策略。  
% r& p/ Z7 p* I  d[编辑本段]严格优势策略举例分析4 t2 C& E/ P5 \0 q: t) D
  一、经典的囚徒困境 . W9 E1 ]% r. u, B5 ]* A
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; [2 ^% l; G+ ^, z7 D0 Q; s  |* m  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 K& _5 v1 U0 Z) l/ ]5 f8 t5 H
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! V! o+ B+ J6 ]! b+ v/ s& l( z: k, O% f
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
) T' U# }  `) q% w- m  若二人都互相检举(互相“背叛”),则二人同样判监2年。( ~2 R: k  i# X5 g. \0 {# C
  . x  |: }- P) i
用表格概述如下:- W8 I  E6 b+ Z2 l3 b, h
2 W1 ^( M5 I' ]# E9 `
    甲沉默(合作)  甲认罪(背叛)  
- c; K5 i" W+ o5 w2 @7 V- p, D# |乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ; W+ K, q  i, h2 x7 [( B1 Y
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; \( k' U) a4 c; g, M' f- Z8 ~# w! @
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
; m5 l9 y7 @% y1 s/ O* W% U  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
. V# [1 n$ z# x- m, X$ u) V* o  若对方沉默、背叛会让我获释,所以会选择背叛。 % C. l1 z3 w) X, w: v5 D) _
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' v/ s$ H8 I. ^  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 , I% J7 u7 g3 v# c# P3 N
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 h9 C0 w$ }& F6 p/ G- C/ S0 z
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 r2 }) c( @1 L+ U* f[编辑本段]二、智猪博弈理论
4 ?+ O4 v: H5 n/ d$ I# `, W  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 Q5 u7 }+ Q. o0 N" S  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 O1 W4 u' a1 Y/ Q' I  P/ e  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。   Z$ p8 E9 c2 X- B
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : _: h! \1 f& n
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( b/ H, p& I# g" L" D  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
2 U+ k+ y& H/ o- b1 m8 {% ]/ V; Z0 M& ]+ A  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. O* D. v. T2 G2 D$ ~
  
) a) G7 ?# z2 |/ T+ f* u( P三、关于企业价格策略: E: v0 f) r% [) O6 f! d7 K

' f( ]0 _. ]# W* r( G  4 s+ a1 S) }# m  R8 Q$ q) D
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
  {0 q0 G3 H# @  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )