关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
, b' c7 U; |2 C- b+ ?' k8 l8 X( A; `& }/ s
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ j/ h' Q7 d( T, a/ O4 V4 \$ P+ d
  以下三个定义:$ }9 D8 B+ E' N7 P
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% y3 J( x( N  t* [  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 Z2 w5 T- Q$ R$ T5 M3 l: f  所谓的双方优势策略则是指双方利益总和最大的策略。  
  m0 ?. K! W0 f) J8 |[编辑本段]严格优势策略举例分析
  ]9 I/ C/ |3 h  一、经典的囚徒困境
4 A/ n4 [0 O2 r3 _  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" s5 l! D, L1 p# |  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& G; [+ S4 k  P  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 B, b: R4 H  a
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * B- \$ i/ ]' D8 R6 H; F
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
  L9 ?- T* h& }4 F4 V$ [, B# T8 c  
  q( [9 t6 r7 K) ]- v用表格概述如下:
" a7 V. c5 j" U+ @# ~' d9 c- ?" m" L1 P
    甲沉默(合作)  甲认罪(背叛)  1 O0 T2 M2 ~+ Z
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
. b# V0 O1 O& j/ _5 U乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
, g1 L6 Z* ^0 Q8 k7 s2 ^, c. R" o, p- X" G! s6 a( i
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 s( }" [% D' k4 d3 q  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( r: Z$ ?4 }( r6 K3 {
  若对方沉默、背叛会让我获释,所以会选择背叛。 % i! w+ t3 H* N- J5 Y( _
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 y! m+ y! [: B& \- H  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' T7 D/ ]$ p+ \; H) R$ x- ~
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) M8 w  v! e5 D% D* @
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 W2 P4 O# @+ V; {( g[编辑本段]二、智猪博弈理论
7 n$ }8 \" L9 f( n# `' f9 t  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 u; }. |! \. J, V
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % P$ X5 ?/ T) ?* ?$ e
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 v! _, S/ v" Q2 c" }$ D2 h5 R  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% B2 C$ ?- E  o' D  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 @. P1 A/ S! T9 a) [9 _  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! l+ ~8 ^4 v! e! ^1 k0 n) g1 F% H( L  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 B' n# e: i2 |) ^  g8 x1 j  
* k1 w9 @) p$ c三、关于企业价格策略. Y" f/ T- u& l# b3 v
8 N! \  h0 ]- U
  
8 {. k! H; E& w( J& ?  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 t6 M) H& Q/ u  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, u* z+ {9 ?/ t4 z; `: T
  以下三个定义:. t  R1 s; T0 ]7 R- H$ U- |
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 d4 t( I0 ~$ s
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' Z" B+ x* M% n, A* n; M9 k  所谓的双方优势策略则是指双方利益总和最大的策略。  1 R$ S" l, X( l2 K# N% A+ {
[编辑本段]严格优势策略举例分析
! d+ o6 v& {! x- [) ]: ^: F  一、经典的囚徒困境 , _7 l+ l" ~2 o  }7 _
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ p6 o0 Z- _; m4 W4 y8 E; U  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 k  ^* I3 J# i7 G$ K* g
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
8 }1 I3 v' g$ H4 x& P! J  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, ^. J# s; L; d2 C1 T( R+ q  若二人都互相检举(互相“背叛”),则二人同样判监2年。/ P7 f- ^3 H) d0 L
  
2 n5 v7 l2 i7 r* m/ x用表格概述如下:
6 q+ @$ [2 U! ?- L) P' t# n, ?- z  F. A( L6 ^
    甲沉默(合作)  甲认罪(背叛)  ) N6 X! N+ q& i0 n
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
( a3 O0 R/ {8 {: ?+ h7 S( [乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  % ?; i6 `% j! y
. L4 k8 u# t/ y+ t" L$ L4 D4 |
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , n; o6 \* K$ j4 c6 ?
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ J5 R# d* j$ p- v8 I6 m% B  若对方沉默、背叛会让我获释,所以会选择背叛。 6 Z' D7 r. W. i; r* G+ z# ?9 N+ u% z/ f
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。   h" y0 ?$ Y" y' U% T% g2 m! {
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 i0 c/ L  I; n6 h8 x0 f5 h
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 o8 o) [: l4 S; J  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 w+ ^/ D' K, a1 L& M0 ?) B2 O! j
[编辑本段]二、智猪博弈理论
! P6 G" o; @8 T5 c  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 V* [# g! b) _* ]2 a0 |% d. o  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ G+ }- u" [/ L4 V) X7 F/ h  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! o. o7 \2 i0 Q0 j3 Y( f; s  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
  X9 A5 \- m+ m3 O( ~1 Y9 h+ Z  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 r" G; A% T2 J9 `
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  Y, f: V  B1 x. y3 P" l  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' I0 w  ]$ O- f" H8 f& L; P  " f3 f  q' a4 k) q& l
三、关于企业价格策略
. i; L9 v% k9 R: ~' v$ N' }; `, H4 _, ]4 F3 r
  
: f! w4 |: G/ v% C% a) J. ~; D  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?   |/ J5 t7 f  y; \- h. ]  w
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 [7 K4 R. Y1 x, y) h3 q  以下三个定义:4 a& F2 W  A7 o& t/ b6 s0 \
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. Q) @6 b: z5 B* O; U+ `/ F0 z  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 O/ [, r1 ]+ O' @2 |& f
  所谓的双方优势策略则是指双方利益总和最大的策略。  
, {  G( ~+ o# T* T* W[编辑本段]严格优势策略举例分析
3 k4 J6 A! i8 E$ y- o  一、经典的囚徒困境
8 U+ a( b5 v. u7 p6 F  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 W; n5 ]2 K0 W! Y$ t) G  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' h, q* k% x; X+ ]3 ~" U. t; J  q  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 {5 r+ b9 c- o" r
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 @1 y- `8 ?: @  若二人都互相检举(互相“背叛”),则二人同样判监2年。, _; o& j( n' H% e! `1 A
  
* i/ o# R3 ]: M用表格概述如下:0 }5 y3 ]& ~) n  T, o5 ~/ T
" K2 U; `; U( Q
    甲沉默(合作)  甲认罪(背叛)  8 @- J% j; T2 e! u
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  % A- y1 a# _- G5 v/ Y$ ^- q& f
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
; A, j3 }$ ^2 k& H8 e
) @  U: N8 B. _9 l2 H  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; v, }5 Z$ `5 r7 x8 f# H3 X
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + y" \# K5 x3 v# t  k4 W# X5 P
  若对方沉默、背叛会让我获释,所以会选择背叛。 6 |9 Z  \. o* [6 w1 J
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' Y6 l+ }6 G0 C- L+ q# O# P0 [  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * P4 J# a# y$ ?# j* s' X
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * p  f7 |" I* @9 k# _: p
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( N/ w& W0 K& ^/ W: H$ V' K5 i
[编辑本段]二、智猪博弈理论' _6 g: @' C- z: d! c  i1 u
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % {6 t. u3 s8 k. s6 y5 p) d
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & b! ?, u" p. U+ C9 N0 B: S
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! F0 a3 B+ g3 d7 O  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 W" P/ ~& ~3 Q! P5 F0 `3 h: B) c
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' K. L: ~% J# P# f
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) H8 h2 k7 C+ Y5 H7 \  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% I9 I6 {4 |6 ~9 T1 `( s
  7 I4 Q" ?0 ?1 R6 K% d# S0 V
三、关于企业价格策略( ]# e, e1 i1 g* W" f# Y1 n* [
! E5 r) ~9 A+ B' V  F3 l+ J* t
  
1 ~3 F* |) D6 F5 ?. K1 ?  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, E: e! S: M- }  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' Z- a( g7 F. v) f5 n* y2 H
  以下三个定义:
6 @7 p8 {2 w% v- D  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% b$ z, _9 _& N) i  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! ^; y7 v. D# d0 ]0 I+ R
  所谓的双方优势策略则是指双方利益总和最大的策略。  4 R2 ~' [; u+ v' I$ X$ g* j7 D
[编辑本段]严格优势策略举例分析4 x0 U. V, z! M. |. ^/ X
  一、经典的囚徒困境 : C4 o0 q9 }9 m$ D# @
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # z& B# n5 |+ u8 _* q3 ?0 A
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % m0 z; d2 M$ G; ~, y( \- K
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 {. [$ c9 P4 g9 r6 O& h  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 % Z# o6 c! p' r- ]+ ~& S* B
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
% K8 \. v5 D9 I0 {; x* ]4 q  # z% s( j5 j# x" o3 N$ ^
用表格概述如下:
$ @+ f& w$ Q6 }
, I- b$ F5 v8 I( G4 v    甲沉默(合作)  甲认罪(背叛)  ( k9 b, V* @- j# a8 b) Z2 f
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' Y% P0 g( X* t: w& M- A9 e' B2 D
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  . E3 L$ Q" n5 n2 `, A
# F9 t! j% t" J1 U
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' Z/ g/ r3 ^5 ?: l, y8 I+ Y3 @! @! e
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 U1 q( `& }+ \) \9 a$ P1 Z, J
  若对方沉默、背叛会让我获释,所以会选择背叛。
: T4 f5 f- z: r: W; b* D; d4 X  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ |& E! \  }" |6 K  t, f( z  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 l* r3 O1 j: S$ {0 I
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* K4 p0 L" c. J7 U% _% O+ x  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- |) q' c, k/ _1 d$ h[编辑本段]二、智猪博弈理论4 r& Y# U# U6 I% o/ u4 z, ~( y) \, L
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( g2 F) w  q  B9 S6 T, y' `) |
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ w0 q: \2 r' s; ?* e  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# k( k; A6 P9 O' a/ H7 _& D3 z& w/ ^  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 @5 \+ ?+ p6 v0 _2 W$ a8 v. A  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % @# W+ V7 v8 D! Y, ~% x$ D
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
  y0 S/ g' j/ _3 c" ~1 t* ^- m7 Z  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) J1 c( z: r* T' Y1 V$ U5 w
  
9 W& p) C( M; c. q; B三、关于企业价格策略
# z6 ^* \  A' I: C* v* g( `8 J
: q! B4 N) i) G; k9 ~3 u$ L. O  1 J& N+ k9 S1 d7 ~6 J( @- i% h9 C
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , o2 J( ?: c1 Z1 _9 m6 [9 {- r
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )