老秘网_材夜思范文

标题: 人生有许多无耐 [打印本页]

作者: lzqggg    时间: 2015-12-31 11:31
标题: 人生有许多无耐
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 1 w% A% k; e3 f' u
6 X  p: V- Y* _; l$ B& t4 K$ S4 N
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
: p/ H3 t5 W0 [9 \; K! u  F  以下三个定义:
( ]0 K; b9 s' r9 E3 ~+ p5 K  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 9 b, j) T/ M) G3 B' _' q0 z
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; E: t) M( {4 S: o
  所谓的双方优势策略则是指双方利益总和最大的策略。  
$ V( p9 U3 F% X3 K( s[编辑本段]严格优势策略举例分析2 [" R% y8 p; p4 J+ l3 O  @7 C7 A* e0 b
  一、经典的囚徒困境
' J7 k% B1 b% u3 T7 Y  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! G" {0 P) F. I8 T& v* d  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 d9 j9 v9 u! X# O4 `
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 i& j* X5 q0 R+ x. ~
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 T( V+ L5 J8 _. v1 R$ G4 d5 D! l  若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 u' Q  E1 S4 y+ p+ O; ]  4 L. v: M1 V; ^0 Z& R+ F
用表格概述如下:* F$ b$ v; |  J9 ]3 w+ Q/ S! R, R# Z

8 D# g! Z: R, @" `' W4 v! }    甲沉默(合作)  甲认罪(背叛)    g8 U$ ?3 S9 C5 C1 h
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
9 X1 }& C: c6 k0 t# X1 S  F, v2 L7 `% I乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  ' c1 M! N8 [8 N# ~: H) L

- ?3 V3 e2 Z. R+ X1 F" g2 l  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 + O! Z/ E6 q% Z4 `2 ^
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 L% Y0 L) f4 Z- @' [
  若对方沉默、背叛会让我获释,所以会选择背叛。
$ B; k2 m6 D4 z. I  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
- ]! n0 p8 P- o6 }  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。   n6 `7 K. {1 l$ ^
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) J3 q. v% }5 @9 |% w- T, B: a2 ], W
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
  y7 S/ r2 h1 d6 B; g0 C[编辑本段]二、智猪博弈理论; X. M; y2 p- s
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 A" Z: d1 ~$ t1 s3 F- z( _6 F  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 B4 p+ A9 I6 j: c5 V# E4 j8 T7 g) U
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ' X$ [* k; r4 ]
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + Q* S8 A7 s, \' v' X
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
4 e( d+ f9 \, Y; w) w  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ h2 @2 v) f: b  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。0 A7 c* r- L. b9 h
  ) f! E# }9 r. U
三、关于企业价格策略$ q* i* M' i) k( Q9 {+ c+ d& ~
! n2 ?  i$ s* w1 p$ S
  
+ a  w+ v3 y5 V* n& y- s  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, m& z  \6 \9 d0 D( W. ]# F+ i  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 D$ x* ^/ v* _# E
  以下三个定义:
7 a: L& I/ J  p  n4 w  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
8 q. @8 y; x6 V- p- L" ~7 _  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 0 u, t  G+ {0 L* A$ Y7 \4 Z; @
  所谓的双方优势策略则是指双方利益总和最大的策略。  
" _( c( p5 w. i% O3 G) W* @# `[编辑本段]严格优势策略举例分析- r; Q' \8 x" O" {- R6 q1 O
  一、经典的囚徒困境 * _  T; A& y$ Y
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 a: E$ \4 D% t& X% l4 T! f  P
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 8 R6 x7 ]  p& J
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% P/ B3 y; O8 l1 _' h( c  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ X, l# x- k2 o0 I9 v
  若二人都互相检举(互相“背叛”),则二人同样判监2年。
' s! \8 p, r& j/ R0 E% t  
) y, ]& g' ?) m% m1 Y1 z" }用表格概述如下:) R. i' [+ H# K0 @  [

9 i+ S' L4 e% J/ {0 ?1 Q! U8 h" A    甲沉默(合作)  甲认罪(背叛)  
, Y' u- H% }6 M1 f乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
2 m: G/ N/ }5 y- W. m乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  . J! a0 n% ?1 {- m2 N. o

9 `# l$ f) P# n3 f, A4 j5 n8 S  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, z! C3 ~  D6 J$ S  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 7 M! O8 j. C3 r5 S8 l4 z. W  @4 b
  若对方沉默、背叛会让我获释,所以会选择背叛。
/ f# @* S: }& J0 s$ P1 w. ^  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 t; A! k) Y# U( I/ S
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 # r" n* b' e, x4 z! u( ^
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
7 W5 d" n& y8 ?, p; V3 s  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 H6 f7 |  G7 F/ a5 J1 }* m[编辑本段]二、智猪博弈理论( z# e1 b# k* X- m5 E" V; Q1 p
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : Y' a- f: u' B& |% ]
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( d3 d4 B$ U/ D, ^7 J) T& i
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 & h* S* J( E- |! v9 m
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& K: z  I) |* j7 J: o# L  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : l# V  e2 o$ S9 }1 E
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % g- o8 Y; d# s# K0 |1 p2 q
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。& j- j9 |8 D# u7 o; U% Q1 s
  
7 {8 Y2 z/ {5 ^5 k# m4 N5 M三、关于企业价格策略
- T; n* c* u% x) F2 _
2 E8 f% X2 E% V/ O- H! W1 `6 d  + ^9 o; G3 p4 ^0 q7 P! [1 ^
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 ]5 \6 N, Z8 r* m% N6 Q. E( }- s7 n
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' ]4 t; N! I1 w, ?  以下三个定义:
) W8 y+ v1 W1 |/ b! F4 Y  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ j7 G& q" k$ W( R3 I  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。   J0 [  N$ z% v) \
  所谓的双方优势策略则是指双方利益总和最大的策略。  
6 Y: l" M' ?* M  l[编辑本段]严格优势策略举例分析
- }, m( }5 D+ x. ]+ [9 L) `  一、经典的囚徒困境
/ t+ \+ a) u( X- |/ j$ [- t  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 I  P. }( D; ~( m  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 0 t* }4 ]+ ]) `7 @; }
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 C% }" S+ V  m' Y( d  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 5 o  A9 r# i0 D! G( D
  若二人都互相检举(互相“背叛”),则二人同样判监2年。& S( w0 n; x# ]  }" O
  
# z% u0 {6 t1 v5 X, j用表格概述如下:& I8 j# {: p3 J. s9 f

: R; i. [' ^2 G! v3 A6 H2 x* _    甲沉默(合作)  甲认罪(背叛)  
0 u' u0 I+ b  [乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
5 S. v1 y( ]  j( x5 v乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
1 n, E! h% ]: O! a, m2 V) s2 ^. n  N/ |
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
6 d) c  D/ q8 a# n  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 ~9 t9 a  s5 ?0 {$ [7 F  Y
  若对方沉默、背叛会让我获释,所以会选择背叛。
' E$ @' w! w2 ?1 U# ?( u  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
2 n* M! p! H# O1 m7 f* y  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! h! E  i! ]2 L
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % G9 m' G# ^% X  s) N
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 c- G* X0 M2 Z, f( N* Z
[编辑本段]二、智猪博弈理论* |. A4 ]9 y$ X! _+ {& y
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* r& z3 `1 `% p( [  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
  |8 |9 f7 x" M# F1 `' x/ w' S  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ( C6 `3 m1 b) ?# `
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 * S: N' G; T) H5 h1 o5 P. T
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * x& \5 R9 B5 ]+ S" i
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 & A$ |6 x' h' V' M; @
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 P! i8 W% m; g0 y! P  ) Z( N* k5 F( Z2 T
三、关于企业价格策略8 F2 u5 R3 d4 _. {% R% Z) i7 b

  ^! {+ D8 l  t4 L  
5 y* Q& ~" Z* q# g( x/ v  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ i" l. L3 y6 Q- g% ^  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 D( m. o3 I5 \6 t* g  以下三个定义:
6 G# Y4 |- i& T2 ~4 z  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- ^; G# f( R# `1 `8 I- h  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # ~7 P0 X) e- {" W: C# }4 n
  所谓的双方优势策略则是指双方利益总和最大的策略。  
# @& Y8 g' \* w/ u, @[编辑本段]严格优势策略举例分析
% ]# l$ E6 Z! @9 k. b' t4 i! a  一、经典的囚徒困境
1 S) U7 m( j7 h: F) s  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ _9 I9 G& N5 {& o7 ^  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. e) ]3 p/ U: {7 T& b( F" a5 N+ W5 m5 B  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * @5 `' B+ K1 A4 _3 H) b9 i
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, R7 r. A" {0 S6 J: ~+ ?  若二人都互相检举(互相“背叛”),则二人同样判监2年。+ |) ?2 s* F( `: F, u8 u. M
  " p! G. @' X4 o8 k: V
用表格概述如下:- Y1 z! B: t# J! d& E
2 e+ b) O* s3 K/ L  K
    甲沉默(合作)  甲认罪(背叛)  ' L# Q/ Z* ~, i3 |- |9 j
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
( s' }$ f7 M3 n$ M乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
0 d. m8 y* X% e9 m4 X  ^
  V4 S+ l5 m* d* Z/ j  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 ?9 F; Y3 k, |. A$ }' _( |/ K- n. l+ N  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
, e, I6 g. v6 V7 l! l' V) X; l  若对方沉默、背叛会让我获释,所以会选择背叛。 ( ^2 m, e. Q# d6 D$ ?" t
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 `7 u  Y& k: e  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! q! O9 P% j$ T* c2 o4 q0 s5 o" b- ~
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
( p. \& T1 p8 v9 _  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。+ _3 a- h1 D" I/ c+ f
[编辑本段]二、智猪博弈理论
9 \5 @0 E" _% P" j  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
" L  g0 ]! j4 p9 @4 {  H$ o  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
* m* a, B( ~' ~' g% K  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 : X; S0 t2 u' x% U6 D
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
$ V# M" o5 X$ X/ A) V4 o; f* i0 X  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
) I- U/ ^! m, {& Y1 J# J8 M  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 o- G% D- O( `  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- b5 u. M# {$ E" K7 m
  1 _$ |, z6 u1 G7 B; V- l
三、关于企业价格策略% A* ^+ m3 ?- j8 f4 P' O

1 i/ N9 w: O, J  $ `  W, d5 O# J7 a! p0 X
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? $ t6 V  P9 ?4 I- _) ?
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局




欢迎光临 老秘网_材夜思范文 (http://www.caiyes.cn/) Powered by Discuz! X3.4