本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 * X2 i9 f. o2 H
1 I" J: X& M }: ?2 A! h
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
, X: G( Z: c: p( O 以下三个定义:/ H+ a7 f* Y' @% j' q! D
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 s0 ]! k& j- s6 p- L
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ( E* x% g0 v7 T; A6 c; ?, J
所谓的双方优势策略则是指双方利益总和最大的策略。
G4 h& e1 \& F1 F& J* d: C& Q[编辑本段]严格优势策略举例分析
" _6 B3 }8 L8 w2 C3 a* `/ H 一、经典的囚徒困境
) y/ |2 V* r' v, s2 m 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
$ N+ N) D6 P6 z! g+ C 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : x* l) I/ d4 ~, T0 i9 c6 u
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 q2 w6 X& [" Z1 ]
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ i+ M9 N3 Z2 X2 { 若二人都互相检举(互相“背叛”),则二人同样判监2年。
% n$ a1 X4 D+ [) Z- z% v0 m
) ]$ M% T5 {' G用表格概述如下:
a9 `& O4 b5 H3 q& q. J
: x8 A! s. @7 l9 K2 l 甲沉默(合作) 甲认罪(背叛) 9 G% i( i& D& @
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 8 c9 N: X- e4 Q. {% \, `
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 ?! ]) z* P2 ^9 h
1 P# D/ c+ A6 B& t3 ? 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
* t2 A1 c7 q' r; s' g 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: * ~; k# Q4 o- M+ W$ z& m
若对方沉默、背叛会让我获释,所以会选择背叛。 6 M4 U3 _; D: r8 }; f A" ?) c' f
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 ]' `& `7 D% b& P: R
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 $ n3 h1 J& N* |6 v1 u u
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ; S% L6 ]; `( c$ `
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 `- a" G( a5 \% S( t0 [3 y) |/ `[编辑本段]二、智猪博弈理论0 C# D2 ^' r7 G- D
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 u/ f' ~/ G# ~8 N, ~( K9 t9 p; ~
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * ~' Z% K/ U$ p$ S: X# f S
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
+ j9 {" j& _2 C- @1 ?/ a! X 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : x2 l( Y0 n5 p2 X9 @
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* L0 R( t( P2 S7 ?5 q2 g8 I 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( p3 [/ F/ ~! T( L9 m; B" Q 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。: q/ g, [: r2 e7 v6 l9 R6 I( s4 J5 y
: }, n" d+ m# z
三、关于企业价格策略
$ `4 A4 S0 _+ @0 @1 @
- ^. Z8 u$ s# r/ P W, X . t" C3 ]* W7 c0 z: P
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 5 `9 f* P/ H, @, C$ } P% m
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 r& Q ^- ]. [0 Q) ^- a 以下三个定义:
0 g. o/ \9 F4 U7 A$ T 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 # `8 |- ~: w, Z; j: t* [
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 C/ x0 _4 V2 [$ x7 W
所谓的双方优势策略则是指双方利益总和最大的策略。 + v% W8 e1 m4 Q
[编辑本段]严格优势策略举例分析# d# M4 j6 b ]. {9 s
一、经典的囚徒困境
w/ [2 U$ h5 \+ T- _/ X 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 W: W! w; q, ]. N ~ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 X1 `+ m9 t* Y" k: k 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
; B0 S& Y2 b! i! Z# ^6 Q2 x 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 8 j4 D! P' L: j$ P" F
若二人都互相检举(互相“背叛”),则二人同样判监2年。
6 Y i+ b& O% G2 H ! |/ z- b6 @4 V' N; ^$ M+ K1 h; u
用表格概述如下:4 ?$ o1 t9 P6 |* N
/ t( H+ e% Z5 a! ?
甲沉默(合作) 甲认罪(背叛) / p, G$ H- T- V* m5 M% C; u
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 I/ ?4 d ~7 w$ v( h" d乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ g( O0 ` d& t7 s8 t1 B y4 n- Q4 w5 f: }7 O
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 m W/ c+ \- V5 \
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: % s5 j4 I) D1 r6 j+ |
若对方沉默、背叛会让我获释,所以会选择背叛。 $ [4 N, w6 R. U" r7 w
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
3 i; i' f. U# b2 r D- t 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# H D1 b- k' N; R0 V! x 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 X: G6 o. [* \; `( L
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 j8 Z7 h! D/ N! }( [. A
[编辑本段]二、智猪博弈理论
! \& f$ L; J3 ]* i 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 @2 o2 I! Y; t5 H: E
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; _3 j4 P. Q+ {9 u 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
Z) E- v. p8 B4 |/ B 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' x7 E. d2 ^8 ?" {3 m& ` “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( E: C1 m- ~1 @1 o9 C$ @ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 # n+ _9 O# z/ X
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。" u# I3 T7 \5 v/ y7 C% p c
6 W8 u! R$ S. w% L6 a
三、关于企业价格策略
: u4 T% c% @5 W; }* N% o& ?- p
) F6 Q$ J4 z2 S2 ?4 L) w& E- c
: H0 r" a e1 S+ ~ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 2 l3 w% S) Q+ N; v! `
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' A9 h7 S# N% m+ Q 以下三个定义:* N7 @' s' a6 {4 E, j* }: w& p
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 \; `' f' g) D6 g) M! I8 h5 V. m
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
. Y( z# j a% @, {: R! j" T- z 所谓的双方优势策略则是指双方利益总和最大的策略。 9 v1 n+ y8 X$ n9 O q/ e
[编辑本段]严格优势策略举例分析
' Q3 J( @7 f9 B. a+ n- R2 g- j 一、经典的囚徒困境
6 P- ^* }8 ?! V6 D% a4 r- x 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " Y4 t$ O# r9 X5 T2 s1 n2 Q# _' n; h
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
/ X: N" o& P; S# ~$ N; O 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 U0 _" w1 f( X: E
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; m0 F7 A/ y- i, f* h! l 若二人都互相检举(互相“背叛”),则二人同样判监2年。
5 @+ r5 R: Y' x' Z* R% j* ^ Y
3 ]4 F: a' P+ p5 p7 ~: U2 ]' [用表格概述如下:
9 [* `5 _; k2 y4 D& }8 E* b/ Y0 \( u( N: ~9 o
甲沉默(合作) 甲认罪(背叛) 7 ^8 x$ A$ L' H- u- K" N) B
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
& g; _& O' i# P9 Q7 z4 o乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 9 Q/ R/ o7 g: c& Z) r
& B4 k: n8 _4 y q0 V) R 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ t) W. C; b3 r- s0 w# u. c8 e 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
g3 a9 a% W0 r; V, d 若对方沉默、背叛会让我获释,所以会选择背叛。
: U$ N) ?( ]4 w" p7 h 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + k! H$ t( @& ~6 o
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
( i6 i1 d: i$ ?1 k1 p9 a 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 }; Y9 ], C$ I$ d 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ K d% l1 O+ ~; H+ h" ?- q3 ^[编辑本段]二、智猪博弈理论
& @2 g5 {, i% W o* y 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : F, \" r2 @* c0 _; g& @6 ]
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. h) E9 _4 L" T9 s& m 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 8 Z+ _6 M* g8 U5 m& @2 |
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 O: l! B* _8 [- e “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
2 B1 L* J+ w. n( c+ E! b: k 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; O, l, r- E+ |5 R 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
: U. m3 K% n8 n$ _, l5 ?. k 2 x4 P# M) D ^/ s' k
三、关于企业价格策略
0 b; Q" ]) W. [! E
# H8 a6 [3 c \9 D0 u
5 P- L" I2 x: }5 v1 w8 r) o 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 F1 ^! W7 c( ?; }: N$ z9 U4 L
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
0 G& q4 V+ ]2 i- F% b) ^ 以下三个定义:
3 z+ `# ]. M8 e# W; ?. F5 { 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 I' T/ O7 s- n( H0 |/ Z; t
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
* k4 t" p5 e/ R; [ 所谓的双方优势策略则是指双方利益总和最大的策略。 & k0 o. `2 t1 |6 F. o4 V2 t; e+ M
[编辑本段]严格优势策略举例分析' I5 w1 S! A$ T) v* F5 F7 V( I8 t0 p
一、经典的囚徒困境
' J" I: j" f4 [) \4 N8 B8 M2 I$ [: @ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 R# h! e, v6 A3 U* u2 c6 G 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
K# H! m# E: T0 H6 K! p 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ T# n- t1 a+ Q6 s
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) R3 O, w. p4 q5 l( j0 @! R
若二人都互相检举(互相“背叛”),则二人同样判监2年。$ ^- E7 k$ v5 o
; Z# t0 ^+ p5 A) M用表格概述如下:. @# \1 C0 ? T1 Y' o9 l9 e
# v$ c, B( t. ~ 甲沉默(合作) 甲认罪(背叛)
) v7 j- R' ]% I( l乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 G+ P% z# D* Y4 L! L乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 G* b5 U2 A4 s3 k
- G5 K& Q- p+ r
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
) E$ r( I. `+ h8 Y/ O) F 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 o# \9 G: [' V1 b7 G 若对方沉默、背叛会让我获释,所以会选择背叛。
# r/ a: ^6 B2 z$ x, _4 J; u! R. V 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 ^9 U$ H- @- @* u& j* n& j 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 : w `2 W8 C% p
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; J* U$ q) {. K+ O. J- q 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 X( j4 u7 \: n- s& Y3 q[编辑本段]二、智猪博弈理论+ r' A2 w/ r8 I% ~- E. {
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
# }; M. h, o B9 ^; ?; ?# D. l 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- Z$ j& K4 v. ]' I' W# M/ E 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # y2 Z, y* ~7 |
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( C- n5 O, w' M! I" c' _7 a
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) ?+ }! Q7 [2 f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 e" d9 E9 b- [+ _+ B 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。/ U. F/ Q$ ?/ |9 M6 n
8 i7 Y @: ]3 Z5 X/ h$ W三、关于企业价格策略. E, ^ L9 `" s
3 l, C$ i- R. S3 U a$ ?7 V: B+ g $ L3 e4 K5 q/ A5 ^ ]9 Z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( F- @+ g5 h7 b: I 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |