本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
% u% l1 L/ ?5 M; M" d# z7 l Z5 I( ~5 N% b4 H7 x$ D* K' g
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 ?( n+ U9 q, [) I% w7 Q, v
以下三个定义:
; m1 ?* E; u) j8 u5 L 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
( J+ p& ]5 q, ?( i) |; Z' m6 y 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 Z3 B, h; P& `. S
所谓的双方优势策略则是指双方利益总和最大的策略。
0 J; @/ E- f5 \7 U[编辑本段]严格优势策略举例分析; f/ W1 D- \; w3 a" @
一、经典的囚徒困境 ! |: V! g+ b h/ V2 o
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & C2 J) D c' X+ Q9 D
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
7 i( l# V9 @3 l4 Y9 |2 w# ^( i0 x 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 Y$ N) r# `0 C
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 f, ~( R. G7 I/ Z7 X2 |) ~( C
若二人都互相检举(互相“背叛”),则二人同样判监2年。
# h; k# _: d, R R: r
+ z0 [ V* v3 t% V0 b! Y: l用表格概述如下:
4 P; L! W& m `& i9 W C1 q) j
+ O6 _( R( k! [% T& _4 `9 h3 Q 甲沉默(合作) 甲认罪(背叛)
( y* t ]$ o/ b! S4 b5 T乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
& _4 f9 [, |- `, M2 r1 P; G8 \3 T乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
* y: L9 q) o- o( A4 r% C
1 ^( x! }+ L) c+ @6 q" k+ V 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
N9 `5 Z2 W/ @ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
/ o2 J# {! ^' a$ q; R 若对方沉默、背叛会让我获释,所以会选择背叛。
4 s$ |7 A' p' ^) d+ o8 {7 y 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' a. u, m$ b" D7 s 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 r3 a0 H/ d1 @: P
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + b7 S! n j$ F* [6 L, I; e! P% ]
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. d5 `. v* R( L; k9 j$ _9 M# z[编辑本段]二、智猪博弈理论
) y* d4 c9 v+ i+ z 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 4 q4 s3 Y) g) b7 y$ z
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
# w- J8 v& x r& q+ g: Z* U 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # p) b: [5 |7 o) S7 {
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; m' k8 W+ i% x' Y# U
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 " W0 @2 U* _9 A8 s7 K6 j2 r
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ I7 C9 r: H8 Z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
3 C0 r! A, {! b9 y4 r3 r
8 r9 W) I. z+ P) O三、关于企业价格策略& M! ~. ^$ C7 \- ^# O% T/ v
* f: ~8 K; S/ s& m ! _4 @- }+ X' Q& z
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ~& v/ K7 n) @
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
4 |3 h8 _3 v6 o/ q: b( y 以下三个定义:
% t/ G9 y8 [) y- W7 E6 d6 s 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ! X- w+ w" }7 Z, q* X2 i* F8 h. s
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 A3 D6 l/ k7 w* A4 x 所谓的双方优势策略则是指双方利益总和最大的策略。 7 Q3 Z1 `) ^ J
[编辑本段]严格优势策略举例分析/ ~$ A( K/ J* |4 {' i
一、经典的囚徒困境
/ u! [) b$ Z P2 e 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
Z5 u1 m s! Q# ^/ @8 _) q0 M) K 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - l9 O+ m5 `' w6 V* V
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 / ?- n& b$ M; T7 ]0 W. O% A2 u8 m, q
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 0 o! l) ]. E& s& ]) I
若二人都互相检举(互相“背叛”),则二人同样判监2年。8 r' n$ L4 t1 G8 o E! [1 \+ g& g+ E
1 M& |% O- `. c用表格概述如下:
! Z: d0 h* ?0 i! N; k4 r# @
' W& O |& ` C3 n 甲沉默(合作) 甲认罪(背叛)
- n2 l) A8 J' D- g. F乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
1 j; y; o& l$ V6 m9 l9 c; [. M乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
3 ~* v9 v5 C8 N. u2 v* T3 Q& b
& D2 f5 A. F! u 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" d5 W2 Z s7 m4 ` 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 6 z& d! j+ a7 t6 Y( V
若对方沉默、背叛会让我获释,所以会选择背叛。 ( ?# }8 ]$ c7 C$ P; k: j
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) t1 [* _8 M9 ^- Z1 f
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' _# h5 H9 r; F6 x! O5 `3 V% O 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # Q' z5 ^: `/ d2 `9 m6 i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 L& t' h0 D+ ~[编辑本段]二、智猪博弈理论0 X- I5 _- i5 W
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 $ h* P3 | d G7 K! ]1 R
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ a+ R5 a, G' G4 w7 m 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 7 x2 H+ h4 G+ P( S( l8 }
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
) S7 V2 J3 i: L$ O6 p “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' z' _3 N9 l( U 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ X5 S2 o. e+ c& ?& O
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
; P* Q% N& K8 k' ] # H# t( w: H- w
三、关于企业价格策略3 t9 H8 A& D8 F) V
# I+ e+ E0 R% A/ d6 G* e7 l
0 D- ?9 s p& `, Y* x- ^! U 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , g* D, j2 T) @8 ^
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);8 f Q+ a/ p. W9 d/ O; k% v' a
以下三个定义:: f; O: J) Y- m( n/ L1 ~4 K; _
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
- m- n5 U; q) n* {% k i: H 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 t! E5 ~" i- q d% {7 u
所谓的双方优势策略则是指双方利益总和最大的策略。
- U% H3 v: Z4 d8 r[编辑本段]严格优势策略举例分析
- B2 n" G5 _! T' G+ J 一、经典的囚徒困境
+ M4 e. k, b6 @( I' ^ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 6 v8 T" Z9 e3 I2 ^) U
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 4 y* C( y" W! R3 a! b& \6 ^
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
: @0 e1 F- M4 L. ?5 t1 V' S' q" Z2 L3 O 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' ` b3 `# q. Z0 A9 @: u# O
若二人都互相检举(互相“背叛”),则二人同样判监2年。$ l% E( u' \- q, X! U) D
5 ?% j+ h! h9 ^' B
用表格概述如下:9 e0 O8 K$ i6 i. b
8 I1 n& f! l# _, q
甲沉默(合作) 甲认罪(背叛)
: `4 n- J7 R( D乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 2 {% V* Q5 A/ M6 ?) l* t7 Q
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 2 [) Q9 m2 J+ E$ X* e/ _. X
% q+ D! N3 e" U s0 \" l
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 - J2 V3 V0 e' d/ p
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* U8 r. [$ u# H( U7 X 若对方沉默、背叛会让我获释,所以会选择背叛。
! x# w. W$ C M* d! I 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, \2 e, b8 }( h8 Y 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 x. P% ~! k2 k' ~" o! t 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : C+ }& `* S4 t' W8 A
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
; r" Z+ V" P5 o[编辑本段]二、智猪博弈理论
2 Q& f# C9 P* I5 B 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% I/ H- a7 [8 |% |( y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 3 C7 W# E( S4 k
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
( M( L5 A% b9 ?4 D" D- a! r 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
$ y4 {5 _6 t6 A3 u: N “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! V) L5 y* P# r" C: @ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 4 K) R6 R0 h" x' D: y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
! x/ ]* R5 c/ w+ G3 m3 Y" f
# |( K# L7 k/ o" @三、关于企业价格策略
# b# L, i# L0 ]. H$ a5 @- F" `3 E C& @+ i% r2 e' `) V) ]$ M9 |
2 [* z0 @. Y: w- v# @0 I* ~ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 w9 G( E j5 T# D* M) ^9 Q. o& g 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
* G A3 [, w, e8 i$ f 以下三个定义:
: |6 } u$ \2 v! y 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
& G. r; s$ t4 L; `( j& C4 l! p 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 2 f! I5 ?0 H+ \2 ` i
所谓的双方优势策略则是指双方利益总和最大的策略。 % A! j! j7 t6 U5 R5 b5 d! F3 C
[编辑本段]严格优势策略举例分析' K: {/ e4 x, ]' l& G9 x$ `
一、经典的囚徒困境
6 e6 u4 }4 J G0 z7 _ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
1 f% Y. i, ^9 _6 F+ n 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
+ F. Q- A6 r3 |4 M' F, D4 p 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % n8 s. w. y0 {( A, F# z
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ i- |: x3 A7 x) f9 n" a
若二人都互相检举(互相“背叛”),则二人同样判监2年。
( K2 W2 G! ?- C) O$ ? & `, G; V1 J# G5 {% E: z
用表格概述如下:' d3 z7 h3 K# c) `; k+ s7 D
; ~4 d, p9 P5 [3 A 甲沉默(合作) 甲认罪(背叛)
/ M, M4 ]( d; l; \' k) j2 Q乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 4 b1 p% Q7 N1 d7 H$ g1 H' W7 X2 Y
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 $ U/ p) Z$ J1 }
9 y: a; }+ a/ |& ~+ ` }
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
# ?" L; c8 p1 n: w3 x 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 O. Z* c9 J2 k
若对方沉默、背叛会让我获释,所以会选择背叛。
" d! q9 V$ C8 a: V3 v5 c7 M# Q 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! Y2 W$ Y" \1 [$ p# X" u 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ( O$ A- W F8 t* J& U, X3 L
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) \- f' _, i6 P" k O4 I
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, c: v$ @2 ]( I3 r
[编辑本段]二、智猪博弈理论7 P& P0 |* Q0 y2 a4 e6 d8 _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % f n) i: a4 J4 d: j6 x( n* t
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * R' v4 d8 h& F2 W
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - K6 j* n/ q7 v) Q' ^
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 4 {+ |! u& ?' ~) s7 q8 v
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% J8 C5 T: b/ J" K0 Z 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 2 Q" c: d4 ^) t8 @. x
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。9 i" J2 P7 J5 @9 v. m5 `- f
/ @1 F7 ?( o9 ^2 E+ |
三、关于企业价格策略
. G" a, _2 F9 i5 ]8 {" \
% w7 t% |3 E; y0 B% g8 U" E
" P, i- j I: C 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 4 L$ e" f T7 ^
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |