本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 ) L' G* f1 S [ t2 _
0 K3 S% I- k7 z, O9 {8 ?3 {严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, S, n) @' a, q$ o0 \; B
以下三个定义:
% \# l' Q' l4 n 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; y# y: d( A! U# Z3 E- D
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
7 S9 _/ C& Y6 s# A s# j' ? 所谓的双方优势策略则是指双方利益总和最大的策略。 ! B( v8 c) k# ^, {, L, M |! a
[编辑本段]严格优势策略举例分析) J+ q6 f8 E& V/ e1 c% o( g) U
一、经典的囚徒困境
; j7 f, U8 m9 s/ _6 q 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # P* V7 q/ {3 B2 O
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 3 i, t. Z) V2 F+ o# [
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! d5 x% W. n; ^2 `+ v7 s
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , A1 _, v; o4 a) C
若二人都互相检举(互相“背叛”),则二人同样判监2年。$ Q6 b- c* u- ^
! r ]7 i a6 b' X: R! C用表格概述如下:0 s8 U* T$ d2 {5 l4 w
* S( o) O; C2 ?' d! k* m; e 甲沉默(合作) 甲认罪(背叛) , N% i- [! a: R* g% J: t- Y
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 5 T0 a6 ]6 y0 {( q
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ) p: C0 Z+ \: y: Q7 s6 h5 F( @
9 Q9 y9 ?% ~; T
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ N! j8 d8 g5 V$ `# V 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: - e2 |' C5 u; s. W5 Q: R" ]
若对方沉默、背叛会让我获释,所以会选择背叛。 4 |8 S% c* ]' Y2 G4 N
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 \, m$ F3 m2 M; V( `
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 2 Y1 h8 p. @: D$ A% P0 L% h
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 0 H) F, Y' I( `4 D) o& q" r1 v
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- y0 U" P) y: }* o( J( f9 b[编辑本段]二、智猪博弈理论$ `0 Y6 G( q& l2 g: ?9 y' e3 m
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 ]% Z7 s. v# O! J. w6 w8 B3 W 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 , O, U9 `0 i: K" w' _! t; h/ J6 D
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 + K3 ^' B; V; k+ O- D! h
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
1 v* a+ ?9 a# T$ i “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
' h, i- ~7 T: f. ^2 W; ~+ C' M" c 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" h v& e2 G) t! @7 ^ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。. [! m X. V3 H) e' c6 I
+ O+ B* D# B4 n Z" C, r* H' y! c
三、关于企业价格策略
+ v3 C w) p7 r, y* B5 k9 c: i/ F* n* d5 |1 c* Q& p5 l+ h
3 M" z, j8 z. m, l7 v2 D/ O& s
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 E+ Q F, h; E4 H/ s; o 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; T+ t- B: [) g/ @6 A! g! n# ~* @
以下三个定义:
( a7 Y( g: H) ~; e0 I( N 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 6 F8 B' h- B: X* X7 g
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 8 S& g1 x$ i6 P$ S1 G
所谓的双方优势策略则是指双方利益总和最大的策略。 + m, t- W5 E- M: U8 Z: d% T' j3 {1 d
[编辑本段]严格优势策略举例分析
: r3 s% Y# s+ t: f0 L& K4 l% ~ 一、经典的囚徒困境
% l+ Y1 N) U- b 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! ]* b8 t* v2 R& D9 i 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ P3 L: \; Q4 s* B* }/ @ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 1 y6 x4 Z/ q( l9 D& j
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 4 o; Z; {. |. x4 y
若二人都互相检举(互相“背叛”),则二人同样判监2年。% c8 E8 b9 C5 n4 k3 |7 r
$ m u' f {/ \5 y. O6 X9 X用表格概述如下:
/ V$ v6 B+ K3 n
# ]$ D! s8 j1 l7 ^ 甲沉默(合作) 甲认罪(背叛)
+ }) m- Y, g$ J8 z4 B$ p乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' e1 P# P. V( A; b2 \9 u4 |/ S
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, e1 ~! x4 Q3 w& G0 J5 \6 _2 O+ Z4 ]$ ?5 m. j. I- Y9 u
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 Q' T/ }0 H! q4 f( C, X
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: $ n3 g+ C, g- z
若对方沉默、背叛会让我获释,所以会选择背叛。
2 c( k! c! h) D3 z0 N, _7 j3 G1 [# r 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 V7 e/ M& t* _: Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
) Q' P0 Z" O" p* s 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
) `% y* U8 Q! }0 @# C- y$ f. f$ R 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- j. v' F2 B# t4 d
[编辑本段]二、智猪博弈理论5 M" e9 O+ }1 K" ~% P a4 g: F1 \
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( \( D$ e. G0 V5 A
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- }5 o5 g# y0 z) x: a; ?9 h 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 n$ @( G! g" Q3 K 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 0 @$ n% T, R Y2 p
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 ^5 z( {) {6 d8 d
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
1 s9 {7 w) U8 B) o3 p 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 e9 A1 s$ ~; C' M4 k7 z4 r$ f
) K% p( } f9 W! H8 B2 ?三、关于企业价格策略0 |2 M* I' n0 {: _2 b
: {: E* N; F' j& D5 q* z3 [% ~8 U' U
$ t+ O, _+ }' M7 }9 L5 L/ o
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 3 J. C! x# s& d$ F
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);! [3 a+ l3 v: h' H0 L
以下三个定义:
% }; ]; C Z. V9 T 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
; r- x0 `1 A" n' p9 j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- \- e/ }8 \, w& X% e; H% E 所谓的双方优势策略则是指双方利益总和最大的策略。 9 D9 Z- {2 U) V4 v/ u* S
[编辑本段]严格优势策略举例分析
: L X2 d( m" Y* T& v0 f/ r 一、经典的囚徒困境
8 x0 p. z* d; c2 E 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' _6 B. i9 l7 {8 L7 r 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
N' c( ]1 M& Q2 t, B' h) M 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
k0 _* E$ ?' d! w6 {5 h 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) ], Z8 M. a$ l% E6 _5 J, Y6 y
若二人都互相检举(互相“背叛”),则二人同样判监2年。
) Y( T8 r9 W" l2 w: y0 J% i) A) b& z 2 o6 R( F7 K) y, h: l0 {3 [
用表格概述如下:
- x* b) @* B0 C9 L# ^: \
+ Y& Y5 ~& V1 t7 i9 s 甲沉默(合作) 甲认罪(背叛)
% l0 k$ f9 x( _乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * y7 _4 M F Q, t
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 4 Q. f; o) }9 B3 @' d$ D) i9 P& E
. U' _# G7 m6 b 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
& ^" K" j6 ^0 C) h 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- _6 `, [4 j1 }: {# L& E 若对方沉默、背叛会让我获释,所以会选择背叛。 ! O7 u4 P3 w- A$ r/ I# a
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' W+ K# [* k7 ~/ g8 o8 Z 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' [: g# G% i" z% Q, T" t
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
$ l7 c. q3 x' h1 ]; N 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。# H2 e& O& q( d- L
[编辑本段]二、智猪博弈理论3 S+ R9 X# P3 |" `8 B1 L8 _
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
2 l7 k: u. ~( u2 K3 |" T7 `- X q 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 7 [# A) z4 Y. W* g3 [! `! I9 U5 L
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 H" W- \8 i- U' ^' `. @# R1 h7 ~
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 i" C! `1 m! t/ q9 T, w “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
5 _, F+ S! [5 I# _$ M 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 - K3 \4 ~7 v: s+ X& V9 l! y7 a
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( ~/ ^( M" j, I# n& A6 S s
( n% ]- Q3 p) d, w* l3 s+ ]1 B. W% R
三、关于企业价格策略+ n- P" M# y: w& J# k. m% ?: X5 L
% Z9 d! f/ `! `: \# A. E
$ v. ~4 v- h- L' j- b/ W# |
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
" U3 ]" V1 O! `# d+ i1 I" n 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, ] d2 O: _2 g$ i
以下三个定义:
# n G# l- [3 A$ r3 X 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 [2 P" D8 ?; Y. z8 y, V
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
; o+ e4 p3 n: {7 I 所谓的双方优势策略则是指双方利益总和最大的策略。 1 P: V" b. v0 U) [* c
[编辑本段]严格优势策略举例分析
, Q8 x: _" q" h% r5 N 一、经典的囚徒困境
% }" `) U8 L4 p3 L0 o2 M) a 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & `2 o. ]/ D% \
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. ~" d+ Q6 w, f0 V 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ k6 B# d5 Q* Y" J- C) \% q 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - G/ c' T V/ r- T8 N8 B$ q
若二人都互相检举(互相“背叛”),则二人同样判监2年。3 `. y& G: U$ J
( T: z e/ \( C, s, }
用表格概述如下:8 P# j# S/ ? G( H' `( W
+ \ n) O$ W0 F$ b9 |/ M' ? 甲沉默(合作) 甲认罪(背叛) " z' I3 z6 p+ G# B, C2 X
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 7 ^; Z; x' O! n* O( w3 d, q
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
0 H, Q b1 l" x/ r. c
5 m$ U: R1 P( U! o 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ x- V- g' u+ c% R. U 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: , C0 i* X% J4 ^; g
若对方沉默、背叛会让我获释,所以会选择背叛。
: }, q9 p: A! K+ t5 F 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ N& ]: t% ]. V- s/ n2 G 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
) Q5 x2 @: k: O 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 c( {6 N0 p/ T: d0 m8 }+ U 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
# n0 U, j. T3 N[编辑本段]二、智猪博弈理论
( b' w' C& @3 k7 U5 | 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
9 p5 g# L+ q W, N8 C; W* Z 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 * \1 R j: I" i7 i2 e0 }
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
6 [- |5 x D3 Q. Z 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 L, J W$ w% s6 ~( z" a3 X: {
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 , H; Q) o: F; u; L: D7 ~, y8 e& i7 @1 w
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; ~4 J! `* Z) E& Q% ^% U$ _- F. w' _ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
, j- [+ S% e; {
8 S5 L) g% T+ \% r: y三、关于企业价格策略
( p! X4 f2 [3 \+ w/ q
1 n& D6 \# y! W
$ m; f! ~9 K2 _. a6 K* [% R 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? " }' V2 t. \# d1 h3 H1 h) z* T) t4 s
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |