本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
) j9 i- L1 p' n; ^1 @
7 Y/ X3 C% f* F$ ]1 w% \严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
- V4 t5 o1 T& y) S5 x7 G 以下三个定义:2 o3 m. c; D2 u
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: Y$ \0 U! @- J H1 D0 i 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 : s! ?/ x2 Q1 u4 X
所谓的双方优势策略则是指双方利益总和最大的策略。
9 U( `, J, m, S* ?5 q[编辑本段]严格优势策略举例分析 p& |9 B- A7 T5 Q3 x0 |
一、经典的囚徒困境
9 q6 d5 w3 o9 v4 t ?3 D# f, L 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
+ u i( E* v: P# @" O, [) b4 H 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. S4 D) S- ~* f; d0 @: F5 n' T, h 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% E4 F6 y( Z; G8 L5 m0 G7 L% T 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
; j( `9 w: a/ f. x7 }6 _3 A 若二人都互相检举(互相“背叛”),则二人同样判监2年。
8 ?9 P4 I, o: j- B
' t7 k! s0 f Z: E Y( r; S" Y; c用表格概述如下:
. o( S' j' ^% ^9 y' E9 G3 D. G3 `$ M7 K% _, N G, P
甲沉默(合作) 甲认罪(背叛) 4 D( t9 |7 u/ E, }9 h
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
7 A0 D$ U5 L9 F乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 1 z" w$ b/ O1 S9 n8 C/ N6 T" O, S
) o( L6 w k# u' H- R5 F; b V
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , q' Q" a; D$ W
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
7 w- r1 {. ~: U 若对方沉默、背叛会让我获释,所以会选择背叛。
; k, L2 r u: [ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
! ~5 q* j; g) _; R1 n5 i 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
& c, s$ i {5 w 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + |$ B" a2 H0 f, X9 j! T5 D
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
2 [2 s$ s( O6 `5 \2 @" J5 _[编辑本段]二、智猪博弈理论4 k. Z& a6 m6 j
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ K9 a. d/ ?. Q I 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
' r- l6 y6 e4 D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 1 M: k- b! ]( o% P9 q$ q, ?0 s
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
+ q& H; Y) E+ H- [5 d “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 * b: h$ Y1 M- E6 d
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ ?- r4 J- t/ a) Z
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
7 i2 [ _# E, N& q6 ` # x4 Z3 A3 Y& d
三、关于企业价格策略( q' F3 h" b8 f' D
: \5 }1 H1 m7 p
* `% U: N9 x( N! G 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
; i2 ]4 p/ a8 p' [# F! { 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 p3 b( V" b9 } 以下三个定义:+ }1 f. `+ D* I) I+ Z7 a
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' u2 F, v* o9 D! Y) [0 g' u' c& @3 ?; s
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- D$ W. u# I0 n* ^% p 所谓的双方优势策略则是指双方利益总和最大的策略。
4 @. H$ |! I3 a- R+ G[编辑本段]严格优势策略举例分析
a; O) x1 }1 D- l 一、经典的囚徒困境 : W6 Z1 A% U3 Y$ s! F1 @+ R' _
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 9 S# ]5 C- p" N G% D- e. t
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
8 t" Y% d K5 o6 O+ j1 k 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 . s' W5 G; S( i0 k: q# m
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
. B% i6 S- A: E" Q3 } 若二人都互相检举(互相“背叛”),则二人同样判监2年。) D6 c+ X7 N5 W/ A" c# }
* q+ S4 V r; G2 X( l用表格概述如下:
P1 g% L0 j. `! W5 o/ P( g, _. V
; I x8 z) U; x 甲沉默(合作) 甲认罪(背叛)
+ |) h, X& l; [7 M1 \/ C \+ d乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 6 m5 A- G9 Q* A% P; Q% l
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; A/ Q% b2 a+ N5 F
0 J7 E. T# h1 H- v2 j; W( Z 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, ~4 h4 O. |3 v P1 {+ M 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
% K9 c- M' C; t( \/ B4 p" w$ O 若对方沉默、背叛会让我获释,所以会选择背叛。 ' k3 ^* @0 g5 q0 k) y
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 7 n' ~6 T* S* @6 C. Z3 H
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ! k# O7 g' R& A6 D! K, d+ H( o
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 x: F1 k% O. R1 |, w$ Z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。' Y5 |4 ~; a2 j: b7 ^
[编辑本段]二、智猪博弈理论+ _& U' [; N# J1 G! a3 j
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
, x# e) l0 I2 s9 [$ \ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ( g+ Q% o- H3 `" F
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 * ~2 y' W8 o; D8 J& S: h
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 V$ u" h$ u6 U8 s0 f% { Z “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 + o$ b; e- w0 c. A
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
; l* S9 O N8 C5 v5 }9 f 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
6 z: t' e3 m1 n
% h$ K' ^7 [3 {; u1 g- S) O/ G- ~: X% }三、关于企业价格策略
$ l2 V" S1 h8 z; l2 z. p* |7 P' u' V. n- c( y8 b
0 ^+ h0 T9 ~& Q 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' I! y# L7 Z, I3 z
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
N4 X1 ^/ t1 J7 ?, H 以下三个定义:* \; S/ s i/ N* U7 ?3 C
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 y, g! {) @/ `2 ~# U 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
- v7 N# F4 K5 \ 所谓的双方优势策略则是指双方利益总和最大的策略。
' m( r% }- C- {- ?[编辑本段]严格优势策略举例分析6 D2 L% P# l% f3 {7 {
一、经典的囚徒困境 * ^3 X( |9 }$ l) O# {! |) J
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ( F% A( h1 t$ T8 p7 n% R
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: - R7 P5 R6 ?8 e* A3 C1 q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 V$ B2 N+ S& ^+ ~- J
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ' c0 M8 b3 r: W- O; S
若二人都互相检举(互相“背叛”),则二人同样判监2年。+ E% d% {: `4 C- n X2 B. W
$ r9 f3 z! h* s' F" B2 C7 l
用表格概述如下:
& e* y0 h# G% c. U B- y
5 Z8 g. F$ Z: ^' O8 e6 M7 Z 甲沉默(合作) 甲认罪(背叛) $ r O: s: p* I! [% e
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ! J( d2 `, o- b7 |- ^' {/ B- L
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 . B' \4 Y: I7 C2 z, f
6 o2 S9 Q J- L" A+ l5 c
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ d6 H1 L; S" T( z9 `5 N: l 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
+ D) Y' x) R+ G 若对方沉默、背叛会让我获释,所以会选择背叛。 % V& Z o4 X: f' N3 q l
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ! j+ A2 |) X" |+ ]
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 v \8 S8 c" R b6 I7 C; l: p
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
% A' G; U, A# y: F 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
+ j0 @' x! i" o7 E0 ?4 w* B/ G0 M[编辑本段]二、智猪博弈理论
0 u1 F K' c1 u- t 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( [+ P* u- i3 R7 ] 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 4 s. ]- h2 c, I# E. L3 n. J
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
, a1 W9 ]& r3 L5 p 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ! @( L, I0 _5 b3 C
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
# Y9 P6 c# D, H; } 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 , [0 z- y$ N- s R% ?' q3 s
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。 L& ?; X" q* m3 W$ R' T
) S6 `' D) \. l1 Z# V1 _. c1 V三、关于企业价格策略6 a! R$ a& R2 h
$ f- }1 j: j* j& D3 `4 e; M; H
; r& U. G; K8 Q; \! W& c7 s 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? + T9 c& D9 P/ x: N' l7 L
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. d$ { n0 f, p; j0 B
以下三个定义:
. d u1 X/ [/ O& E1 T, ]+ A. \ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % T5 d% E0 ]! I/ q G2 Q: u/ a
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# J( q$ W( u1 A) }9 V( a+ H; V3 y 所谓的双方优势策略则是指双方利益总和最大的策略。
/ I* g0 I m; P9 f! E M6 a$ k) v[编辑本段]严格优势策略举例分析% l6 b" N" v$ ?. u+ C1 \
一、经典的囚徒困境
& }6 C5 S4 k. S2 B+ _6 I0 ?$ S 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
2 ^/ ]$ x2 k1 i 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; L! x' Q+ H/ v: q+ M5 P! z 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
u- u" y% t/ C9 Q4 H9 N$ G 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
0 r+ C& D, q0 L, a- F q4 j0 a 若二人都互相检举(互相“背叛”),则二人同样判监2年。
& E5 T# M8 R' e 8 p6 k$ u) ]# g) f* [) s$ Y
用表格概述如下:* L7 p5 a* O$ l% k6 |6 H6 D' |* s
; |# z" y8 w2 a( Y8 r* U B: T
甲沉默(合作) 甲认罪(背叛)
, K/ C# w5 c w9 y/ A9 Z乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% |8 {9 E7 F$ d, S) K乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
5 k1 @4 M) H5 A1 D, C i. ]9 |# E7 K7 _
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
, Q# a8 \ _3 o8 x& O2 H 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: & r; B9 S% ?& O" \- \' W
若对方沉默、背叛会让我获释,所以会选择背叛。
5 f/ q0 o' F. h, e/ \$ D 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 % o/ o1 l6 E9 F& }4 g1 b. A
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * o4 W8 `" t. l& v6 _4 o) z# L- h3 B
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 + I- i8 f" I' h+ f% d4 ^& y" ?5 }
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ {; S" c2 B4 s4 v) }
[编辑本段]二、智猪博弈理论
5 `* E( A" w+ y, [; [' @ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 g" b3 V6 ]/ m! c& _ 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 L! C3 a' o* O+ c
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 Z" @( c; A4 z( r7 `9 | 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
" ] R1 b6 ?: L) h; \ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 : C) y. q( z8 n- L; s; m
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 ^: k' F5 f$ H; t7 } W% b2 Y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。7 i% w0 O* K$ ^; p) `4 B
8 _; O/ V1 O( ^6 n5 O- m三、关于企业价格策略$ ]( O2 K/ F" y' ^
# q \) U0 b3 B- N0 `& r
; }! }2 ~3 ?0 d1 ?% [, [8 J 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
3 c* C1 U' a1 C# H 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |