本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 5 z F7 O0 b4 c" @3 A, K# k
, c9 ^& A# R/ G1 f: ]" z; x% }$ i严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);- f- I6 D* [+ Y9 d- d' }7 a6 p+ J2 {
以下三个定义:; p7 O, |3 G( l; U
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 0 K" @1 m/ p1 t
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
1 U$ l/ }& Z$ U6 G; F3 S2 t0 Q 所谓的双方优势策略则是指双方利益总和最大的策略。
* [) E3 r; o/ w) F% t5 Y% ?5 P- F3 y# p[编辑本段]严格优势策略举例分析5 m& Q; U( O. U8 B2 G% j6 L
一、经典的囚徒困境
- p$ H1 X) F a. H' E% I 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; u; v6 p- M- a! G 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ I+ C, ]& k: |( L 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 ]- y2 K; X$ r) @/ H 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 X* I2 u# A: @( {! `$ V 若二人都互相检举(互相“背叛”),则二人同样判监2年。$ Q) h) L/ D4 o- c/ M+ z# E0 F
" Z. N7 R# T/ _3 ], H用表格概述如下:
5 Y# J3 ?2 q$ V7 L+ S# A% e+ i8 M# O% D
甲沉默(合作) 甲认罪(背叛)
) v( j/ O" G! J& ?- q/ x乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 6 B+ k- a) p Z6 T# N& E4 |
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 % x$ J; C7 a% H: g% ?4 a1 z
& u/ d) }+ O4 n& q+ @8 q
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) a) u2 ?# u2 ^4 O- R' s
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
! A7 R8 l" n/ u5 w" d u9 ]1 Q 若对方沉默、背叛会让我获释,所以会选择背叛。
# g5 S# ~: u6 E9 c, J5 l) V 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 h/ X5 M! B G, n! b; y1 g 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
' ^9 r7 x7 G, @; C; N0 ^4 D, g 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 V7 J$ f) t, M
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。0 _+ R/ S% U5 L+ g* P" Q5 u" W7 ^
[编辑本段]二、智猪博弈理论& z4 Y( O$ B- k# ]+ S0 H7 I' V7 [
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( r; w; `; w$ e; D 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
7 q9 z9 g& m- h' ]7 `# k. D: s: O 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 3 Q( m1 K1 y& z; f) e. R- u% y
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
k |; b% `6 F3 i2 v7 _) J. L0 M. P* _ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
J$ Z' ~+ ^8 m( I& B2 f! [ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
( L3 q$ R$ M/ g, B 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- l' _1 F Q) }& t1 p: a
; [& l* K& C7 Q) g( M! R
三、关于企业价格策略
H3 E( J! ?9 i. {& z6 ` y- R }* E2 @+ b. { Q& f
* Q) y6 _- o8 a
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 5 d6 d( }8 S! B4 V8 M) l/ h
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 u2 d5 C" t3 @* y3 S
以下三个定义:) C x9 T' a6 R5 _3 g9 K
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
5 Z/ Q! s* S' z: ?5 {6 i) a+ _8 E2 Y2 i8 K 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 q/ F, @/ b) w& A; S 所谓的双方优势策略则是指双方利益总和最大的策略。
$ _! F8 O/ ]+ |: S( @[编辑本段]严格优势策略举例分析4 b) q0 }: l. U3 v
一、经典的囚徒困境 # \6 m4 R1 t6 v$ n- x) ?
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 X/ y) a! a1 J+ [9 ~0 O
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
9 h' b5 E0 ?3 O! m: r# H0 X5 D 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
% l# R' V8 k2 g8 F 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
- Z6 I( b0 @1 H1 v' x! d 若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 J, U$ a- O I$ ?! Q: a 8 ~3 i& u# B6 x/ c+ u
用表格概述如下:
& Q# p# m1 x a2 o: V- J. S
7 @( [- D e9 _ 甲沉默(合作) 甲认罪(背叛) 6 i. Z: `$ s1 r9 d8 G
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
% g! @, L7 W: m. t, ]: q乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
# I- _8 d: q/ e. c9 D1 H
1 _' q7 b, y+ h8 R5 \0 x 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
' A {( S; E6 w- A# m& k' e* j 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* A6 }9 i9 k# ~2 a# S 若对方沉默、背叛会让我获释,所以会选择背叛。 * V& ?0 F" D' G
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 5 V6 g" \& L5 d: b1 @, ]+ {
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 5 I# l5 |% u. c7 I4 _% x
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# q7 p1 H( o- X5 w S 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
$ k$ W( T$ D; v2 ?[编辑本段]二、智猪博弈理论; G! @) } r' i
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : z* S+ _, k& w# ^0 v6 T3 P. h. z! M! z
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 p8 q: y) H d" s2 `1 a6 I M% n
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
4 [7 r& G& r9 X/ m7 { 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
# X: Y( f$ h: s7 R% a1 E “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' L, X# m+ ~# ^0 r) I4 b* N' [4 x
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
5 U# m7 @) C8 m, _" X+ F3 h 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。: c; T1 n' P% G
l# @# \9 ]: `8 ?: u/ l
三、关于企业价格策略1 ^( E) t- r3 c) D, q, P3 o
/ {: A2 @0 h0 N8 Q7 X* O
! ?+ o" c* C' K1 t1 n" j7 h4 ~; _ 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 k0 |3 p! H2 Z
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& H N& ?: w, R5 g! u" O1 S$ h 以下三个定义:' ?4 M# N: q! u1 I1 t* M B3 U7 M* J" l
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' g# [3 N" Y8 m: a" f; h 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ a* C% u$ ` t. B0 ^# Z
所谓的双方优势策略则是指双方利益总和最大的策略。
: i" m/ F4 ]1 B[编辑本段]严格优势策略举例分析* W# q3 L# H% F e( A, h' _- W" m
一、经典的囚徒困境
& a4 Y. H9 `' ~! k8 a 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
) v/ |( q5 Q& m5 s 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
$ f% C6 I9 W! s4 h* R- F 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ( l+ N" x# ~; x
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ T H4 S8 U. V, L7 D! E 若二人都互相检举(互相“背叛”),则二人同样判监2年。 [. J4 V1 J, r4 X2 d
1 z8 F3 }: |; H+ i2 S7 P用表格概述如下:
D4 g: q2 f7 ~% j: R* e1 L; G+ {' o3 {6 [: f3 n1 L# a6 ^# r4 A
甲沉默(合作) 甲认罪(背叛) 9 I4 P' g$ `- O% i
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 4 r7 d% B, G: l5 {+ ?
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" G& D4 s3 J2 O" n
( Z5 K; @! }! O9 c& k 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 \* C' _# [+ N3 M1 K8 Z
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
0 @/ z# Q9 {5 K* o8 K' [% \) k 若对方沉默、背叛会让我获释,所以会选择背叛。 % T% B- d3 f8 K+ B! I" F; ^3 p
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 a* U2 `+ K) l7 w
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
" X# M1 {# S, b# ]5 s 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 " h3 y: L. T% a% E
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。6 u% j/ T+ z( R
[编辑本段]二、智猪博弈理论; h. d9 f( @4 A: j
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
$ S& e7 V r( n* U 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
% v- b$ k/ P1 g1 [& s6 h5 B! d 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 . M, C1 S9 L4 w4 \' P
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% P {' @6 P ?1 O# W “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ) N$ J- L/ I* B3 h3 `
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ( E. C9 @9 N& F- r: ?7 }
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& F1 I- i# J1 O8 V" y6 m 1 e! `, A9 x3 G
三、关于企业价格策略; G- O. l- x+ V4 v
) C! v- Y$ _8 @/ e
M+ w9 \1 l; S) ]* t 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
5 i- N6 ]+ g% T9 q6 J8 A! ~ 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' v, o1 s& Q: z: @7 H9 y
以下三个定义:
& p% Z2 E+ X0 g 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 $ ?. c5 K9 W5 ?" b' d
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
/ C8 f! z0 C' J( R, I( ? 所谓的双方优势策略则是指双方利益总和最大的策略。
3 H* X ~$ w$ S( J# `& n9 q[编辑本段]严格优势策略举例分析
4 M" Y4 X# e6 p% V/ q- x 一、经典的囚徒困境
( b1 W3 T s# l0 Q: w; f) p8 w 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
' W$ n K; z$ A% M" J 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& h( [, ]/ s$ {+ i# d 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - w3 x5 a+ m4 H
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " V/ Z' A2 }7 _! S" G" p- v6 C
若二人都互相检举(互相“背叛”),则二人同样判监2年。- n0 v: n' H, `, g' i
0 T" g' b5 T5 W
用表格概述如下:9 x3 h; L" o% c* a0 s @9 u* B
% c4 F2 P2 S/ ]0 f1 |: s 甲沉默(合作) 甲认罪(背叛)
) Q E2 X2 Z9 J* W乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ; V+ j* D6 `% H) h7 Y& z% c
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
8 H# o- D$ Y6 g+ B. w0 D( v
9 v& N* W( d* D a; H$ P$ e1 s6 Z' s* m 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; T; V0 M$ S3 A
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
* ^# D% Z F% k6 E 若对方沉默、背叛会让我获释,所以会选择背叛。
" @# M \* |( T7 N 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
0 y3 _! ^% [0 ~$ O 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 / p. r& B9 \; ?. j7 e
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 5 ?) b) z1 b+ Q
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。- v9 U* ?: o* E
[编辑本段]二、智猪博弈理论9 i4 N& @( }) A9 e+ b$ `8 V
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
/ g X8 g) l4 z- \0 y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 2 @% {6 u/ o* b
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
" a: t. i" d, t4 d/ y 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 % [( c& S$ C7 r9 M
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( P D0 o5 x# ^1 v
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
6 L Z' K0 z# C/ h: @ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
& w' D' k/ s' v1 T$ o
& p, t+ v3 F5 S8 Q; H- U6 a1 C三、关于企业价格策略3 S! B9 I. J* u
6 X- {: ~8 J1 P+ `; i9 T' Z
* P6 R9 n' K( k3 J" A8 M* I 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , l* w6 z, ~. _% @+ P
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |