本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
5 W4 g9 T" c8 G+ _
$ j6 K% H$ \9 O' B- w( d5 Q- O严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
; c ~! `9 g' h+ } 以下三个定义:
+ \+ x! f3 O: E5 e6 j. I 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ; a$ [* y5 f( F' k2 H* P9 U4 @
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; n8 r' d {4 i' ]9 K3 c3 I
所谓的双方优势策略则是指双方利益总和最大的策略。 + Y8 X9 ^" Y1 g7 c
[编辑本段]严格优势策略举例分析
3 ]0 c; l8 Q3 j+ d" R. X; V' m 一、经典的囚徒困境 ; K% H, y8 n1 r( G2 H' M6 j4 x6 X" J! l
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ; t! {- k" N8 X' I2 X' k1 ]6 b4 c \5 ?
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 8 c) @/ R( X" j$ _6 ]% `) a) k
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 & S' p' L D: x+ ~. e8 t
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 $ H( ^" \1 U$ h. ~ C- q
若二人都互相检举(互相“背叛”),则二人同样判监2年。
, p+ V. S. t0 I& K5 |: n4 a! j4 k* C
6 Z% K H9 U% e6 F P用表格概述如下:( w* u) w- }# K1 M1 Z- a
2 |$ ? |% s: [" a
甲沉默(合作) 甲认罪(背叛)
; u& J s0 ]& H; A: \) N乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 : `, s) p6 p. `& q" l
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & }" q, L* d+ g' ]' ?5 j
! n& M! D- a: a, S 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
7 ? Q6 X3 L$ b# C6 \: O 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: # q# p6 Z# F7 v5 m' k
若对方沉默、背叛会让我获释,所以会选择背叛。 ! t& B3 Y) ]4 G* Q% m& I4 t
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; U+ I& x! B C( ]& S4 Y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 [) h9 Z& }0 p- `/ G. `0 N) y
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 % Z# M; o$ R- H$ a! m: g
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。' k! k* z# T2 G; J" [
[编辑本段]二、智猪博弈理论
2 M! B+ @- S6 O0 K+ Q 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( c7 z& Y+ F) {2 t9 v& s1 ^- C 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 5 f) e3 r, j9 v$ ^3 p; {$ A
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ; x3 Y% `: x, b+ e
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
4 \, Z( I4 o: K% S! H1 W! c2 M “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ c0 G6 b, O* U$ S3 ]9 E- F
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 / W+ B2 [1 P" ]0 L4 D* Q! }6 ~/ D# M
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
9 v ^5 T' n: Q" e9 }, t5 o' L) Z
/ n8 @. u. V, X- Z& D2 C三、关于企业价格策略
% H& O& Q! T3 M0 @, R( Z/ G
; z6 ~, q" ~8 u( I0 |" b6 W) j# z3 G$ L: w
5 C/ J2 {0 @' }+ y) [1 `8 g 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ! l2 v, e' _1 S" B& Z! g0 p: v0 ]
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
! R* b. {! a: L. Y4 u W 以下三个定义:
# q1 C8 n$ Q( X% k 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 1 R4 P/ y- V. H1 O" q/ T
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 - T* o" X& h2 p o$ e4 w
所谓的双方优势策略则是指双方利益总和最大的策略。
$ ?9 v) `! S5 z& f[编辑本段]严格优势策略举例分析
6 \: U5 [% o! W4 S8 l2 M 一、经典的囚徒困境 * ]4 s5 |% C/ V8 q- ?+ t
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: + f+ \) c8 c. w% o
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # m- c+ Z6 H: k2 Y; |
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
( i4 @2 A( X ?: u7 C. p6 B 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( ^+ H5 c8 y( i; E5 l5 ]8 R* k7 P 若二人都互相检举(互相“背叛”),则二人同样判监2年。
: N! T# a1 b- z! w. w * H4 g' F- T- G3 C# q
用表格概述如下:
8 ~7 Q+ M6 `; b$ a' d/ E" i5 u$ h. E/ V0 |% d
甲沉默(合作) 甲认罪(背叛)
7 |5 Q/ q: v% N8 l6 E1 V乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - V1 V* `0 p5 H( c# n
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 : A6 v0 V9 i2 P& V! V# ^
! r7 D4 }8 e0 H& B0 ]9 u
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ [+ l. e# U% n7 ~* d) f# [ 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
( a& m% A) E7 h9 [3 M8 { 若对方沉默、背叛会让我获释,所以会选择背叛。 2 I3 C. `9 `' L0 q+ X
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 3 r; ]- q# o# v3 E* ?
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 " d* v2 Q3 ]0 V4 j) O1 \
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 6 p; ~- D1 w% V; ~4 h
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
: {8 [. J, S+ ?" @' F" R[编辑本段]二、智猪博弈理论
7 R" Z! d9 H/ F+ D5 |. R 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
8 T0 G w" C# X% `. F 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
6 m6 i! N* \$ [" j* R6 \ 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
. q. F! c+ Z9 s+ N3 X- ? 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
2 M+ X! M* C' s; ~! P1 I& Z) y, ? “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
8 }2 q* @8 a( _6 K* M* U$ h! m5 [; W 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; U: `0 H% d5 b" a) A I# o
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 d. b* u# ]) _; Z1 j6 _# N
- V. R1 H; g$ n6 m% H, E6 j
三、关于企业价格策略
9 P+ o2 c! \# x5 Z; @" F! U* w) s
6 n0 e ~5 k7 x5 x7 F3 }- i & F3 D1 U4 H& L% H7 ^* u9 ^
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 [" o$ K' K. D# }; p( A- K
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
1 L, `# Y ^6 [0 t; Y$ { }4 }4 H" c 以下三个定义:& b1 H; U; n( B# g2 Y8 }, L
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 R1 [9 D$ r$ P+ R' J0 M 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" o. O- w3 y+ h 所谓的双方优势策略则是指双方利益总和最大的策略。
2 ^5 g0 r" c. q! x- e) Y[编辑本段]严格优势策略举例分析, f8 ]) c* _9 J2 L3 G6 C
一、经典的囚徒困境 7 ^5 C l/ X% z* H y
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 8 K. H9 O- G; _* A) ?6 n u) }
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: # G/ F0 ]4 J% j
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ k/ Y* U2 [# e' H) p! U" _ 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 Z. q* X+ j* ~8 B: s& L9 Q' m 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 H( Y3 q* I, h J0 k m 0 @4 R% `9 I+ ~* ~7 B3 P G# H
用表格概述如下:7 i- j0 V# U7 z8 ?0 d
2 i: }+ Z7 o1 A1 y6 `( @0 s 甲沉默(合作) 甲认罪(背叛) - Z6 V4 J7 |/ w& G- s! g# a# L
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. I7 N6 d2 [7 P乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, z5 ]5 s6 x% m4 P
6 i7 z+ i) `, y' q" M 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- f8 `2 Q: s) M; F 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + S) H3 J! b) H
若对方沉默、背叛会让我获释,所以会选择背叛。
+ W5 E: z T0 N+ k& j! _ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 " `4 L+ M9 X- m! f
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 W3 L) p% R7 L; A$ D. x' f
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
# ^+ U6 V' A% p/ S$ \7 z 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。2 q8 |/ m, s3 ?; X% _8 c
[编辑本段]二、智猪博弈理论
! V2 e5 Z; C0 M& Y! `3 v% B 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
- t V8 R& H# E/ i7 ]8 @9 N! Z$ W 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ! t; d4 U0 P# @
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 ) w0 d+ V9 P% S z
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
' u3 E3 }' p* q9 ]9 ^- ? “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ! L* U; ~. X. a$ S
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
: S7 z6 J' Z+ i7 O8 ] 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) J% a' w( Z9 \4 D$ ~
$ x7 @2 B% \. V& a# r; N7 ]1 h三、关于企业价格策略0 ?" x. Q2 x6 S4 H+ `! V1 u" Z! G
. q* E8 o1 \: n; {
4 ^* w+ R2 g& f6 s; c7 ^% _7 B# O 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% ~& ]7 A4 ?1 n. F 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);1 X) X0 i( `! _6 r' r
以下三个定义:
! b% B; P) ^( d 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 p8 r( n0 o+ x8 d2 ~ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ; u f) X5 |. {. \5 u
所谓的双方优势策略则是指双方利益总和最大的策略。
3 O. {" }4 K- j7 D[编辑本段]严格优势策略举例分析2 ~! _: f$ {1 a+ U0 v/ p! g
一、经典的囚徒困境
% Q* U" `8 g' b: g. w5 s 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 3 v# ?8 r9 b4 g# J
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: " \# h/ T% N9 z/ d; X- j
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 % ~; c3 [) g8 d1 J5 n$ R) V6 i
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
. w; g4 ]) N' x/ g- e; W4 P% f 若二人都互相检举(互相“背叛”),则二人同样判监2年。
7 X) n# Z! R' v( R , z9 y- @5 f) q2 @. p5 I
用表格概述如下:$ Z+ T- P4 q0 e2 u7 ^
9 p* X$ x, u+ o0 |) L
甲沉默(合作) 甲认罪(背叛) - U+ |% f3 h% |+ p d; ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 S1 K& g) q. m6 ?* P2 Y乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 : \& A8 x8 Y8 X* ~) ?1 v6 J
+ Q$ M3 Y: ~+ Y I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
- U8 O! ~) u1 G 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ) x2 `+ Q; c% z2 ]
若对方沉默、背叛会让我获释,所以会选择背叛。
8 p2 A8 x9 R# k" \& y 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
, c g' c% v: R0 F5 p# L 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 8 `0 t2 A9 b4 }6 C
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
2 ~) C6 b, C& {" s& P 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 ]6 Q0 k% k: k' _
[编辑本段]二、智猪博弈理论
3 q6 H% F) I0 ]0 ~ 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% I+ ?( y% Y& m1 X 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' u' j/ i! F/ P% _7 B
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 9 X: N4 ?, F* h3 a$ r# W" e
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 2 ?4 J5 Y" N6 K7 | T6 O" W
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 4 `* S9 w+ p$ V8 l4 ^0 {* k4 ?
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
8 @2 o! [- V% g; ~2 ` 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
7 \# `7 c) `- P( Z5 ] % Z& u. I0 U" L2 R; i9 t/ R
三、关于企业价格策略
& A0 F# t' M i8 b" [! A: R
q) r% s% e! `
( c9 _+ ?) K y- ] 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
2 h H2 R* x' K7 E* d 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |