本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
, b' c7 U; |2 C- b+ ?' k8 l8 X( A; `& }/ s
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);/ j/ h' Q7 d( T, a/ O4 V4 \$ P+ d
以下三个定义:$ }9 D8 B+ E' N7 P
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% y3 J( x( N t* [ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 Z2 w5 T- Q$ R$ T5 M3 l: f 所谓的双方优势策略则是指双方利益总和最大的策略。
m0 ?. K! W0 f) J8 |[编辑本段]严格优势策略举例分析
]9 I/ C/ |3 h 一、经典的囚徒困境
4 A/ n4 [0 O2 r3 _ 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
" s5 l! D, L1 p# | 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
& G; [+ S4 k P 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 B, b: R4 H a
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 * B- \$ i/ ]' D8 R6 H; F
若二人都互相检举(互相“背叛”),则二人同样判监2年。
L9 ?- T* h& }4 F4 V$ [, B# T8 c
q( [9 t6 r7 K) ]- v用表格概述如下:
" a7 V. c5 j" U+ @# ~' d9 c- ?" m" L1 P
甲沉默(合作) 甲认罪(背叛) 1 O0 T2 M2 ~+ Z
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
. b# V0 O1 O& j/ _5 U乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
, g1 L6 Z* ^0 Q8 k7 s2 ^, c. R" o, p- X" G! s6 a( i
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
5 s( }" [% D' k4 d3 q 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( r: Z$ ?4 }( r6 K3 {
若对方沉默、背叛会让我获释,所以会选择背叛。 % i! w+ t3 H* N- J5 Y( _
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
7 y! m+ y! [: B& \- H 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' T7 D/ ]$ p+ \; H) R$ x- ~
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) M8 w v! e5 D% D* @
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
5 W2 P4 O# @+ V; {( g[编辑本段]二、智猪博弈理论
7 n$ }8 \" L9 f( n# `' f9 t 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 9 u; }. |! \. J, V
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 % P$ X5 ?/ T) ?* ?$ e
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
5 v! _, S/ v" Q2 c" }$ D2 h5 R 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
% B2 C$ ?- E o' D “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
3 @. P1 A/ S! T9 a) [9 _ 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
! l+ ~8 ^4 v! e! ^1 k0 n) g1 F% H( L 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 B' n# e: i2 |) ^ g8 x1 j
* k1 w9 @) p$ c三、关于企业价格策略. Y" f/ T- u& l# b3 v
8 N! \ h0 ]- U
8 {. k! H; E& w( J& ? 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
9 t6 M) H& Q/ u 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, u* z+ {9 ?/ t4 z; `: T
以下三个定义:. t R1 s; T0 ]7 R- H$ U- |
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 2 d4 t( I0 ~$ s
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
' Z" B+ x* M% n, A* n; M9 k 所谓的双方优势策略则是指双方利益总和最大的策略。 1 R$ S" l, X( l2 K# N% A+ {
[编辑本段]严格优势策略举例分析
! d+ o6 v& {! x- [) ]: ^: F 一、经典的囚徒困境 , _7 l+ l" ~2 o }7 _
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ p6 o0 Z- _; m4 W4 y8 E; U 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 6 k ^* I3 J# i7 G$ K* g
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
8 }1 I3 v' g$ H4 x& P! J 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
, ^. J# s; L; d2 C1 T( R+ q 若二人都互相检举(互相“背叛”),则二人同样判监2年。/ P7 f- ^3 H) d0 L
2 n5 v7 l2 i7 r* m/ x用表格概述如下:
6 q+ @$ [2 U! ?- L) P' t# n, ?- z F. A( L6 ^
甲沉默(合作) 甲认罪(背叛) ) N6 X! N+ q& i0 n
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
( a3 O0 R/ {8 {: ?+ h7 S( [乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 % ?; i6 `% j! y
. L4 k8 u# t/ y+ t" L$ L4 D4 |
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 , n; o6 \* K$ j4 c6 ?
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
$ J5 R# d* j$ p- v8 I6 m% B 若对方沉默、背叛会让我获释,所以会选择背叛。 6 Z' D7 r. W. i; r* G+ z# ?9 N+ u% z/ f
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 h" y0 ?$ Y" y' U% T% g2 m! {
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 0 i0 c/ L I; n6 h8 x0 f5 h
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
3 o8 o) [: l4 S; J 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 w+ ^/ D' K, a1 L& M0 ?) B2 O! j
[编辑本段]二、智猪博弈理论
! P6 G" o; @8 T5 c 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
5 V* [# g! b) _* ]2 a0 |% d. o 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
/ G+ }- u" [/ L4 V) X7 F/ h 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! o. o7 \2 i0 Q0 j3 Y( f; s 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
X9 A5 \- m+ m3 O( ~1 Y9 h+ Z “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 7 r" G; A% T2 J9 `
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
Y, f: V B1 x. y3 P" l 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
' I0 w ]$ O- f" H8 f& L; P " f3 f q' a4 k) q& l
三、关于企业价格策略
. i; L9 v% k9 R: ~' v$ N' }; `, H4 _, ]4 F3 r
: f! w4 |: G/ v% C% a) J. ~; D 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? |/ J5 t7 f y; \- h. ] w
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 [7 K4 R. Y1 x, y) h3 q 以下三个定义:4 a& F2 W A7 o& t/ b6 s0 \
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
. Q) @6 b: z5 B* O; U+ `/ F0 z 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 O/ [, r1 ]+ O' @2 |& f
所谓的双方优势策略则是指双方利益总和最大的策略。
, { G( ~+ o# T* T* W[编辑本段]严格优势策略举例分析
3 k4 J6 A! i8 E$ y- o 一、经典的囚徒困境
8 U+ a( b5 v. u7 p6 F 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 W; n5 ]2 K0 W! Y$ t) G 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' h, q* k% x; X+ ]3 ~" U. t; J q 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 6 {5 r+ b9 c- o" r
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
2 @1 y- `8 ?: @ 若二人都互相检举(互相“背叛”),则二人同样判监2年。, _; o& j( n' H% e! `1 A
* i/ o# R3 ]: M用表格概述如下:0 }5 y3 ]& ~) n T, o5 ~/ T
" K2 U; `; U( Q
甲沉默(合作) 甲认罪(背叛) 8 @- J% j; T2 e! u
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 % A- y1 a# _- G5 v/ Y$ ^- q& f
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
; A, j3 }$ ^2 k& H8 e
) @ U: N8 B. _9 l2 H 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; v, }5 Z$ `5 r7 x8 f# H3 X
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: + y" \# K5 x3 v# t k4 W# X5 P
若对方沉默、背叛会让我获释,所以会选择背叛。 6 |9 Z \. o* [6 w1 J
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
' Y6 l+ }6 G0 C- L+ q# O# P0 [ 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 * P4 J# a# y$ ?# j* s' X
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 * p f7 |" I* @9 k# _: p
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( N/ w& W0 K& ^/ W: H$ V' K5 i
[编辑本段]二、智猪博弈理论' _6 g: @' C- z: d! c i1 u
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % {6 t. u3 s8 k. s6 y5 p) d
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 & b! ?, u" p. U+ C9 N0 B: S
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! F0 a3 B+ g3 d7 O 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 W" P/ ~& ~3 Q! P5 F0 `3 h: B) c
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ' K. L: ~% J# P# f
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
) H8 h2 k7 C+ Y5 H7 \ 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% I9 I6 {4 |6 ~9 T1 `( s
7 I4 Q" ?0 ?1 R6 K% d# S0 V
三、关于企业价格策略( ]# e, e1 i1 g* W" f# Y1 n* [
! E5 r) ~9 A+ B' V F3 l+ J* t
1 ~3 F* |) D6 F5 ?. K1 ? 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
, E: e! S: M- } 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' Z- a( g7 F. v) f5 n* y2 H
以下三个定义:
6 @7 p8 {2 w% v- D 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
% b$ z, _9 _& N) i 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ! ^; y7 v. D# d0 ]0 I+ R
所谓的双方优势策略则是指双方利益总和最大的策略。 4 R2 ~' [; u+ v' I$ X$ g* j7 D
[编辑本段]严格优势策略举例分析4 x0 U. V, z! M. |. ^/ X
一、经典的囚徒困境 : C4 o0 q9 }9 m$ D# @
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: # z& B# n5 |+ u8 _* q3 ?0 A
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: % m0 z; d2 M$ G; ~, y( \- K
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 {. [$ c9 P4 g9 r6 O& h 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 % Z# o6 c! p' r- ]+ ~& S* B
若二人都互相检举(互相“背叛”),则二人同样判监2年。
% K8 \. v5 D9 I0 {; x* ]4 q # z% s( j5 j# x" o3 N$ ^
用表格概述如下:
$ @+ f& w$ Q6 }
, I- b$ F5 v8 I( G4 v 甲沉默(合作) 甲认罪(背叛) ( k9 b, V* @- j# a8 b) Z2 f
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ' Y% P0 g( X* t: w& M- A9 e' B2 D
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 . E3 L$ Q" n5 n2 `, A
# F9 t! j% t" J1 U
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ' Z/ g/ r3 ^5 ?: l, y8 I+ Y3 @! @! e
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 U1 q( `& }+ \) \9 a$ P1 Z, J
若对方沉默、背叛会让我获释,所以会选择背叛。
: T4 f5 f- z: r: W; b* D; d4 X 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
$ |& E! \ }" |6 K t, f( z 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 3 l* r3 O1 j: S$ {0 I
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
* K4 p0 L" c. J7 U% _% O+ x 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
- |) q' c, k/ _1 d$ h[编辑本段]二、智猪博弈理论4 r& Y# U# U6 I% o/ u4 z, ~( y) \, L
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( g2 F) w q B9 S6 T, y' `) |
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
$ w0 q: \2 r' s; ?* e 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# k( k; A6 P9 O' a/ H7 _& D3 z& w/ ^ 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
7 @5 \+ ?+ p6 v0 _2 W$ a8 v. A “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 % @# W+ V7 v8 D! Y, ~% x$ D
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
y0 S/ g' j/ _3 c" ~1 t* ^- m7 Z 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) J1 c( z: r* T' Y1 V$ U5 w
9 W& p) C( M; c. q; B三、关于企业价格策略
# z6 ^* \ A' I: C* v* g( `8 J
: q! B4 N) i) G; k9 ~3 u$ L. O 1 J& N+ k9 S1 d7 ~6 J( @- i% h9 C
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? , o2 J( ?: c1 Z1 _9 m6 [9 {- r
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |