本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 " u1 Y& v& }. H8 v- K* l0 x0 R" ]/ `+ w
+ J8 D( p' h3 d$ Z4 ?! h
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
) I4 p9 G* I" b. B8 B! D n) \ 以下三个定义:
) ~9 ~, b. d5 ?/ e4 O 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 % w q( [! g( h. P% _0 i+ i
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
8 D5 ?, A" k a# j9 K8 z 所谓的双方优势策略则是指双方利益总和最大的策略。
' }- o' X- a7 a0 L$ h7 J[编辑本段]严格优势策略举例分析
2 Q, N! M6 k: D/ n0 ^$ J8 m5 K# I1 ^ 一、经典的囚徒困境 4 z3 o; k; f; j. w ~ V! S
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: ' B4 `# Z* i9 N# I0 d2 o: K
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ; a" U! C( d+ z( k8 E- ?
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 : l$ s9 \* F" K8 m
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 H) n f/ h. M4 @# q 若二人都互相检举(互相“背叛”),则二人同样判监2年。2 s6 t# J' ] g8 X
; o7 Q$ r6 \( ?$ P- X; s8 r
用表格概述如下:
) k* J) Q0 b- k- \6 x8 `4 z5 f* W( I5 Y) i4 L" u
甲沉默(合作) 甲认罪(背叛) 3 r5 h* n8 G7 |% U. D
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ! A. o3 t) f }" K
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" p) g: Y, g9 q& D6 p$ q
- A# p: v/ m+ i$ S) U" b 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
$ W' _, S/ l0 A0 c, z: e 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
9 x" B. t& F$ B- H7 C 若对方沉默、背叛会让我获释,所以会选择背叛。
1 G( D) s0 O' L' ? 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) P; O6 f; L4 k" {: c o! @6 Y: o
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 Z" f6 \0 N9 S' ?' J; Q
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 1 Y- r# z$ D" n7 S+ B$ q- Z
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。& o. G1 q* Z: A% l
[编辑本段]二、智猪博弈理论
7 M& {3 r1 o7 \# O8 L; Q( f9 f 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
4 e3 U% f. R( c6 d$ z* y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
; B, E. ^, V$ [* D; h: K 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 " w: t6 t4 q9 _% N( ]
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& \/ @6 v2 m o' E2 p' h* {6 f “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 5 L5 z+ R6 p: N p7 C
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ r3 k$ T% w% Z F 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
0 H! [2 U6 o7 {* b1 h5 c9 o L9 |% R9 L+ {: E# P
三、关于企业价格策略$ N0 W7 K: i. S
5 G) X3 C* d' S+ d
) P. n; z' b8 i. |, m) u 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ; h( y& X1 ?/ X! C$ e7 h
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);7 j Q# u: U( c& ]
以下三个定义:
s3 o2 w' Y1 O& H" ? 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 * o, h6 j2 l2 c) ?0 u% y
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
& V. l4 i5 l0 {# \ W 所谓的双方优势策略则是指双方利益总和最大的策略。
0 V" Y0 t+ n% `' }[编辑本段]严格优势策略举例分析
. b$ q3 J1 \% q- a 一、经典的囚徒困境 ! t8 }2 j: A7 @ y7 C
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 2 F3 J* M3 V, q0 q* ~& }# ^
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; a# L" f3 r+ _# ?: b: S 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
$ f% N" O" r/ q: L 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 H: b+ V( c8 z1 d6 v* V 若二人都互相检举(互相“背叛”),则二人同样判监2年。
2 v9 ~8 T; C% a6 V* p
2 X! k, z1 k. o7 j用表格概述如下:
, G9 t/ r' K+ x* W% T5 K9 U( }$ v7 k6 v
甲沉默(合作) 甲认罪(背叛)
" S6 D( |2 ]/ u$ P" M乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
7 Y3 k6 {. G3 s, W: h7 ~乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
9 G. K2 v+ |& n$ U0 R) |
0 |7 @& c( q$ q' a4 u) _* ^+ y2 q1 J 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 $ n6 V) s; {- d% {0 p0 X
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 i1 n* F8 G( b0 @; G+ {
若对方沉默、背叛会让我获释,所以会选择背叛。
: k: `8 H M4 `3 D0 ~8 ` 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
" ]8 e5 C0 M* N i 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
* ?. F! y0 Q! b3 _9 r 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 4 G3 I# y" V+ K$ Q1 A9 j
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
, r" [. n; ^* J8 H/ W5 j3 {: F# h5 r[编辑本段]二、智猪博弈理论* @6 v" y( O5 {: U4 Y
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
( k* I+ t. ~* `1 ` 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
. A: H! h, }" g0 v 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
* G5 i9 ]2 g% o( {2 c 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 6 H6 ? D- R, T1 w0 ~
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 3 R8 ?1 d# f+ x3 l/ p
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
$ A+ J( Y" k+ |- |' o0 W7 b 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。( }$ k3 F, I' W/ ?
0 s! }/ S% u& e! J. g# u, Q% L6 R
三、关于企业价格策略
6 u# K6 W' z' I: l* Z( }
; P- u2 Q0 i( ` 3 P6 A2 `5 V" N! h
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
/ Q/ C. C2 O. |0 r! z 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
$ Z$ v1 [# I+ w6 D! Y 以下三个定义:
3 i) ^- h; ]& E: ?# o+ D 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
, W, D9 F1 b6 P& ^1 { 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 * m& M# [: C, F# B. i D$ A& W
所谓的双方优势策略则是指双方利益总和最大的策略。
. @. L( p0 q- p0 }" F7 h+ B$ j[编辑本段]严格优势策略举例分析# i/ @% H/ T7 w2 }
一、经典的囚徒困境 9 b M: h) B+ m. U) s3 B
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
, y* U+ B% K: p 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 1 q, z" w) }% ~, M' t0 Z; W0 }7 q
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
+ b0 r+ w/ L1 @* J3 K: T 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 " U! u0 k5 H2 Z- g4 L
若二人都互相检举(互相“背叛”),则二人同样判监2年。
3 W! h0 R0 b! d0 k
. K6 ~1 }5 S7 r# J& k6 ]用表格概述如下:- I. M0 q7 C* H7 C D2 `
! L9 }2 _5 q. S& X' f
甲沉默(合作) 甲认罪(背叛) $ T" ^: f5 v* a5 s; e( s M
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 k+ e* y" Q+ X, |乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
7 \6 f& I0 U& k4 X
7 m5 M6 K% d+ O/ X, V) w0 m( u% C 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 v9 Q5 a5 g4 |. ?% s" q: i; N8 T
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
: y# p- ^! Q% I* B) o8 `- p 若对方沉默、背叛会让我获释,所以会选择背叛。 5 S3 c/ m' b c% k4 H. l6 n% \9 M
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ j8 ^4 Y, V9 M4 G6 E; i# O
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 & R$ _# G L( p' e! V) e- d9 V
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! X7 I1 j; ]+ T4 Y/ ]
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
& p. G* \7 y3 d( Y; k[编辑本段]二、智猪博弈理论
% f! H9 x8 F$ K- P, y 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
& c6 ?( n; ]0 `5 H( `. R% A 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : q$ b$ p1 A6 e; g- _5 a
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
8 S4 o9 t6 H6 p* t* F( g 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ( C+ Q! j: c8 P( N) G2 j/ z
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 6 I2 y) F8 W) m# {4 b- _5 V) {
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ; v) k7 m9 v- c+ P e
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 p. ]# ~8 q' I# M/ H9 N8 S
0 [) [9 U' @" w J三、关于企业价格策略
* |2 R5 y( W% J+ x0 B6 ^! E$ j# V4 H9 L+ [+ w" U# _5 D( ^
: P! N" K$ @# w4 b" T$ q ^7 E 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? - r" u9 P4 q# u
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);; X( ?' l: L1 x, l
以下三个定义:/ G9 K) F, Q8 s) ^
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , D3 K" k) R) }7 u' v+ A
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
3 c: E1 R6 k% f' H 所谓的双方优势策略则是指双方利益总和最大的策略。
Y9 a! @# b# Y/ R% ]6 I% H+ H9 ?[编辑本段]严格优势策略举例分析* |$ f. L, s4 ?7 k( c
一、经典的囚徒困境
) R0 M4 E# e, e+ n! w! k( e+ F 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
# f& N0 e: X7 }+ G" k 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: / b& K F% B' d) B7 O7 e& b
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
3 T" p9 V5 }1 ~( S: O$ ? h 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 - Y! s' S0 [5 i* e, y; B* {3 Z5 |
若二人都互相检举(互相“背叛”),则二人同样判监2年。: ]4 _2 F: U- q0 Q' Q2 X4 T
0 n( p& p+ ]8 u* V: |6 `2 M用表格概述如下:
3 O) `5 I6 y; ?$ P" y* Z, U8 D" K' E F9 [6 d' ?
甲沉默(合作) 甲认罪(背叛)
1 R' y6 {9 m3 c `5 ~9 p% a# c乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 + R& ]: V0 g* x1 Q+ {: H
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 r6 P* {# u& C2 t [) l7 P9 s& R" u1 c
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
+ R" O* v4 |; w" Q& _, l 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; V4 j L Z3 ^5 Q' G3 u" P/ Q
若对方沉默、背叛会让我获释,所以会选择背叛。 6 ^" E: L6 { ]* I! r
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
: S8 {9 ~' C5 E5 e2 S3 R8 u 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
2 e1 Y4 ]6 z( [ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 8 M( P7 g* G5 |) B- A. M6 i
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 H5 z6 O# J( b- T[编辑本段]二、智猪博弈理论
' U; g$ P" j& j+ V; Y# ] 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% ^) n; W/ E, [9 d* T 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 ]# l0 q: X7 O# p! P/ m
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 m3 _* ?* F: x+ r 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 5 \! y Y& g+ I( j* N
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 # l7 w8 P( I* t+ p0 t2 \
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
" @: x8 B7 V6 c+ R4 P: N+ B 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
% H v/ O5 c( Q, M# Q8 a6 ]0 M, j 0 q& H5 W, ?& Q3 H6 p" m2 [$ [2 ]: ~
三、关于企业价格策略4 L* |8 f! s! `
9 |* q( \% N/ F/ m : [6 C. i( F" @! p8 i9 ?" Y
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / }5 T' P# m, ?5 h
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |