1 Y- p! I. w1 E( u; \8 { by Paul Walker translated by xinhua " B; N* J1 K4 F7 B( D' Z
6 r6 W* g( Q3 R: x, B' H
公元 0-500 年 ; P$ Y6 }1 `: } 1 T% \9 n9 N. Z/ A; \ 在作为古代西方国家立法基础的巴比伦犹太法典上,曾经记载了一个关于婚姻契约的 2 m. y8 {0 ^' t
问题:在一个案例中,一个男人有三个老婆,丈夫在给她们各自的婚姻契约中规定一旦自己 4 h. p5 H/ Q2 q死亡她们分别接受100货币,200货币 和 300货币。这部法典明确地给出了不同的建议:如 6 U9 y [. t& H: C, A果男人留下的遗产只有100货币,将其平分;如果遗产为200货币,将其按(50,75,75) 的比 * }* ^! M' ?: W' E& p5 p$ @
例划分;遗产为300货币时按(50,100,150)的比例划分。第一种情况容易理解,而如何理解 " W0 S I0 `: ]5 c' l+ K) ~后两种划分?这一问题困挠了研究犹太法典的学者达二几千年之久。直到1985年,有人提 4 Q. i2 n$ C9 v! E出:犹太法典的这一建议是完全符合合作博弈理论的,每一方案都符合特定博弈的要旨所 + Q0 Z$ u# s) W, [ k
在。 2 o: r- [5 {7 g* u. M: S; n) a
+ I3 _6 S. Y* e$ p
1713 - D; @! T, D6 u
& u! Z5 x( `, k- Z: e
James Waldegrave 在一封信中落款为1713 年11月 13 日的信中第一次提出了最小最 5 g& m0 z* H% Q2 R5 a大化策略(minimax strategy),这封信及其回信的内容主要谈及如何在纸牌游戏中获取 5 q7 o Q( r+ d& O
最大利益,解决的方案就是 minimax 策略,但是他没有将这一思路延伸到其他领域, 而且 5 ~: U5 l# C' o* I表达了自己的困惑:“多人策略似乎不适用于常规 * ^; y/ K5 y1 k1 z9 F0 T
# H; q8 o4 A$ q . i! _6 J3 l4 J& F( Y
1838 : e8 e+ U |6 n3 j1 f
- I; h7 |: F+ B# D) k* @& H ]% [
经济学大师古诺(Augustin Cournot)在《财富理论的数学研究》中探讨了双头的效 ) R) m' p3 P3 c( o* b率问题,并且使用的一个后来被称为狭义的纳什均衡的概念。 7 ~" U7 x2 O- u7 u 1 `2 u& w) @& K# J. ?+ Y/ ^9 `8 v- z$ E1871 % b5 V; O- W) m" j' b1 \) W9 b - M4 A% K' y; V: v
有意思的是,查尔斯.达尔在《人类的起源》中隐晦地进行了生物学界的第一次博弈论 . W% N q. I1 g# [% n战。达尔文认为自然选择使性别比例趋向于协调。举例来说,如果女性出生率较低,那么一 2 y( T4 A+ C; A% K位新生的女性成人后寻求配偶的机率比同龄男性要大,就有可能侍奉多位男子,这样就个 . Y6 H- k5 n7 `3 V5 }* Q% C0 D
体而言的女性拥有的子女较多。从基因上讲应当生女孩的夫妇(当时的理论如此——译者 o# H& H8 k, C' e" p3 B9 [ W$ _$ w5 ~
)就会有更多的子女,生女孩的基因逐渐扩,使女性出生率增高,直至恢复到1:1 性别比 ' ^5 b& K; I, h, |6 _8 Q
。男性出生率降低的时候情况则正好相反。1:1就是平衡比。 - t+ @+ W# \* q; H) [% P9 ~5 f" u
5 C) g5 u2 c. b
1881 - T# ]3 A. ~( A5 p/ f: ~( e# u9 g, D
艾契沃思(Francis Ysidro Edgeworth)的《数学心理学》出版,作者在书中讨论了 5 c& g4 i$ ?6 L; \, |% l" U
数学在社会科学中的应用。在解答两人交易中的产出问题,Edgeworth提出了著名的契约曲 # ~0 r* W8 C5 v; K. |0 J
线即 跷炙记?摺T谝桓隽街稚唐妨街窒?颜叩哪P椭校?双方竞争的各个博弈结果构成 3 P5 [2 ] p2 I& T9 l7 W一条曲线。 6 t) b# @7 t. L+ n5 U: o3 i + B* {- o5 R& g7 ]* n5 x # b1 A s" R& s" S d1 z7 ] f
1913 7 P' t5 E/ f9 s6 Z ) o/ ?8 }8 v+ ]' E' y
哲梅罗(Ernst Zermelo) 发表了 哲梅罗定理,即博弈论第一定理,这一定理的可以简 ) J9 w8 U, B C2 q$ H( }- P化地表达为——博弈双方可赢可输,也可以合作 3 Q# d7 k) I- \' |' a! L k 8 G+ p+ @* n( { T/ O
: z2 {9 k T8 N P! i" t# p; ]
1921-27 ( ~1 E/ W; U) [2 m
. M# g# M( y2 [$ V; e
1921年,Emile Borel发表了关于博弈策略的四个观点。他列举了两人、三人甚至五人 # R5 i$ ?8 _) e" N
博弈中可能出现的策略组合,并第一次给出了公式证明。起初他认为最小最大化策略也适 " c, S' }; \ ~; |. o2 N {- J$ b5 G* e用于具有多种可能的博弈。但是直到1927年,他还不能找出反例证明自己的观点。 % i" C! b2 @1 ]( q# D& d
9 A1 ?5 Q: y; |* J6 F" m1928 # Y0 N5 X$ m- P. S( y3 ~7 h8 O
4 I8 \8 O% I1 O: }: b! C
约翰.冯.纽曼(John von Neumann) 在他的论文《 Zur Theorie der Gesellschafts ( Y2 |" _# h' {8 X. v* ?; O. Q% a. Kspiele》 中证明了最小最大化(minimax)定理,或称坏中取好定理。在每一个两人的次 % n$ m' x6 Z+ d5 l
数有限的零和(zero-sum)博弈中,博弈双方的策略是确定的。当双方了解了策略组合之 * o) } z$ Y$ x& q
后,博弈的结果是双方都只有一个唯一理性的选择。纽曼在证明过程中引入了一些拓扑和 ' l; B" ^/ c" V2 ]+ o! O微积分工具,这篇论文无疑延伸了博弈理论的思路。 / Y5 R+ S( u" {+ \) s. s. o) Y
' N0 T; V* A1 x, {( J$ F$ B9 M1930 0 u2 O9 Q# X0 ^# t: I% y9 \
F. Zeuthen's 出版了自己的新书《垄断和商战问题》。在第 4 章中他提出了自己对谈 7 u) o( `: B+ Q/ a) j
判模型,这一模型后来被豪尔绍尼(Harsanyi)认为与纳什均衡非常之相似。 6 H- z9 M; p& E1 T . g8 c% v% g T& |4 d1934 8 p+ E& O1 }0 t. D f 费舍(R.A. Fisher)独立发现了前面所提到的Waldegrave的关于纸牌的困惑,并发表 , L% a: S; n+ l# }$ W# d了论文《概率和纸牌游戏之谜》 ; D. M+ g. |+ z+ q$ K: _) R) G
; l9 }( s d" X. D
: |. @3 P6 k$ ~- i1944 ( \$ p7 L2 ~6 w4 |$ _& e 约翰.冯.纽曼(J von Neumann)和奥斯卡.摩根斯坦(Oskar Morgenstern)合作出版 ( [# Y+ s6 P& K: Z了《博弈理论和经济行为》一书。该书不仅解释了二人零和博弈理论,同时也开拓了博弈 7 t6 [, ~- o' z/ }% `9 ^9 Z ^: b理论的新内容,其中最重要的就是合作博弈,书中围绕这一问题提出了传递效用、联合策 ; }/ n* s9 Q! \( Z略和纽曼—摩根斯坦稳定均衡。该书的另一贡献就是公理效用理论,这一理论此后被广泛 4 R8 Y* T( J4 n
沿用于经济学研究 + ~# I" k* w- n, u. W8 R9 ~
) s1 e& H) S, Q
# y& b# |% P$ a1946 / s) C; }! x9 j2 b- y% FL. H. Loomis在他的《关于纽曼定理》一文中首次完整地推导出了最小最大化理论的数学 # c+ D% D" f; O
证明。 + ~( l8 k! A- M' k# s0 }5 _1 u ! G3 ~' W& V+ L3 ~. O. E+ J1950 , Y" j/ `$ H0 A0 J L9 O8 Y
" P6 }8 N: f A o* a
德里谢尔(Melvin Dresher)及其同事提出了著名的“囚犯的困境”模型(the Prisoner' ; q% B, B3 w) ?1 w& G ns Dilemma) ! K8 l0 Z2 @# u1 E1 p 0 e/ Y7 o) M( g9 x4 P4 v% S- L
1950 2 A9 }" j- L% [, ^
《麦当劳在博弈》一书出版,这是第一本介绍博弈理论的大众读物。 " O# W1 p/ C/ _' q! Q( o6 L
0 l3 f: x0 P7 x* h
1950-53 0 Z0 x' k) o2 E0 i* ]: X# ?9 i 1950到1953年间,nash在四篇文章里发展了非合作博弈。它们分别是《多人博弈中的均 ; F: S8 `8 S& T! p7 x M
衡》、《非合作博弈》、《关于谈判的问题》、《双头合作博弈》。在前两篇文章中,纳 5 C: Q- p( u2 O0 r, r什证明了非合作中博弈存在均衡,即著名的纳什均衡。在后两篇关于讨价还价理论的文章 2 U' {. P8 y" [+ |3 T
里他发现了自发讨价还价理论,证实了纳什讨价还价方案的存在。 3 C2 h1 h; a& W" i% Y
& t0 A# P0 \# F. L8 g7 ] N/ ^+ I 2 x9 M A) G9 S ?1 {5 E8 G) {4 y1951 ; i+ f h4 x' u7 t. c* G
布朗(George W. Brown)在《假想博弈中的迭代解》一文中探讨了间断的零和博弈中 1 D/ f$ K0 [* O8 b! q. ? U# V# G v的迭代解问题 , }, B G, F. V
, [1 K$ y. d7 j2 w1952 + W: W! j) B) d) F 查尔斯(John Charles C. McKinsey)编成第一本博弈论教科书 - Z7 n, M9 {& U
6 w5 \7 ]; ^6 X: u0 V 2 U! Y5 v, T: I1 H* a, E6 H
1952 & P" Z( R7 W0 C 福特基金和密西根大学共同发起成立了第一个博弈论实验室 ( H4 x4 q1 a2 F
8 G0 W [) r4 p* j0 M @4 ?7 f3 [
! e' h! I" e9 `3 B& P1953 5 Y1 k' a O. n0 Z# o
沙普利(Lloyd Shapley)在其论文《再论多人博弈》中通过一组公式推导出了合作博 % U9 c( G; a) o; S8 |& G6 }1 B弈中的唯一解。 这就是著名的沙普利值方法 . {& g8 U. r( S, n% m# O% z$ p: F2 F 4 u9 L! R" x, o+ x, k; Q
1953 9 o: W) p7 @, H! W) C
沙普利在其新论《随机对策》中指出:在完全竞争条件下,当预期报酬折损比率为固定 5 t# k) |$ _& n) A& I: [! f,这种博弈有最佳策略解,其解只取决于本次博弈而与前次或以后的博弈无关,即策略是 . b+ }, ^% }& A5 U静止的。 4 @7 z" B3 Z& V7 E% G/ x/ @ Y 6 [" x9 S2 o4 N1 E$ a
1953 4 Z0 }6 ^' b& o$ F( X
7 t7 V% I5 O( Y- w: J, i 库恩及其伙伴合作出版了《博弈理论II》 0 S$ \( [; x4 `, m/ ~ : F& i3 G# v* ^+ L& P 4 V f/ p% J" b2 _# O
1954 8 W) o$ Q& x0 e1 ^4 u# A& w
- q) D5 { z' S
沙普利开始将博弈理论应用到政治学研究领域,其论文《议政系统中权力分配的计量方 1 e5 t0 E; q3 w# v( J法》运用沙普利值方法模拟演算了联合国安理会成员之间的权力分配问题 : }/ X% L# j L# \6 C # a% g2 Z$ N* K3 i) P* E7 h * Q6 N0 ]6 }3 {2 Z# T5 Z
1955 1 J9 m U( j: A+ J6 Y+ ~3 z# e& E) E
5 G6 H! r4 { a5 o- Q/ T
布雷思伟特最先将博弈论运用于哲学研究,他用博弈思想来分析历史上的哲学家 0 ]' o' ^9 j5 ~7 w
2 v; B$ D" m- }) @+ R8 i8 d0 N8 p 7 Z; f {3 E7 F/ x3 Z# Y! s1 \" r# p1957 1 @* b- h% y$ z5 z; ]5 ? ! G; ]# d0 Z' b4 w8 g: g5 dR. J. Aumann在其论文《多人合作博弈中的均衡点》中提出了“强势均衡”的概念 5 t2 R9 e0 l# _+ x* w7 ^2 @ $ G& D$ P: D8 V$ `7 y; i7 m% ?4 L
9 D4 O4 C0 W6 A+ d" ^
1959 , p& G$ h+ H7 ?4 o
) f! a |; l9 l5 e7 o3 ~. r' E4 U
舒比克(Martin Shubik)在其论文《艾契沃思市场博弈》中指出了 跷炙计踉 曲线与 . D- L L* `, q c6 W
博弈理论核心思想之间的关系。这篇论文的一个不足在于舒比克讨论的是效用可转移模式 / b( J% c* {' T$ o的博弈(transferable utility),而艾契沃思的思想更适合于用非效用转移模式博弈(n 1 p, W7 T- D9 a* M* j& Mon-transferable utility)来表达 , {0 r* M8 q3 ]- x+ a) v3 z
d. A; h2 ]6 g) m% Y2 d
1959 4 V Q& m' v# C ) z7 }5 f- t+ H& ]8 y
舒比克发表了新作《舒比克策略与市场结构:竞争、垄断和博弈》,这本书第一次明确地 j( ?( u' G7 C用模型表述了双头垄断情况下的非合作均衡。其中也暗含着对后来被称为"尽人皆知定理" - v, M, G) g6 L) |6 R( s2 j; ^% R的思想的一些早期描述。 4 \6 q# X A6 U! A0 U' X