3 ~3 @/ W, u N" b3.1 零和对策的混合策略2 h5 Q0 b' ~, a. T9 b1 Y
: z, i' g0 ~9 { * t# Q* c: @2 `0 O, i$ N9 r0 c; k5 \! Z5 u
3.2 混合策略对策问题的鞍点( C p, [; ^4 T6 W$ K8 N- E
, V! z ?, \/ ^6 i# R1 n7 b! G8 n5 P& o, |. Q+ C3 s
% r7 C' B- \; F/ z * J% a1 L3 u6 h% j! Y7 V1 P& ?' |- x1 X D' V% @! M1 V / c$ |# F' e. m" U, B) K p9 a0 o 8 M2 h; }" V N$ [7 J . ?4 h/ X$ ^$ E' Q' A* f7 h3 v% t 使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问 题的特殊情况,相当于以概率 1 选取其中某一策略,以概率 0 选取其余策略。 1 J! ~$ ` C. c ( I& ^. E: z% T例题3 9 F1 L. U, Q- Y. x % ]/ O9 p3 y3 R& b 5 A5 T0 s7 J. O6 ]3 P3 c # f8 m+ @# j) T2 l f _9 Q2 y$ X' Q8 U2 g7 d
+ Y2 k2 y5 t' e; A% P* c ( e# x. N r" n1 u $ ?9 b+ H* v, Q8 B2 ?$ {6 y
7 k. x- I) E) L2 t- i ' w- B4 c5 D* O0 i+ G/ n' t5 w g3 K
3.3 关于对策解集性质的主要结果的三个定理% c9 \$ N. H; w, [
7 y$ {5 n& ]! L1 m ( y# c( {/ K2 {, f2 `
) D& O2 }' s% F) y9 E* s4 G
4 零和对策的线性规划解法+ {/ H& H `' |) P1 Y& U Y
: z0 ]" m% G& D2 m# f $ \. j" l a$ O, P. ?; f. ~3 n X3 V- p- k 5 d/ \2 _1 M! ?( \
" y K& R+ R5 h/ H0 @& s% ? - N$ P$ g- _" f8 `& x % F9 K/ F, U4 I! y; P+ E9 N. r, b0 o3 Z7 a+ |. i
例题4 " z$ U8 m* ]& O& L8 l8 W8 T: i. o
0 h+ A) {: ^+ ?5 t- g* `, ? 7 R/ y2 ?6 _9 o+ p, l6 s# p& h+ v
6 L: \0 T7 M$ e! E: R& [8 P9 f2 p
编写程序如下: 9 \. t# B! ^2 @3 G- a6 }/ j( V
; Z+ p6 `' p2 a. [/ j
clear $ R+ g, S8 U- ~2 H
a=[1/3,1/2,-1/3;-2/5,1/5,-1/2;1/2,-3/5,1/3];b=10; ) @+ @% n$ p: qa=a+b*ones(3); %把赢得矩阵的每个元素变成大于0的数 4 B3 M' H% w+ B0 e- X6 M: I! B
[x0,u]=linprog(ones(3,1),-a',-ones(3,1),[],[],zeros(3,1)); " a8 v' Y0 j' F' K% z3 M) V
x=x0/u,u=1/u-b . q- t+ P* a& p
[y0,v]=linprog(-ones(3,1),a,ones(3,1),[],[],zeros(3,1)); 7 o% t8 O$ N# J K1 \
y=y0/(-v),v=1/(-v)-b 5 m+ U$ X1 y6 ^" @7 E# E H. A4 j& b 4 n1 ?' @' r W. { 0 u q; P( H0 J; x% n 7 n. c3 z3 f7 ? : | `6 ^4 _; Y" D3 A/ r: R下面我们使用式(2)和(3),利用 LINGO 编程求例 4 的解。LINGO 程序如下: & _# r. l+ U" h, @$ @6 W4 w
model: - M* q$ ]9 i! `( u V% S( ?" s! {( |
sets: 2 _: j& w( @' S1 W: s% C8 A1 R( n! C
player1/1..3/:x; ' U4 R" | f- [) m+ Z3 L/ O
player2/1..3/:y; 7 {7 s0 G9 I8 z6 J$ Y' c) p! Agame(player1,player2):c; ) t) F6 f. \5 ~/ x" s7 \endsets 5 W' t% x! V7 a; Y) i9 Z5 p0 `) a
data: ; ~7 J, G' N" U: G o3 L" N- ]8 j* Q N
ctrl=?; !ctrl取1求局中人1的策略,ctrl取0求局中人2的策略; 0 v" d* a& u; B: o" ~% _c=0.3333333 0.5 -0.3333333 0 E- H: l0 i; A9 e( U7 ]6 V4 Z7 d7 q" D-0.4 0.2 -0.5 ; @' \( d; p" |6 [2 `! y( O
0.5 -0.6 0.3333333; ) B4 s4 g: u6 s3 u4 f: s
enddata 7 o, P3 m& P$ ^ X3 I. L; amax=u*ctrl-v*(1-ctrl); 8 b, A; v9 z H# X$ @6 Q@free(u);@free(v); * h+ d. r+ U2 }- }
@for(player2(j)sum(player1(i):c(i,j)*x(i))>u); 8 ^) P3 K4 c8 t u@for(player1(i)sum(player2(j):c(i,j)*y(j))<v); ' }) N; B- [. {- j
@sum(player1:x)=1; % r3 ~# s* p( ^9 Y9 M# P, a@sum(player2:y)=1; 9 E/ j7 k# |- @( {% Eend 1 Q) E% o* G# l: C, B$ h; [/ r 5 Y. V( w0 c' N+ h9 a+ j( R由定理4知,混合对策问题的求解问题可以转化为求不等式约束的可行点,而 LINGO软件很容易做到这一点。我们编写如下Lingo程序求解上述问题。 3 S2 H* y. K4 h( Y8 i) n5 v: I' K2 j' T4 ]) X
model: ( s% w+ h( B- H. a, Msets: 6 H+ U/ h; H; q+ g- N5 gplayer1/1..3/:x; - w7 T& o$ T* i* J! i; A: e! w
player2/1..3/:y; 6 |5 N- X4 L3 s/ D
game(player1,player2):c; 0 U K- k. W; u% R3 ?
endsets / V5 l$ Y# W. {2 Z$ d
data: * T9 d, s, M0 q1 ^& m) I/ E* V: ^c=0.3333333 0.5 -0.3333333 & z4 I8 ?9 i) H. g, f
-0.4 0.2 -0.5 ! C) f5 A) p2 b% c ]8 N3 S2 c 0.5 -0.6 0.3333333; + K' e& E1 J$ r/ N. R( ~& ]enddata & q, p" U W7 C8 l9 e
@free(u); 5 k+ _' G( [' D6 J0 J5 j8 D/ d+ tu=@sum(game(i,j):c(i,j)*x(i)*y(j)); - H7 c' S$ w: b/ M1 o' g
@for(player1(i)sum(player2(j):c(i,j)*y(j))<u); @for(player2(j)sum(player1(i):c(i,j)*x(i))>u); ; d3 c# H5 t" q" r0 Q5 x
@sum(player1:x)=1; : g* u9 X! X, q K, { ?@sum(player2:y)=1; ! d5 \6 Y+ w5 l. o' Aend # T+ ]: \! h( D W3 C" G# c4 @% P+ T) G# p9 z3 U$ @
5 二人非常数和对策 ; _' D; b- N8 k: x5 L! H5.1 常数和对策 8 K( b2 H! o2 r3 s' {所谓常数和对策是指局中人I和局中人II所赢得的值之和为一个常数。显然,二人零和对策是二人常数和对策的特例,即常数为零。 对于二人常数和对策,有纯策略对策和混合策略对策,其求解方法与二人零和对策是相同的。 二人非常数和对策也称为双矩阵对策。也有纯策略对策和混合策略对策两种策略。9 I2 C& G6 f# `- U N. x* B