6 x% v1 _0 J- ]- ~( `2.1.1 阶段( u, @ g3 M* N3 e( H4 o
阶段(step)是对整个过程的自然划分。通常根据时间顺序或空间顺序特征来划分阶段,以便按阶段的次序解优化问题。阶段变量一般用k = 1,2,...,n 表示。, s7 G) c ]5 G7 |' W2 Q
( l. W# L0 E, n4 _; U在例 1 中由 A 出发为 k = 1,由 (i = 1,2) 出发为 k = 2 ,依此下去从 (i = 1,2) 出发为 k = 6 ,共 n = 6个阶段。在例 2 中按照第一、二、三、四季度分为k = 1,2,3,4,共四个阶段。) D, M9 `: i1 A, p
: E9 O9 K, N( k4 ^; G v F- ^2.1.2 状态3 v$ @ g. ~9 u C1 b0 U
状态(state)表示每个阶段开始时过程所处的自然状况。它应能描述过程的特征并 且无后效性,即当某阶段的状态变量给定时,这个阶段以后过程的演变与该阶段以前各 阶段的状态无关。通常还要求状态是直接或间接可以观测的。 + r0 X* v/ ?2 o+ M, ?5 ^ 6 W: [- I1 @/ h! a7 o8 H ) O9 @# E6 F6 F3 u : q: j$ r, X5 Y% _$ B ` 根据过程演变的具体情况,状态变量可以是离散的或连续的。为了计算的方便有时 将连续变量离散化;为了分析的方便有时又将离散变量视为连续的。 状态变量简称为状态。 4 K" m' X% p V, g% D & m% A2 A; s; n5 |* ]& v2.1.3 决策 ) Q- }* f& r. n1 i/ |! l6 _& A当一个阶段的状态确定后,可以作出各种选择从而演变到下一阶段的某个状态,这 种选择手段称为决策(decision),在最优控制问题中也称为控制(control)。 3 A* K1 U: Q) U * R: H8 q1 f. @8 a# ^; b' y' W; c3 i: [* l2 s
2 x( T7 B' [6 ]2 S% o5 t* V
决策变量简称决策。 ' X7 ~$ S/ G0 l. B# l q ! m& T$ Z# ]* V" b2.1.4 策略 @0 a5 s% l8 H6 |* |$ H
: ~& r) [/ R1 Z7 K6 l / J* @; F, d6 R3 V! u; ]/ x% E0 T% a
. F- m ]; b! I( ]+ K" y& l# B, {! N+ H4 B
# D& Z& R1 K1 `' d
) X1 O$ k9 C5 Q2 c
2.1.5. 状态转移方程* L/ M+ y9 G% O* d$ D/ z/ S
在确定性过程中,一旦某阶段的状态和决策为已知,下阶段的状态便完全确定。用 状态转移方程(equation of state transition)表示这种演变规律,写作 ) {5 }# g9 N. Q5 h1 ]: T$ {3 v7 K1 I$ T7 ` n - s# N! n4 ^) F- Z! U# c$ h9 |/ ?# Y- u
2.1.6. 指标函数和最优值函数 7 }) ]2 v; _4 L3 n$ n6 Z8 @ ! V5 u0 G; U: ~8 w 5 U$ x* c$ I) P! j : H h+ [2 ^% L; H2.1.7 最优策略和最优轨线; e: ]8 H% q6 O# A" M& O
# y2 e4 b7 d. R0 V4 _. N y- l! Y7 z, B( L& T2 h
9 u( `: T- _ J+ W5 ~- t/ R
2.1.8 递归方程% Q& U) K' b, p8 r2 S
" i( n. L' w5 r9 x' ](ii)可以得到一族最优解。与非线性规划只能得到全过程的一个最优解不同,动 态规划得到的是全过程及所有后部子过程的各个状态的一族最优解。有些实际问题需要 这样的解族,即使不需要,它们在分析最优策略和最优值对于状态的稳定性时也是很有 用的。当最优策略由于某些原因不能实现时,这样的解族可以用来寻找次优策略。 * C) X% R: j$ g) ^! e+ Z 9 i/ F! o/ W% _. N0 Q, ^) k# T8 g(iii)能够利用经验提高求解效率。如果实际问题本身就是动态的,由于动态规划 方法反映了过程逐段演变的前后联系和动态特征,在计算中可以利用实际知识和经验提 高求解效率。如在策略迭代法中,实际经验能够帮助选择较好的初始策略,提高收敛速 度。' n2 k: m, P. }9 h) p* [; p C
, T9 }2 w* i' t2 t" q动态规划的主要缺点是: ( t6 ]7 p5 B. d: [ 3 V, B7 V' H: ^2 U(i)没有统一的标准模型,也没有构造模型的通用方法,甚至还没有判断一个问 题能否构造动态规划模型的准则。这样就只能对每类问题进行具体分析,构造具体的模 型。对于较复杂的问题在选择状态、决策、确定状态转移规律等方面需要丰富的想象力 和灵活的技巧性,这就带来了应用上的局限性。6 U- w. V9 U$ {1 w$ a% Z4 y
' [7 a" y! g$ y
(ii)用数值方法求解时存在维数灾(curse of dimensionality)。若一维状态变量有m 个取值,那么对于n 维问题,状态 就有 个值,对于每个状态值都要计算、存储函 数 ,对于n 稍大的实际问题的计算往往是不现实的。目前还没有克服维数灾的 有效的一般方法。 0 H+ ?6 a% z' t* s: B1 ]& l+ T' B( M/ ?
§5 若干典型问题的动态规划模型9 o& p' K* g% b
5.1 最短路线问题 . H' O) H2 Y* Y1 F) Z' _+ y: s+ M0 D1 o, s+ b! Y7 Y1 q! v) ] 5 A' q+ \# s& T. j4 A) _9 \
! X, o$ K' y- d: P7 J; j4 w5.2 生产计划问题 $ D8 J/ X. ~8 W+ m- _9 ^( Z . f5 m$ o6 B" B! Y" S ' k7 x) H, t" J6 T6 i8 O6 j! l( h% J. K9 z$ D: J8 Y / t( m8 O9 a) X5 n+ G% a3 f$ g" ]- Q
) g% S( _% \5 s) l