|
最优控制建模 现实生活中很多现象可以表达为求泛函的极大与极小值问题,我们称之为泛函极值问题。其求解方法通常有三种:古典变分法,动态规划方法,最大值原理--------它们都属于最优控制的范畴。关于最优控制的近似计算方法用得较多的有:无约束最优控制问题的梯度方法(或者最速下降方法),Newton方法,以及有约束最优控制问题的罚函数方法.读者可参考有关文献.另外,需要指出来的是最优控制的近似计算方法远较有限维非线性规划问题的计算方法复杂。迄今为止,最优控制的计算方法的研究,在深度和广度方面都远不如非线性规划的最优化计算方法的研究,一些最优控制的计算方法,如最优控制的罚函数方法,其收敛速度等问题都还未解决. 我在这要介绍的是古典变分法方法(不准备介绍近代变分方法). 变分法简介 作为数学的一个分支,变分法的诞生,是现实世界许多现象不断探索的结果,人们可以追寻到这样一个轨迹: 约翰·伯努利(Johann Bernoulli,1667-1748)1696年向全欧洲数学家挑战,提出一个难题:“设在垂直平面内有任意两点,一个质点受地心引力的作用,自较高点下滑至较低点,不计摩擦,问沿着什么曲线下滑,时间最短?”; A% _. @0 u, V b- M4 V) n7 c
这就是著名的“最速降线”问题(The Brachistochrone Problem)。它的难处在于和普通的极大极小值求法不同,它是要求出一个未知函 数(曲线),来满足所给的条件。这问题的新颖和别出心裁引起了很大兴趣,罗比塔(Guillaume Francois Antonie de l'Hospital 1661-1704)、雅可比·伯努利(Jacob Bernoulli 1654-1705)、莱布尼茨(Gottfried Wilhelm Leibniz,1646-1716)和牛顿(Isaac Newton1642—1727)都得到了解答。约翰的解法比较漂亮,而雅可布的解法虽然麻烦与费劲,却更一般化。后来欧拉(Euler Lonhard,1707~1783)和拉格朗日(Lagrange, Joseph Louis,1736-1813)发明了这一类问题的普遍解法,从而确立了数学的新分支—-变分学。 有趣的是,在1690年约翰·伯努利的哥哥雅可比·伯努利曾提出著名的悬链线问题(The Hanging Chain Problem)向数学界征求答案,即,固定项链的两端,在重力场中让它自然垂下,问项链的曲线方程是什么。在大自然中,除了悬垂的项链外,我们还可以观察到吊桥上方的悬垂钢索,挂着水珠的蜘蛛网,以及两根电线杆之间所架设的电线,这些都是悬链线(catenary)。 伽利略(Galileo, 1564~1643)比贝努利更早注意到悬链线,他猜测悬链线是抛物线,从外表看的确象,但实际上不是。惠更斯(Huygens, 1629~1695)在1646年(当时17岁),经由物理的论证,得知伽利略的猜测不对,但那时,他也求不出答案。到1691年,也就是雅可比·伯努利提出悬链线问题的第二年,莱布尼兹、惠更斯(以62岁)与约翰·伯努利各自得到了正确答案,所用方法是诞生不久的微积分,具体说是把问题转化为求解一个二阶常微分方程 解此方程并适当选取参数,得 (1) 即为悬链线。 悬链线问题本身和变分法并没有关系,然而这和最速降线问题一样都是贝努利兄弟间的相互争强好胜、不断争吵的导火索,虽然雅可比·贝努利在解决悬链线问题时略占下风,但他随后所证明的“悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的重心最低,具有最小势能”,算是扳回了一局,俩兄弟扯平了!之所以提到悬链线问题,有两方面考虑,其一,这是有关数学史上著名的贝努利家族内的一个趣闻,而这是一个在变分法乃至整个数学物理领域有着巨大贡献的家族,其二,有关悬链线的得几个结论,可以用变分法来证明! 1.1) t0 ]8 a C8 |; d/ G1 a
变分法的基本概念 1.1.18 A' J( y5 J' _4 v' u
泛函的概念 设 为一函数集合,若对于每一个函数 有一个实数 与之对应,则称 是定义在 上的泛函,记作 。 称为 的容许函数集。 例如,在 上光滑曲线y(x)的长度可定义为 (2) 考虑几个具体曲线,取 , 若 ,则 若y(x)为悬链线,则 对应 中不同的函数y(x),有不同曲线长度值J,即J依赖于y(x),是定义在函数集合 上的一个泛函,此时我们可以写成 我们称如下形式的泛函为最简泛函 (3) 被积函数 包含自变量 ,未知函数 (t)及导数 (t)。上述曲线长度泛函即为一最简泛函。 1.1.2+ i: h3 U9 I0 Q% e1 Y2 c
泛函极值问题 考虑上述曲线长度泛函,我们可以提出下面问题: 在所有连接定点 的平面曲线中,试求长度最小的曲线。即,求 ,使 : R* p: K3 P1 X3 ^' I: O( p0 [
取最小值。此即为泛函极值问题的一个例子。以极小值为例,一般的泛函极值问题可表述为, 称泛函 在 取得极小值,如果对于任意一个与 接近的 ,都有 。所谓接近,可以用距离 来度量,而距离可以定义为 泛函的极大值可以类似地定义。其中 称为泛函的极值函数或极值曲线。 1.1.3
5 R) Z [1 U7 R. x& l2 z泛函的变分 如同函数的微分是增量的线性主部一样,泛函的变分是泛函增量的线性主部。作为泛函的自变量,函数 在 的增量记为 也称函数的变分。由它引起的泛函的增量记作 如果 可以表为 其中 为 的线性项,而 是 的高阶项,则称 为泛函在 的变分,记作 。用变动的 代替 ,就有 。 泛函变分的一个重要形式是它可以表为对参数 的导数:4 e/ l9 U O! e& C v6 G
( e* c6 E5 Q4 R5 Y4 k x8 G3 x
(4) 这是因为当变分存在时,增量
3 N; i3 E% ]; ? Z6 ^
4 G& Y" ~ B0 F% W- @& ~
根据 和 的性质有 : J! c+ |; v7 \' j. I
所以 1.25 u$ ?6 E0 H1 F. |% E: A* v; a
泛函极值的相关结论 1.2.16 q% X8 t' T% ^& c' v
泛函极值的变分表示 利用变分的表达式(4),可以得到有关泛函极值的重要结论。 泛函极值的变分表示:若 在 达到极值(极大或极小),则
6 X1 P4 e( w( x. z# g
& ^# \& B g0 {9 b(5) 证明:对任意给定的 , 是变量 的函数,该函数在 处达到极值。根据函数极值的必要条件知 再由(4)式,便可得到(5)式。 变分法的基本引理:若 ,对于 , ,有 ,则 。 证明略。 1.2.23 b' n8 L/ |/ h/ N, t T
泛函极值的必要条件 考虑最简泛函(3),其中F具有二阶连续偏导数,容许函数类S取为满足端点条件为固定端点(6)的二阶可微函数。
1 h. y/ f* `( r& Q% i,
5 E2 Y [" Y7 a! U% s- ~& _( y8 A(6)
泛函极值的必要条件:设泛函(3)在x(t)∈S取得极值,则x(t)满足欧拉方程 (7) 欧拉方程推导:首先计算(3)式的变分: 9 F9 c* l4 T; D3 R4 M
0 z% G% O/ e" k
% O+ z+ A. ~4 F) ?' |% }/ L8 u
对上式右端第二项做分布积分,并利用 ,有 , 所以 利用泛函极值的变分表示,得
1 T, a# G- [' I/ E
7 t# N7 y. B2 [3 G
因为 的任意性,及 ,由基本引理,即得(7)。 (7)式也可写成 (8) 通常这是关于x(t)的二阶微分方程,通解中的任意常数由端点条件(6)确定。 1.2.3
, M8 Q) w E$ H) x% l" W9 K几种特殊形式最简泛函的欧拉方程 (i) 不依赖于 ,即 这时 ,欧拉方程为 ,这个方程以隐函数形式给出 ,但它一般不满足边界条件,因此,变分问题无解。 (ii) 不依赖 ,即 欧拉方程为
2 U3 Y# k' l, x5 ?. K5 K. M0 M7 A# D1 ]4 W; h1 N- f$ I" r
将上式积分一次,便得首次积分 ,由此可求出 ,积分后得到可能的极值曲线族
/ I2 V. w( K' M% W" w
(iii) 只依赖于 ,即 这时 ,欧拉方程为 由此可设 或 ,如果 ,则得到含有两个参数的直线族 。另外若 有一个或几个实根时,则除了上面的直线族外,又得到含有一个参数 的直线族 ,它包含于上面含有两个参数的直线族 , p2 u6 t6 T2 `2 p4 j# ~" M
中,于是,在 情况下,极值曲线必然是直线族。 (iv)
& z4 C, Y5 {" s1 q; x# E B9 O只依赖于 和 ,即 这时有 ,故欧拉方程为 此方程具有首次积分为 事实上,注意到 不依赖于 ,于是有 。 1.
( ]! F' f. p2 k! i4 j' {3 几个经典的例子 1.3.1 最速降线问题- C8 \7 _! ?" H1 _
最速降线问题 设 和 是铅直平面上不在同一铅直线上的两点,在所有连结 和 的平面曲线中,求一曲线,使质点仅受重力作用,初速度为零时,沿此曲线从 滑行至 的时间最短。 解 将A点取为坐标原点,B点取为B(x1,y1),如图1。根据能量守恒定律,质点在曲线 上任一点处的速度 满足( 为弧长) A(0, 0) : q, V8 n2 I: ]7 T
x , s/ |( X$ _3 D
( j5 C, s8 r" I( Q/ q' S. b, k8 v% \- I) R) b4 l s
3 b6 i3 x0 ?+ N) e1 l
y# j9 J+ `) B7 R& Y9 I$ J' r5 j
B(x1,y1)
+ B! O; [/ G9 X" b% K+ n# d; @' N" {: h# n1 V1 s
. _# i ~- [3 G% N% Q: Z
图1最速降线问题 将 代入上式得 + L" u7 s$ A8 r7 i
于是质点滑行时间应表为 的泛函 端点条件为 最速降线满足欧拉方程, 由于 3 v( \$ i, e' D! H% J `: c
不含自变量 ,所以方程(8)可写作 等价于 作一次积分得
/ r2 \% i }) R ?
令 则方程化为 又因 积分之,得 由边界条件 ,可知 ,故得 这是摆线(园滚线)的参数方程,其中常数 可利用另一边界条件 来确定。 1.3.2 最小旋转面问题 最小旋转面问题 对于 平面上过定点 和 的每一条光滑曲线 ,绕 轴旋转得一旋转体。旋转体的侧面积是曲线 的泛函 ,易得 容许函数集可表示为 解 因 不包含 ,故有首次积分 化简得0 N) q( k- ]/ v- H& l$ V2 |8 {
令 ,代入上式, 由于4 {+ a% m2 h0 l5 S
积分之,得 消去 ,就得到 - T/ a% r+ S R7 j0 ^6 W/ {
。 这是悬链线方程,适当选择条件(令该悬链线过(0,1/a)点,且该点处的切线是水平的)就可得到(1)。本例说明,对于平面上过两个定点的所有光滑曲线,其中绕 轴旋转所得旋转体的侧面积最小的是悬链线! 1.3.3 悬链线势能最小 1691年,雅可比·伯努利证明:悬挂于两个固定点之间的同一条项链,在所有可能的形状中,以悬链线的重心最低,具有最小势能。下面我们用变分法证明之。 考虑通过A、B两点的各种等长曲线。令曲线y=f(x)的长度为L,重心坐标为 ,则 由重心公式有 4 A' ?( w" Y# j
,- p' k/ o1 t' U, @/ R
由于只需探讨曲线重心的高低,所以只对纵坐标的公式进行分析,注意到问题的表述,说明L是常数,不难看出重心的纵坐标是y(x)的最简泛函,记作 此时对应的欧拉方程(8)可化为 令 解得 ,进而得 。 此即为悬链线,它使重心最低,势能最小!大自然中的许多结构是符合最小势能的,人们称之为最小势能原理。 1.4 泛函极值问题的补充 1.4.1 泛函极值的几个简单推广 (ⅰ)含多个函数的泛函 使泛函 取极值且满足固定边界条件 的极值曲线 必满足欧拉方程组 (ii)含高阶导数的泛函 使泛函 ! n5 @: u7 b+ J5 Q
取极值且满足固定边界条件 0 g- q5 Y' G+ Y! R
, W" a+ f: @2 R# T2 O, ~) @9 ]$ o2 q5 U
的极值曲线 必满足微分方程 ; m9 Q3 B/ p. z2 _8 N+ ]
(iii) 含多元函数的泛函 设 ,使泛函 # \% H- S) s4 r; v t8 `$ F
取极值且在区域 的边界线 上取已知值的极值函数 必满足方程
1 m, P5 w, [0 y
上式称为奥式方程。 1.4.2端点变动的情况(横截条件) 设容许曲线 在 固定,在另一端点 时不固定,是沿着给定的曲线 上变动。于是端点条件表示为 0 o5 D# s/ f( c8 B, c6 G' C
这里 是变动的,不妨用参数形式表示为
9 I. ^3 k! K- Z
寻找端点变动情况的泛函极值必要条件,可仿照前面端点固定情况进行推导,即有
# g% S" q* I- S4 k5 _* ?5 m, F 0 W* @# r3 t& i) P% x
( {; ] V4 u4 n% Y2 [% K* q(9)
再对(9)式做如下分析: (i)对每一个固定的 , 都满足欧拉方程,即(9)式右端的第一项积分为零; (ii)为考察(9)式的第二、第三项,建立 与 之间的关系,因为
- O B% R0 [; }' m) }
对 求导并令 得 ; E& l) I8 w+ |. N
即 (10) 把(10)代入(9)并利用 的任意性,得 (11) (11)式就是确定欧拉方程通解中另一常数的定解条件,称为横截条件。 横截条件有两种常见的特殊情况: (i)当 是垂直横轴的直线时, 固定, 自由,并称 为自由端点。此时(9)式中 及 的任意性,便得自由端点的横截条件
! D) G; `' Z) v4 B
# d) a: p% I) k. c! ]. j. m(12)
(ii)当 是平行横轴的直线时, 自由, 固定,并称 为平动端点。此时 ,(11)式的横截条件变为0 m8 [) H: S: V
" B* A% R& X+ K' i
( P' M8 L2 V! B: _7 X* `5 Y+ E0 L2 M% J! R9 k0 t
(13) 注意,横截条件与欧拉方程联立才能构成泛函极值的必要条件。 1.4.3 有约束条件的泛函极值 在最优控制系统中,常常要涉及到有约束条件泛函的极值问题,其典型形式是对动态系统 (14) 寻求最优性能指标(目标函数) (15) 其中 是控制策略, 是轨线, 固定, 及 自由, , (不受限,充满 空间), 连续可微。 下面推导取得目标函数极值的最优控制策略 和最优轨线 的必要条件。 采用拉格朗日乘子法,化条件极值为无条件极值,即考虑
A; a0 a- }" n2 G* j" i(16) 的无条件极值,首先定义(14)式和(15)式的哈密顿(Hamilton)函数为 (17) 将其代入(16)式,得到泛函 2 b! U% o3 b( K3 L, ^) j
/ l4 L6 v, e. |0 w0 u. r
(18) 下面先对其求变分
7 K2 Z; ]/ ^* t( l
7 k( g" E8 D# E( {( i
注意到 , ,因而 : j5 _. E! N2 {% j( m5 C
再令 ,由 的任意性,便得 (i) 必满足正则方程: ① 状态方程
- g$ U& r5 q. a( i7 r2 c6 [ ② 协态方程# R! A9 n7 o9 E9 [6 \9 z7 C
。 (ii)哈密顿函数 作为 的函数,也必满足
; i& y X4 W$ Q) T7 Z
并由此方程求得 。 (iii)求 时,必利用边界条件 ① , (用于确定 ) ② , (用于确定 ) ③ , (确定 ) 1.4.4 最大(小)值原理 如果受控系统
0 a4 J. r; y$ A' t& [,
其控制策略 的全体构成有界集 ,求 ,使性能指标 5 `% D; C* [6 r: b0 |
达到最大(小)值。 最大(小)值原理:如果 , 和 都是连续可微的,那么最优控制策略 和相应的最优轨线 由下列的必要条件决定: (i)最优轨线 ,协态向量 由下列的必要条件决定:
2 z5 j j+ V/ F/ S) n
p3 i: b! a0 q! Z# Q; Z0 ` , ,
, z& ]. D) C3 Z$ M& U
(ii)哈密顿函数
1 w0 ^: r) M& B) G+ A
作为 的函数,最优策略 必须使 1 m0 U0 ]+ D1 q" g
或使
; X0 I' ^: }* G6 N(最小值原理)
(iii)满足相应的边界条件 ① 若两端点固定,则正则方程的边界条件为 ( q" l0 G' K1 H- `, N) x
, 。 ② 若始端固定,终端 也固定,而 自由,则正则方程的边界条件为
; a1 q- I5 F2 P/ v- l8 y, 。
③ 若始端固定,终端 都自由,则正则方程的边界条件为
- K1 V6 `' i0 X! ], ,
。 |