- 在线时间
- 60 小时
- 最后登录
- 2017-2-18
- 注册时间
- 2011-5-31
- 听众数
- 5
- 收听数
- 0
- 能力
- 0 分
- 体力
- 807 点
- 威望
- 0 点
- 阅读权限
- 30
- 积分
- 288
- 相册
- 0
- 日志
- 0
- 记录
- 0
- 帖子
- 136
- 主题
- 8
- 精华
- 0
- 分享
- 0
- 好友
- 4
升级   94% TA的每日心情 | 怒 2012-2-25 00:11 |
|---|
签到天数: 95 天 [LV.6]常住居民II
 |
一. 爬山算法 ( Hill Climbing )7 O) P0 {, d! s% ^5 c ?
9 X* l3 {- j' K
介绍模拟退火前,先介绍爬山算法。爬山算法是一种简单的贪心搜索算法,该算法每次从当前解的临近解空间中选择一个最优解作为当前解,直到达到一个局部最优解。
7 V& W1 i5 {' q# J: t1 a* ?& H8 z) ]4 k
爬山算法实现很简单,其主要缺点是会陷入局部最优解,而不一定能搜索到全局最优解。如图1所示:假设C点为当前解,爬山算法搜索到A点这个局部最优解就会停止搜索,因为在A点无论向那个方向小幅度移动都不能得到更优的解。" b- }5 x+ H" N' n
![]()
$ q+ e4 U# y" J; Y* I/ x7 E7 ~9 S y+ Z- }9 a& o
二. 模拟退火(SA,Simulated Annealing)思想2 s3 ^2 O% n+ `! n9 \- y
8 G& n! Q; r6 u
爬山法是完完全全的贪心法,每次都鼠目寸光的选择一个当前最优解,因此只能搜索到局部的最优值。模拟退火其实也是一种贪心算法,但是它的搜索过程引入了随机因素。模拟退火算法以一定的概率来接受一个比当前解要差的解,因此有可能会跳出这个局部的最优解,达到全局的最优解。以图1为例,模拟退火算法在搜索到局部最优解A后,会以一定的概率接受到E的移动。也许经过几次这样的不是局部最优的移动后会到达D点,于是就跳出了局部最大值A。
. U A3 B& G- ~- z6 j. |# U! \$ Q
模拟退火算法描述:
& |: z0 n% c* [! v" W
% T# o* |9 [1 @5 n- G 若J( Y(i+1) )>= J( Y(i) ) (即移动后得到更优解),则总是接受该移动$ s& e8 `, V/ j# Z1 Q$ R
: R0 v& p8 x. i9 P8 ^ 若J( Y(i+1) )< J( Y(i) ) (即移动后的解比当前解要差),则以一定的概率接受移动,而且这个概率随着时间推移逐渐降低(逐渐降低才能趋向稳定)
: K. {" c& K8 E8 w9 _
+ J+ X* J; O) |( D' d 这里的“一定的概率”的计算参考了金属冶炼的退火过程,这也是模拟退火算法名称的由来。
' _( X; Q: m0 ~# F! T$ H) i4 Q! S- S- W6 m J: M% b1 u
根据热力学的原理,在温度为T时,出现能量差为dE的降温的概率为P(dE),表示为:
" v9 ], x5 k: n% {* q' u& @) V, Y+ M# i4 B4 o7 j# a
P(dE) = exp( dE/(kT) )
" C* H3 P. l, ~7 s' x% T+ f
+ X$ W7 d. C3 G+ k 其中k是一个常数,exp表示自然指数,且dE<0。这条公式说白了就是:温度越高,出现一次能量差为dE的降温的概率就越大;温度越低,则出现降温的概率就越小。又由于dE总是小于0(否则就不叫退火了),因此dE/kT < 0 ,所以P(dE)的函数取值范围是(0,1) 。/ c# `: N0 q2 q) f& W6 c1 R
- s; F* y0 Y% c5 a: p 随着温度T的降低,P(dE)会逐渐降低。
- o# \, t/ D0 Y6 B: v* V' X! D& a1 Q
我们将一次向较差解的移动看做一次温度跳变过程,我们以概率P(dE)来接受这样的移动。
d% M4 ^* A5 R; B7 `
4 s. z F+ g8 l7 F 关于爬山算法与模拟退火,有一个有趣的比喻:
; Z3 ~' l, V3 n2 b }, M* ?
, ]- O$ e; H: A 爬山算法:兔子朝着比现在高的地方跳去。它找到了不远处的最高山峰。但是这座山不一定是珠穆朗玛峰。这就是爬山算法,它不能保证局部最优值就是全局最优值。
! G, J% t t# |1 @7 w+ \1 z( W* f8 I: [$ U6 d: f0 O
模拟退火:兔子喝醉了。它随机地跳了很长时间。这期间,它可能走向高处,也可能踏入平地。但是,它渐渐清醒了并朝最高方向跳去。这就是模拟退火。 |
zan
|