5 X5 t6 D5 x3 q
* x8 a" ?' {5 V0 T: Q
遗传算法6 m! r$ n; Z% i% I4 f0 F/ e( P) Z% f- b
遗传算法(Genetic Algorithm, GA)是近几年发展起来的一种崭新的全局优化算法。1962年霍兰德(Holland)教授首次提出了GA算法的思想,它借用了仿真生物遗传学和自然选择机理,通过自然选择、遗传、变异等作用机制,实现各个个体的适应性的提高。从某种程度上说遗传算法是对生物进化过程进行的数学方式仿真。 & K `4 b% I4 ^6 Z这一点体现了自然界中"物竞天择、适者生存"进化过程。与自然界相似,遗传算法对求解问题的本身一无所知,它所需要的仅是对算法所产生的每个染色体进行评价,把问题的解表示成染色体,并基于适应值来选择染色体,使适应性好的染色体有更多的繁殖机会。在算法中也即是以二进制编码的串。并且,在执行遗传算法之前,给出一群染色体,也即是假设解。然后,把这些假设解置于问题的“环境”中,也即一个适应度函数中来评价。并按适者生存的原则,从中选择出较适应环境的染色体进行复制, 淘汰低适应度的个体,再通过交叉,变异过程产生更适应环境的新一代染色体群。对这个新种群进行下一轮进化,至到最适合环境的值。& f6 ]# G2 k8 {
遗传算法已用于求解带有应用前景的一些问题,例如遗传程序设计、函数优化、排序问题、人工神经网络、分类系统、计算机图像处理和机器人运动规划等。 r5 O5 ?6 u8 g3 I* b3 f0 \, n; A 术语说明6 u' n, P. l1 v* b/ }& w/ T$ F
由于遗传算法是由进化论和遗传学机理而产生的搜索算法,所以在这个算法中会用到很多生物遗传学知识,下面是我们将会用来的一些术语说明:/ i, ^( k2 _7 l8 w, ~; J6 i 一、染色体(Chronmosome)# @0 L1 A. h' a' F: L/ g
染色体又可以叫做基因型个体(individuals),一定数量的个体组成了群体(population),群体中个体的数量叫做群体大小。# A" F' L/ C) a0 i, }* _ 二、基因(Gene)/ O% z* a9 J$ t! u
基因是串中的元素,基因用于表示个体的特征。例如有一个串S=1011,则其中的1,0,1,1这4个元素分别称为基因。它们的值称为等位基因(Alletes)。 / g8 ~9 Z- B3 O% U三、基因地点(Locus) 1 H) P* R' k K4 F) E7 B0 P基因地点在算法中表示一个基因在串中的位置称为基因位置(Gene Position),有时也简称基因位。基因位置由串的左向右计算,例如在串 S=1101 中,0的基因位置是3。% j9 n" P N8 \( b! d9 o 四、基因特征值(Gene Feature) 5 Z: V8 u; E! @% W9 \3 P) O在用串表示整数时,基因的特征值与二进制数的权一致;例如在串 S=1011 中,基因位置3中的1,它的基因特征值为2;基因位置1中的1,它的基因特征值为8。! C3 `4 A" u" Y4 T- | 五、适应度(Fitness)# ~9 D- T9 H; Z2 L5 G
各个个体对环境的适应程度叫做适应度(fitness)。为了体现染色体的适应能力,引入了对问题中的每一个染色体都能进行度量的函数,叫适应度函数. 这个函数是计算个体在群体中被使用的概率。 * n, k+ @2 ?" G! {. Q' `+ A9 o操作算法7 x7 r4 O% k @0 W, h( _1 r
霍兰德(Holland)教授最初提出的算法也叫简单遗传算法,简单遗传算法的遗传操作主要有三种:选择(selection)、交叉(crossover)、变异(mutation)这也是遗传算法中最常用的三种算法:( f, V+ I3 ?. Y& |6 f5 }' c 1.选择(selection) 6 ]0 W2 v' h6 j3 B" `( x选择操作也叫复制操作,从群体中按个体的适应度函数值选择出较适应环境的个体。一般地说,选择将使适应度高的个体繁殖下一代的数目较多,而适应度较小的个体,繁殖下一代的数目较少,甚至被淘汰。最通常的实现方法是轮盘赌(roulette wheel)模型。令Σfi表示群体的适应度值之总和,fi表示种群中第i个染色体的适应度值,它被选择的概率正好为其适应度值所占份额fi/Σfi。如下图表中的数据适应值总和Σfi=6650,适应度为2200变选择的可能为fi/Σfi=2200/6650=0.394. 2 E3 w% P; l' [5 l' w6 b! L! D! S! D S$ E% S
[url=]图1. 轮盘赌模型[/url]% p2 V, W1 O8 i ! E4 K* l" Q7 D5 O% g
Fitness 值:
2200
1800
1200
950
400
100
选择概率:
3331
0.271
0.18
0.143
0.06
0.015
2.交叉(Crossover)4 u3 m/ Y7 B. @+ k! l/ u6 W% p1 O' Z; ~
交叉算子将被选中的两个个体的基因链按一定概率pc进行交叉,从而生成两个新的个体,交叉位置pc是随机的。其中Pc是一个系统参数。根据问题的不同,交叉又为了单点交叉算子(Single Point Crossover)、双点交叉算子(Two Point Crossover)、均匀交叉算子 (Uniform Crossover),在此我们只讨论单点交叉的情况。 / V. r8 m5 [( G0 C: W单点交叉操作的简单方式是将被选择出的两个个体S1和S2作为父母个体,将两者的部分基因码值进行交换。假设如下两个8位的个体:) v7 v4 Y9 J* H- U! m. X
S1 1000 1111 S2 1110 1100
d" F3 e) M2 p- M Z产生一个在1到7之间的随机数c,假如现在产生的是2,将S1和S2的低二位交换:S1的高六位与S2的低六位组成数串10001100,这就是S1和S2 的一个后代P1个体;S2的高六位与S1的低二位组成数串11101111,这就是S1和S2的一个后代P2个体。其交换过程如下图所示:4 a$ m4 ?( j- i( B' h% @
Crossover
11110000
Crossover
11110000
S1
1000 1111
S2
1110 1100
P1
1000 1100
P2
1110 1111
3.变异(Mutation)8 W" b L e; p0 {( h, J
这是在选中的个体中,将新个体的基因链的各位按概率pm进行异向转化,最简单方式是改变串上某个位置数值。对二进制编码来说将0与1互换:0变异为1,1变异为0。. H4 t1 l4 }1 C
如下8位二进制编码: & V G- Y# e# ~# T/ F4 A
1 1 1 0 1 1 0 0
1 i" ^! [5 c5 z) x随机产生一个1至8之间的数i,假如现在k=6,对从右往左的第6位进行变异操作,将原来的1变为0,得到如下串:; Z. f- \' |2 y6 g4 w7 h1 W2 w
1 1 0 0 1 1 0 0
4 z7 P0 D+ J3 u& x4 }8 U& z4 j; g* m. H3 L
整个交叉变异过程如下图:. |* S4 m3 L' d/ C3 s
8 |3 y0 O9 D7 I) c( Y0 f. v0 b[url=]图2. 交叉变异过程[/url] # O& `' {- ^" o1 S3 b% x/ u9 S5 Y- L, J0 u* z 1 C6 f/ M5 V" E7 N1 X g9 q; `4 `/ n 4.精英主义 (Elitism)0 {$ U- ?; e; Y- ?0 x
仅仅从产生的子代中选择基因去构造新的种群可能会丢失掉上一代种群中的很多信息。也就是说当利用交叉和变异产生新的一代时,我们有很大的可能把在某个中间步骤中得到的最优解丢失。在此我们使用精英主义(Elitism)方法,在每一次产生新的一代时,我们首先把当前最优解原封不动的复制到新的一代中,其他步骤不变。这样任何时刻产生的一个最优解都可以存活到遗传算法结束。 3 h& j& \; h; ~上述各种算子的实现是多种多样的,而且许多新的算子正在不断地提出,以改进GA某些性能。比如选择算法还有分级均衡选择等等。; _3 f) n0 ]8 n+ A; S 遗传算法的所需参数7 R, x/ V/ e8 y% p5 F" C
说简单点遗传算法就是遍历搜索空间或连接池,从中找出最优的解。搜索空间中全部都是个体,而群体为搜索空间的一个子集。并不是所有被选择了的染色体都要进行交叉操作和变异操作,而是以一定的概率进行,一般在程序设计中交叉发生的概率要比变异发生的概率选取得大若干个数量级。大部分遗传算法的步骤都很类似,常使用如下参数: - U& |; Z2 l3 a7 VFitness函数:见上文介绍。 h; u5 o( k/ S2 ?+ L$ G
Fitnessthreshold(适应度阀值):适合度中的设定的阀值,当最优个体的适应度达到给定的阀值,或者最优个体的适应度和群体适应度不再上升时(变化率为零),则算法的迭代过程收敛、算法结束。否则,用经过选择、交叉、变异所得到的新一代群体取代上一代群体,并返回到选择操作处继续循环执行。9 y, {# X; d0 ?/ u7 Y
P:种群的染色体总数叫种群规模,它对算法的效率有明显的影响,其长度等于它包含的个体数量。太小时难以求出最优解,太大则增长收敛时间导致程序运行时间长。对不同的问题可能有各自适合的种群规模,通常种群规模为 30 至 160。 4 v3 d0 c" Z# i5 Ypc:在循环中进行交叉操作所用到的概率。交叉概率(Pc)一般取0.6至0.95之间的值,Pc太小时难以向前搜索,太大则容易破坏高适应值的结构。- R, i( T; S8 r- y g
Pm:变异概率,从个体群中产生变异的概率,变异概率一般取0.01至0.03之间的值变异概率Pm太小时难以产生新的基因结构,太大使遗传算法成了单纯的随机搜索。 ! j; \5 }* O7 s1 U/ C) s7 c另一个系统参数是个体的长度,有定长和变长两种。它对算法的性能也有影响。由于GA是一个概率过程,所以每次迭代的情况是不一样的,系统参数不同,迭代情况也不同。 1 m9 T. P' D0 G9 T0 D0 p, s遗传步骤4 X. }& T* Z2 S; N
了解了上面的基本参数,下面我们来看看遗传算法的基本步骤。! T4 S. m: A2 Z! f
基本过程为: + E& E9 R% e5 G. h, w
程序的停止条件最简单的有如下二种:完成了预先给定的进化代数则停止;种群中的最优个体在连续若干代没有改进或平均适应度在连续若干代基本没有改进时停止。 4 R& Z1 x0 f! K0 ?0 O根据遗传算法思想可以画出如右图所示的简单遗传算法框图: % D" [% w/ `3 W j) x+ D7 Y # F5 r- B0 i( A& b0 W[url=]图3. 简单遗传算法框图[/url]. J/ f2 r4 x( d+ [3 b % V5 u- M! F7 r6 P! B2 C# F f
下面伪代码简单说明了遗传算法操作过程:' j, j; ~1 z% [: g; M. ]3 a
choose an intial population- L/ Q, p5 @- N, g- Y. s
For each h in population,compute Fitness(h) + f3 p. b6 ^4 y0 x/ z8 b' m5 ~% b) GWhile(max Fitness(h) < Fitnessthreshold) 2 q. S+ J( \" K' i8 Ddo selection/ x2 v) R0 I1 L* g( L$ C1 c
do crossover ; Q5 p3 v4 D7 R' c# f1 D5 e! K1 Ndo mutation 9 I3 r! P+ O! _: Q* X update population8 Y1 m& \( l& ]' v0 k
For each h in population,compute Fitness(h)# o$ Y3 z6 g/ n' e: ?
Return best Fitness7 H' e5 U) O$ Z3 S; P. |
: m4 M, B! _2 @/ E* b/ J
Robocode 说明 ) v* u7 S2 @! V能有效实现遗传算法的应用例子有很多,像西洋双陆棋、国际名模等等都是遗传程序设计学习的工具,但是 Robocode 有着其他几个无可比拟的优势: ( w% T( F, O B. b; N6 [4 i" G
Robocoe 是一个很容易使用的机器人战斗仿真器,您在此平台上创建自己的坦克机器人,并与其它开发者开发的机器人竞技。以得分排名的方式判定优胜者。每个 Robocode 参加者都要利用 Java 语言元素创建他或她的机器人,这样就使从初学者到高级黑客的广大开发者都可以参与这一娱乐活动。如果您对Robocode不是很了解,请参考 developerWorks 网站 Java 技术专区文章:“重锤痛击 Robocode”;/ }. W: m& n' D' a
在 Robocode 中其实有很多种遗传算法方法来实现进化机器人,从全世界的 Robocode 流派中也发展几种比较成熟的方法,比如预设策略遗传、自开发解释语言遗传、遗传移动我们就这几种方法分别加以介绍。由于遗传算法操作过程都类似,所以前面二部分都是一些方法的介绍和部分例子讲解,后面部分会给出使用了遗传算法的移动机器人人例子。在附录中,也提供了机器人仓库中有关遗传算法机器人的下载,大家可参考。 ' Q$ `& |+ s1 ? ~4 c8 I" u2 z9 ?" H& a1 P
/ L E, s% i/ F8 p
1 ?6 c" ^' Y) A* y! e
& B% O- X8 s; Y# q# R
4 K B) \2 P2 N/ d( B 7 p. F+ l4 l2 k% ?1 t预设策略进化机器人6 M. j2 R# n" w. s* m; |
Robocode 坦克机器人所有行为都离不开如移动、射击、扫描等基本操作。所以在此把这些基本操作所用到的策略分别进化如下编码:移动策略move-strategy (MS), 子弹能量bullet-power-strategy (BPS), 雷达扫描radar-strategy (RS), 和瞄准选择策略target- strategy (TS)。由于Robocode爱好者社群的发展,每一种基本操作都发展了很多比较成熟的策略,所有在此我们直接在下面预先定义的这些策略如下表: 6 W2 E6 Z }5 a6 S2 \0 _4 Y