- 在线时间
- 90 小时
- 最后登录
- 2024-2-6
- 注册时间
- 2010-8-20
- 听众数
- 9
- 收听数
- 1
- 能力
- 0 分
- 体力
- 27 点
- 威望
- 0 点
- 阅读权限
- 30
- 积分
- 168
- 相册
- 0
- 日志
- 1
- 记录
- 5
- 帖子
- 313
- 主题
- 4
- 精华
- 0
- 分享
- 0
- 好友
- 21
升级 34% TA的每日心情 | 开心 2022-2-6 16:55 |
---|
签到天数: 121 天 [LV.7]常住居民III
群组: 哈尔滨工业大学建模团 群组: 数学专业考研加油站 群组: 华南理工大学 群组: 计量经济学之性 群组: 华中科技大学 |
发表于 2010-10-18 21:11
|显示全部楼层
|
遗传算法的一般算法
! W* S3 V3 g9 I+ ?6 I# F( \ 遗传算法是基于生物学的,理解或编程都不太难。下面是遗传算法的一般算法:# w8 h- Z4 ~2 y* [ U9 ?
创建一个随机的初始状态
' A6 y9 T7 X9 U! U c& Y7 Y 初始种群是从解中随机选择出来的,将这些解比喻为染色体或基因,该种群被称为第一代,这和符号人工智能系统的情况不一样,在那里问题的初始状态已经给定了。8 g0 q) h3 Q) ^1 B7 d
评估适应度" S1 G: Q8 y4 f8 O% g
对每一个解(染色体)指定一个适应度的值,根据问题求解的实际接近程度来指定(以便逼近求解问题的答案)。不要把这些“解”与问题的“答案”混为一谈,可以把它理解成为要得到答案,系统可能需要利用的那些特性。 Z4 i6 f+ \7 W8 @4 u9 I4 M& s
繁殖
I5 x% S3 s8 o* [$ d" } 繁殖(包括子代突变) 带有较高适应度值的那些染色体更可能产生后代(后代产生后也将发生突变)。后代是父母的产物,他们由来自父母的基因结合而成,这个过程被称为“杂交”。4 M' o! {# }" \! v
下一代
- I' P3 Z! D9 \4 b2 g 如果新的一代包含一个解,能产生一个充分接近或等于期望答案的输出,那么问题就已经解决了。如果情况并非如此,新的一代将重复他们父母所进行的繁衍过程,一代一代演化下去,直到达到期望的解为止。
9 u1 J; g& a5 o0 r e( Q并行计算
; k' v6 P, N8 i* f* N) h 非常容易将遗传算法用到并行计算和群集环境中。一种方法是直接把每个节点当成一个并行的种群看待。然后有机体根据不同的繁殖方法从一个节点迁移到另一个节点。另一种方法是“农场主/劳工”体系结构,指定一个节点为“农场主”节点,负责选择有机体和分派适应度的值,另外的节点作为“劳工”节点,负责重新组合、变异和适应度函数的评估。# y/ q; V8 j9 G4 B2 z9 P5 X* b4 ~( s
编辑本段术语说明; e" Q( _7 y7 w5 s. Q
由于遗传算法是由进化论和遗传学机理而产生的搜索算法,所以在这个算法中会用到很多生物遗传学知识,下面是我们将会用来的一些术语说明:6 L9 N# r/ y9 H( ]2 ]$ E0 j; w
染色体(Chromosome)
r8 J9 I5 L( R4 `0 R 染色体又可以叫做基因型个体(individuals),一定数量的个体组成了群体(population),群体中个体的数量叫做群体大小。
0 Y+ {' e4 E6 X3 J基因(Gene)
d8 `( O! v- T' v* `2 ~0 A7 e 基因是串中的元素,基因用于表示个体的特征。例如有一个串S=1011,则其中的1,0,1,1这4个元素分别称为基因。它们的值称为等位基因(Alletes)。1 H' }+ c+ t) r) v6 L3 i. k
基因地点(Locus)/ G( P6 W' D _+ y: d% ~
基因地点在算法中表示一个基因在串中的位置称为基因位置(Gene Position),有时也简称基因位。基因位置由串的左向右计算,例如在串 S=1101 中,0的基因位置是3。9 O$ c7 U+ ~8 m7 X/ S, G/ _
基因特征值(Gene Feature)
4 L- h! t2 F1 d. L, i) E' J6 n7 { 在用串表示整数时,基因的特征值与二进制数的权一致;例如在串 S=1011 中,基因位置3中的1,它的基因特征值为2;基因位置1中的1,它的基因特征值为8。
. o* I/ W, z8 _8 d# P& ^) q适应度(Fitness)+ {; y# o3 ~5 u4 t' P8 _
各个个体对环境的适应程度叫做适应度(fitness)。为了体现染色体的适应能力,引入了对问题中的每一个染色体都能进行度量的函数,叫适应度函数. 这个函数是计算个体在群体中被使用的概率。- v4 M; L, ^: @7 e
编辑本段运算过程
9 k+ Z' I; z+ q- ` 遗传操作是模拟生物基因遗传的做法。在遗传算法中,通过编码组成初始群体后,遗传操作的任务就是对群体的个体按照它们对环境适应度(适应度评估)施加一定的操作,从而实现优胜劣汰的进化过程。从优化搜索的角度而言,遗传操作可使问题 遗传过程
3 ^: q# [; q& P. _3 C* [+ d的解,一代又一代地优化,并逼进最优解。 遗传操作包括以下三个基本遗传算子(genetic operator):选择(selection);交叉(crossover);变异(mutation)。这三个遗传算子有如下特点: 个体遗传算子的操作都是在随机扰动情况下进行的。因此,群体中个体向最优解迁移的规则是随机的。需要强调的是,这种随机化操作和传统的随机搜索方法是有区别的。遗传操作进行的高效有向的搜索而不是如一般随机搜索方法所进行的无向搜索。 遗传操作的效果和上述三个遗传算子所取的操作概率,编码方法,群体大小,初始群体以及适应度函数的设定密切相关。. H* x2 I+ @ ^0 d6 G4 S
选择
7 Q& g6 U) A5 ~! H; \ 从群体中选择优胜的个体,淘汰劣质个体的操作叫选择。选择算子有时又称为再生算子(reproduction operator)。选择的目的是把优化的个体(或解)直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的,目前常用的选择算子有以 遗传算法& u' g+ T, Z! u! S& b5 F
下几种:适应度比例方法、随机遍历抽样法、局部选择法、局部选择法。 其中轮盘赌选择法 (roulette wheel selection)是最简单也是最常用的选择方法。在该方法中,各个个体的选择概率和其适应度值成比例。设群体大小为n,其中个体i的适应度为,则i 被选择的概率,为遗传算法 显然,概率反映了个体i的适应度在整个群体的个体适应度总和中所占的比例.个体适应度越大。其被选择的概率就越高、反之亦然。计算出群体中各个个体的选择概率后,为了选择交配个体,需要进行多轮选择。每一轮产生一个[0,1]之间均匀随机数,将该随机数作为选择指针来确定被选个体。个体被选后,可随机地组成交配对,以供后面的交叉操作。
, X$ o& x2 o- b7 O" Y交叉3 e: E; i. T, h2 x! q, R
在自然界生物进化过程中起核心作用的是生物遗传基因的重组(加上变异)。同样,遗传算法中起核心作用的是遗传操作的交叉算子。所谓交叉是指把两个父代个体的部分结构加以替换重组而生成新个体的操作。通过交叉,遗传算法的搜索能力得以飞跃提高。 交叉算子根据交叉率将种群中的两个个体随机地交换某些基因,能够产生新的基因组合,期望将有益基因组合在一起。根据编码表示方法的不同,可以有以下的算法: a)实值重组(real valued recombination) 1)离散重组(discrete recombination); 2)中间重组(intermediate recombination); 3)线性重组(linear recombination); 4)扩展线性重组(extended linear recombination)。 b)二进制交叉(binary valued crossover) 1)单点交叉(single-point crossover); 2)多点交叉(multiple-point crossover); 3)均匀交叉(uniform crossover); 4)洗牌交叉(shuffle crossover); 5)缩小代理交叉(crossover with reduced surrogate)。 最常用的交叉算子为单点交叉(one-point crossover)。具体操作是:在个体串中随机设定一个交叉点,实行交叉时,该点前或后的两个个体的部分结构进行互换,并生成两个新个体。下面给出了单点交叉的一个例子: 个体A:1 0 0 1 ↑1 1 1 → 1 0 0 1 0 0 0 新个体 个体B:0 0 1 1 ↑0 0 0 → 0 0 1 1 1 1 1 新个体% M3 v8 L" U1 d6 M. i
变异
6 p. B! v% c9 E3 q$ u4 M 变异算子的基本内容是对群体中的个体串的某些基因座上的基因值作变动。依据个体编码表示方法的不同,可以有以下的算法: a)实值变异; b)二进制变异。 一般来说,变异算子操作的基本步骤如下: a)对群中所有个体以事先设定的编译概率判断是否进行变异; b)对进行变异的个体随机选择变异位进行变异。 遗传算法导引入变异的目的有两个:一是使遗传算法具有局部的随机搜索能力。当遗传算法通过交叉算子已接近最优解邻域时,利用变异算子的这种局部随机搜索能力可以加速向最优解收敛。显然,此种情况下的变异概率应取较小值,否则接近最优解的积木块会因变异而遭到破坏。二是使遗传算法可维持群体多样性,以防止出现未成熟收敛现象。此时收敛概率应取较大值。 遗传算法中,交叉算子因其全局搜索能力而作为主要算子,变异算子因其局部搜索能力而作为辅助算子。遗传算法通过交叉和变异这对相互配合又相互竞争的操作而使其具备兼顾全局和局部的均衡搜索能力。所谓相互配合.是指当群体在进化中陷于搜索空间中某个超平面而仅靠交叉不能摆脱时,通过变异操作可有助于这种摆脱。所谓相互竞争,是指当通过交叉已形成所期望的积木块时,变异操作有可能破坏这些积木块。如何有效地配合使用交叉和变异操作,是目前遗传算法的一个重要研究内容。 基本变异算子是指对群体中的个体码串随机挑选一个或多个基因座并对这些基因座的基因值做变动(以变异概率P.做变动),(0,1)二值码串中的基本变异操作如下: 基因位下方标有*号的基因发生变异。 变异率的选取一般受种群大小、染色体长度等因素的影响,通常选取很小 遗传算法2 O2 K; X/ z2 C; `
的值,一般取0.001-0.1。8 Z: @0 C2 t* Z+ o
终止条件+ `% v! F" u- n; n( y% s
当最优个体的适应度达到给定的阀值,或者最优个体的适应度和群体适应度不再上升时,或者迭代次数达到预设的代数时,算法终止。预设的代数一般设置为100-500代。( ?6 e$ X. V* a) B% C S
编辑本段基本框架
. g/ a& Z0 C" O& e0 g$ yGA的流程图
% n5 y. H7 o' a# U/ K GA的流程图如右图 遗传算法
$ N: x7 \; x2 A7 G l% y所示- d7 Z" ]9 ?% f1 `- H
编码
, g+ {$ I9 t# z8 M% K+ c" z2 @1 G3 S 遗传算法不能直接处理问题空间的参数,必须把它们转换成遗传空间的由基因按一定结构组成的染色体或个体。这一转换操作就叫做编码,也可以称作(问题的)表示(representation)。 评估编码策略常采用以下3个规范: a)完备性(completeness):问题空间中的所有点(候选解)都能作为GA空间中的点(染色体)表现。 b)健全性(soundness): GA空间中的染色体能对应所有问题空间中的候选解。 c)非冗余性(nonredundancy):染色体和候选解一一对应。 目前的几种常用的编码技术有二进制编码,浮点数编码,字符编码,变成编码等。 而二进值编码是目前遗传算法中最常用的编码方法。即是由二进值字符集{0, 1}产生通常的0, 1字符串来表示问题空间的候选解。它具有以下特点: a)简单易行; b)符合最小字符集编码原则; c)便于用模式定理进行分析,因为模式定理就是以基础的。9 Q: T8 j# j6 V" [4 V0 g
适应度函数
/ H, k8 E- l1 _: C' D0 z 进化论中的适应度,是表示某一个体对环境的适应能力,也表示该个体繁殖后代的能力。遗传算法的适应度函数也叫评价函数,是用来判断群体中的个体的优劣程度的指标,它是根据所求问题的目标函数来进行评估的。 遗传算法在搜索进化过程中一般不需要其他外部信息,仅用评估函数来评估个体或解的优劣,并作为以后遗传操作的依据。由于遗传算法中,适应度函数要比较排序并在此基础上计算选择概率,所以适应度函数的值要取正值.由此可见,在不少场合,将目标函数映射成求最大值形式且函数值非负的适应度函数是必要的。 适应度函数的设计主要满足以下条件: a)单值、连续、非负、最大化; b) 合理、一致性; c)计算量小; d)通用性强。 在具体应用中,适应度函数的设计要结合求解问题本身的要求而定。适应度函数设计直接影响到遗传算法的性能。
9 P; @" o+ V3 F初始群体的选取
# N7 \/ j# n0 ~/ h* v( z 遗传算法中初始群体中的个体是随机产生的。一般来讲,初始群体的设定可采取如下的策略: a)根据问题固有知识,设法把握最优解所占空间在整个问题空间中的分布范围,然后,在此分布范围内设定初始群体。 b)先随机生成一定数目的个体,然后从中挑出最好的个体加到初始群体中。这种过程不断迭代,直到初始群体中个体数达到了预先确定的规模。 |
|