QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3757|回复: 0
打印 上一主题 下一主题

华为杯研赛数学建模之遗传算法

[复制链接]
字体大小: 正常 放大

1178

主题

15

听众

1万

积分

  • TA的每日心情
    开心
    2023-7-31 10:17
  • 签到天数: 198 天

    [LV.7]常住居民III

    自我介绍
    数学中国浅夏
    跳转到指定楼层
    1#
    发表于 2021-10-13 18:18 |只看该作者 |倒序浏览
    |招呼Ta 关注Ta
    遗传算法简介& x1 u) t% ^) Q  g- V* @+ A
    维基百科上的概念如下
    8 O6 L3 W' F6 [& o; d" J( G遗传算法(英语:genetic algorithm (GA) )是计算数学中用于解决最优化的搜索算法,是进化算法的一种。进化算法最初是借鉴了进化生物学中的一些现象而发展起来的,这些现象包括遗传、突变、自然选择以及杂交等。
    ; K3 _" M; a5 T9 U) M+ `: H, S0 O) f& y9 c$ |- N
    遗传算法通常实现方式为一种计算机模拟。对于一个最优化问题,一定数量的候选解(称为个体)可抽象表示为染色体,使种群向更好的解进化。传统上,解用二进制表示(即0和1的串),但也可以用其他表示方法。进化从完全随机个体的种群开始,之后一代一代发生。在每一代中评价整个种群的适应度,从当前种群中随机地选择多个个体(基于它们的适应度),通过自然选择和突变产生新的生命种群,该种群在算法的下一次迭代中成为当前种群。& ?  i# q" k9 O
    2 `& i- J* q9 C, P& O  |2 s
    这看起来是不是很抽象?没关系,我们举一个例子
    * M: Q0 @# o4 b0 G) U6 S比如你家住的那一块地方有一群老鼠,有一些跑得快而且也聪明,有一些傻得大白天在你面前跳舞,然后理所当然就被你捕获然后进行土葬。故那群跑得快而且也聪明自然活下来的概率比傻的大的多,我们称老鼠是否活下来为适应度,适应度高的更容易在你手上活下来,而低的更容易被你土葬。活下来的老鼠们,它们中大多都是适应度高的,它们进行交配繁殖,老鼠子类大多都是继承了老鼠父母的特点,当然也存在一定几率变异,变异数除以总体老鼠为变异率,变异率一般都不是很大的常数。但总体来说,由于淘汰机制,故所产生的鼠类比起它们的父类,平均来说更为聪明。通过一代代的优化,使得老鼠越来越聪明,而你越来越抓不到老鼠。这就是遗传算法的核心。0 h; r5 b0 o( D9 @

    & n# S; g& t# y遗传算法的步骤- c: D' }" U* H. W; ]
    1.编码( q7 G1 V( Q2 v- U6 e6 Z
    编码有多种,如二进制编码,浮点数编码,格雷码等。最常见的是二进制编码和浮点数编码。
    ( k" d1 K$ r$ e9 z: w8 I
    ) [0 B, @! J% k  G' C' K* ?' ~二进制编码
    % Y* m7 ?1 r) J2 x二进制编码方法是使用二值符号集{0,1},它所构成的个体基因型是一个二进制编码符号串。二进制编码符号串的长度与问题所要求的求解精度有关。3 }0 x3 g0 \. K4 R& S( |# Q
    优点:' C9 |0 _6 j5 n* _/ N( l( M7 M
    4 {7 S7 `) E$ ^$ h$ d$ j
    简单。无论是编码还是解码操作都非常方便和快捷。( `' Y' y" b0 |1 H3 ?- S
    方便交叉和变异。
    $ l2 L$ o) c! x1 T! n6 R符合最小字符集编码原则。" r1 E- d% C7 o8 o
    缺点:
    9 y  b* E$ X9 G- L/ r5 }6 V( v
    3 c, ~2 V" x1 l+ n不适合连续函数的优化问题,局部搜索能力差。# p8 d# q& ^, M- O3 C; i
    连续的数值之间有时候存在距离大的问题。例如63和64对应的二进制分别是0111111和1000000。(连续数值对应的二进制数7位全都不同)
    ) i/ J- K% D4 D% S对于高精度的问题,变异后可能会出现远离最优解的情况,表现型不稳定。3 \; N" m% S7 A' [" s
    案例:
    3 \6 L5 f+ a* Y' B3 g' W假设有f(x),x∈[0,1023],采用定长二进制编码,串0010101111就代表了175,编码精度为1.
    2 o0 N  \6 N/ x, o# H: p- R# e5 p8 b0 X) {7 u, \
    浮点数编码
    / g$ {$ B: C% L  V) Q定义:$ A+ ~1 h9 x8 S. x  \+ N
    个体基因值用某范围内的一个实数来表示。编码长度等于决策变量的个数。
    & ]* g, r0 h, n, ]/ F( H优点:
    1 q) {1 }' x# ?2 [$ I, w9 ]
    8 t2 p" W! I: `( D+ {精度高,适用于连续变量问题。避免了海明悬崖问题。
    4 m7 T( @) a, L; ?* S4 Y: h适用于表示范围比较大的数值,适合空间较大的一串算搜索/ ]) J) f3 p' W3 K- r1 W( e3 `
    降低了计算复杂性,提升效率  P8 M+ ?+ X; O/ g; n: \
    便于遗传算法与经典优化方法的混合使用
    2 \" t+ Q' X% Q4 J' K" U便于设计针对问题的专门知识的知识型遗传算子7 V/ @! |9 I7 {1 u, h! t5 N) h
    便于处理复杂的决策变量约束条件,适合于组合优化问题
    $ m2 I  S" v# a5 j0 T# ^; k案例:
    1 ]6 b  M& E' i- f* z3 o. A假设某优化问题有五个变量,每个变量的变化范围都不同。其中X={5.30,5.20,4.70,3.40,4.80}就是一个基因型,对应的表现型是x={5.30,5.20,4.70,3.40,4.80}。5 e9 h: O  J' }7 i5 u$ }% \/ |
    8 C3 X) e' a# w5 v: a) B7 F& L
    2.解码
    * p5 r9 v: {5 c: A* `2 d# z2 i以二进制为例。1 N$ O0 A6 ~! `/ u9 c; {4 `
    解码的目的就是将不直观的二进制数据串还原成十进制。  \) `0 X' M. M5 y2 }8 \" Y8 ?

    $ b" Q  h( K" w+ M/ @( m3.交配(交叉): p8 n; a* U, g% h8 N& v& J8 i9 \
    以二进制为例。
    6 _# P& U3 m% ~5 O“交配运算”是使用单点或多点进行交叉的算子。首先用随机数产生一个或多个交配点位置,然后两个个体在交配点位置互换部分基因码,形成两个子个体。例如,两条染色体S1=01001011,S2=10010101。交换其后4位基因,得S1’=01000101,S2’=10011011可以被看做原染色体S1和S2的子代染色体。
    ( f$ m( p4 N/ J- P' C% F# }
    # X$ @& P/ \! s# Z4 F1 h7 @. o4.变异
    & Y9 X, K) y4 E2 s- _0 r突变
    . c  [5 T* e% t( k$ e9 Z突变是指基因突变。例如对于S1=010110011,第三位0突变成1,那么我们得到S1‘=011110011。, f0 F& `. H- Z& h2 ?
    倒位
    0 i  @5 I7 F5 C( y5 z0 z倒位是指一个染色体某区段正常排列顺序发生180°的颠倒,造成染色体内的DNA序列重新排列。例如对于S1=1010100010110110101001进行倒位时得到S1‘=010101101000110101001。
    % Q3 Y1 a6 d( l# J/ ?$ l其他
    ' V; _& S( R( l4 r* \' T不一一举例,大家自行查阅理解。
    $ E6 }5 M! Y1 B3 H: \
    ) e! G# m1 O: w% d( X6.适应度评估9 @; H% ?6 m$ j( u6 s. D# a
    遗传算法依照与个体适应度成正比的几率决定当前种群中各个个体遗传到下一代群体的机会。个体适应度大的个体更容易被遗传到下一代。通常情况下,求目标函数最大值的问题可以直接把目标函数作为检测个体适应度大小的函数' G$ `8 @% h9 |" I

    7 g# m/ Q4 p: b2 G7.选择- T& s& S, d& I6 ^+ W8 I  w+ C+ G$ u
    选择运算时根据个体适应度大小决定其下代遗传的可能性。设种群中个体总数为N,个体i的适应度为fi,则个体i被选取的几率为:
    4 ^9 R; f3 k, Y$ Q8 |4 W. d3 W3 l0 K6 }9 |" E  T

    5 U0 I! i; h: ]7 Q; Y9 |3 s遗传算法伪代码2 ]' `! m% A3 H9 C3 n
    BEGIN& v4 j1 _; p- F9 r& H  V$ u
        t = 0;                       %遗传代数
      o$ ^( e; Y$ }7 X: j2 G    初始化P(t);                  %初始化种群或者染色体
    * c7 @" J, o( Z& x4 c: U    计算P(t)的适应值;
    % [& [3 ^  C8 M5 Z4 _    while(不满足停止准则) do
    0 d- E  S4 ~2 Q" N( _$ E5 d0 @        begin9 I3 D6 A" I# e- ~2 H6 a0 z0 x
            t = t+1;1 c* ]  W, A  u2 Y, V$ v: P
            从P(t-1)中选择P(t);       %选择$ M* V6 K! e( J" }/ O
            重组P(t);                 %交叉或变异1 [& D- t2 Q  r" {2 \6 \* o
            计算P(t)的适应值;
    - @: n5 A9 g( L; e         end1 f4 z; o" ~- b2 s
        end
    6 ^% j# I% u1 g; D: U/ }" L; q END
    ' ?- k# f2 ]& s* k6 r遗传算法工具箱0 A5 ^2 z( }) b& \+ f! `) Z0 |0 t5 L* c
    如果前面没看懂,没关系!!!为了省略艰深难懂的遗传算法,MATLAB软件做成了专门的遗传算法工具箱GA Toolbox,方便用户调用。(但有时候遗传工具并不是万能的,很多的情况下更需要具体问题具体分析)
    ! J+ J5 j# X, E8 s我们在MATLAB中帮助文档查看ga函数的定义+ k( s5 ]! P$ D6 Q" n7 D' z6 y
    Find minimum of function using genetic algorithm
    + e; F: r& C2 x* M  x, ^5 ~意思就是通过使用遗传算法找到函数的最小值。" U. _6 U$ \5 `9 @+ t$ Q
    它的用法,如下:0 W# `3 D# X' J2 Z! N+ h
    x = ga(fitnessfcn,nvars)" }7 H2 l% w# c7 ~) b2 ^
    x = ga(fitnessfcn,nvars,A,b)
    8 c6 ^6 T/ l- [x = ga(fitnessfcn,nvars,A,b,Aeq,beq)
    9 @. z' n4 Q5 k4 Ox = ga(fitnessfcn,nvars,A,b,Aeq,beq,LB,UB)& l( Q- S% s2 G# X  y: R
    x = ga(fitnessfcn,nvars,A,b,Aeq,beq,LB,UB,nonlcon)
    0 w1 ?/ ]' \- @% B7 cx = ga(fitnessfcn,nvars,A,b,Aeq,beq,LB,UB,nonlcon,options)
    7 g: Q1 d" I& ?+ jx = ga(fitnessfcn,nvars,A,b,[],[],LB,UB,nonlcon,IntCon)
      e- g0 n) R' m' cx = ga(fitnessfcn,nvars,A,b,[],[],LB,UB,nonlcon,IntCon,options)
    * A! J1 m9 O7 w- d  K% cx = ga(problem)( j; N5 x0 t! d/ R! Z, H0 n) l
    [x,fval] = ga(fitnessfcn,nvars,…)
    6 J: D. c0 j+ Y) g[x,fval,exitflag] = ga(fitnessfcn,nvars,…)
    % S- c5 @/ l& s2 P[x,fval,exitflag,output] = ga(fitnessfcn,nvars,…)/ `8 h7 Y) D% g4 w
    [x,fval,exitflag,output,population] = ga(fitnessfcn,nvars,…)+ f( O' G8 q5 V+ p
    [x,fval,exitflag,output,population,scores] = ga(fitnessfcn,nvars,…)) ~! H5 V3 _) ^' h& m
    x为经过遗传进化以后的自变量最佳染色体返回值;fval为最佳染色体的适应度,exitflag为算法停止的原因;output为包含每一代输出的结构以及有关算法性能的其他信息;population返回矩阵,群体其行是最终总体;scores返回最终群体的得分。. L+ D- H/ i0 x# Z( Z6 p* o0 f! V
    fitnessfcn为适应度函数,nvars为目标函数自变量的个数,A,b,Aeq,beq为约束条件(与线性规划类似)LB,UB为自变量的上界和下界;函数nonlcon接受x并返回矢量C和Ceq,分别表示非线性不等式和等式;IntCon要求中列出的变量采用整数值;options为默认优化参数由options中的值替换。
    + A6 f$ o# }- ^$ J9 @我们用的更多的是这种' C& b/ P  a" s6 p
    [x,fval] = ga(fitnessfcn,nvars,options): N: E5 k/ m+ R! O4 ~- F- m
    令options=gaoptimset()函数,gaoptimset函数用法如下:
    " m' F7 Y# ~6 s/ {( ^0 J; ]" P* c  D
    属性如下:$ a6 B( G+ ]7 L# Y' n

    8 N$ t! X6 H0 [# [" F1 n. u! i+ ^: y6 x

    - A) G7 M6 [6 ]) g6 b$ n
    6 e4 A  u7 ?7 J- g) @, B) A" W  _. F; [; q6 K! N& p3 L
    + i+ d6 e# d& u& h+ q
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-4-27 02:36 , Processed in 1.828230 second(s), 51 queries .

    回顶部