QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 2932|回复: 0
打印 上一主题 下一主题

[建模教程] 数学建模(一)——卷积神经网络

[复制链接]
字体大小: 正常 放大
杨利霞        

5273

主题

82

听众

17万

积分

  • TA的每日心情
    开心
    2021-8-11 17:59
  • 签到天数: 17 天

    [LV.4]偶尔看看III

    网络挑战赛参赛者

    网络挑战赛参赛者

    自我介绍
    本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。

    群组2018美赛大象算法课程

    群组2018美赛护航培训课程

    群组2019年 数学中国站长建

    群组2019年数据分析师课程

    群组2018年大象老师国赛优

    跳转到指定楼层
    1#
    发表于 2019-4-4 16:11 |只看该作者 |正序浏览
    |招呼Ta 关注Ta
    数学建模(一)——卷积神经网络

    9 X+ G. Y& N( a! r) H8 v! r
    数学建模系列——CNN原理与实践

    ; W9 O4 T% |8 o% k    大概建模一年多了吧,准备趁着这个暑假,把建模的东西整理一下,留个笔记和纪念,万一哪天不会了还能翻翻笔记。众所周知,建模这东西入门不难,网上各种教程一大把一大把,人家写的也很专业,我写的东西基本登不了大雅之堂,跟人家没法比就写点下里巴人的东西吧。- [2 y+ K- e1 E# ]1 V$ s
    % |+ t1 _4 m4 E) q: [
    1.1.概念引入
    " m/ B) v7 |$ l4 m& c, F8 T$ T7 `2 i- e5 _0 u
        1.11.1 图像处理中的卷积运算。看个图生动形象的理解一下下:
    ' d7 s% ~  A# N' e' H5 Y3 r+ Q; [! S9 Z# Q$ c
    ' [& a) `/ }% ~* w5 h) Y
        在设置好矩阵之后,又该如何运算呢,来,看下面的动图。矩阵对应相乘相加得到卷积的结果。比如,对于左上角的元素4而言,它的运算方式就是:1×1+0×1+1×1+0×0+1×1+0×1+1×0+0×0+1×1=41×1+0×1+1×1+0×0+1×1+0×1+1×0+0×0+1×1=4 6 _% y7 B& V* G) C

    ! W' T- j0 G9 ^/ a8 K    1.21.2 填充padding。上面的操作看着貌似很好,但是有没有缺陷呢?当然有,第一个问题,5×55×5的矩阵和3×33×3的矩阵的卷积结果会得到3×33×3的输出矩阵,也就是原始图像在提取特征的过程中被缩小了,一直卷积的话图像会被一直缩小到一个像素,显然不是想要的结果;第二个问题,原始图像左上角的像素只参与一次运算,而他右边的像素参与了两次运算,是不是不公平?是的。那么如何解决这两个问题呢?
    ) G5 T5 d! o  h7 v. Y' Q
    5 G# a( j* Y  d# R* h  e    不失一般性,设原始图像为n×nn×n的矩阵,卷积核为f×ff×f的矩阵,那么输出结果就是(n−f+1)×(n−f+1)(n−f+1)×(n−f+1)的矩阵。言归正传,怎么解决上面的问题呢?答案是填充。在imange矩阵的周围在添加一层像素,使其变成(n+1)×(n+1)(n+1)×(n+1)的矩阵,而填充内容是随意的,如果添加pp层像素,原始图像就会变为(n+2p)×(n+2p)(n+2p)×(n+2p)的矩阵,为了使输出矩阵和原始矩阵的维度相同,就要满足下面的等式:
    ! g% }  |& i1 b# P
    $ L* V- M5 N8 A2 Kn+2p−f+1=n⇒p=(f−1)/2  ~# ^- N- z3 j8 `* o- o) q
    n+2p−f+1=n⇒p=(f−1)/2
    / ^# h$ F  Q) E5 B3 c5 s) c    1.31.3 卷积步长stride。上面的例子中,卷积的移动步长是1,当移动步长s=2s=2的时候呢,7×77×7和3×33×3的矩阵卷积输出的结果是3×33×3的矩阵(自己脑补,就不画图了),于是又得到一个规律,卷积输出结果的维度是(n+2p−fs+1)×(n+2p−fs+1)(n+2p−fs+1)×(n+2p−fs+1)。/ }1 b" w6 N/ D- L9 i: a: j7 X6 T1 t/ T

    3 ~  L4 _8 L$ ]' K    1.41.4 卷积步长stride。上面的例子中,卷积的移动步长是1,当移动步长s=2s=2的时候呢,7×77×7和3×33×3的矩阵卷积输出的结果是3×33×3的矩阵(自己脑补,就不画图了),于是又得到一个规律,卷积输出结果的维度是(n+2p−fs+1)×(n+2p−fs+1)(n+2p−fs+1)×(n+2p−fs+1)。% c6 g$ [  e3 i$ q
    9 s* ]; X0 b* _: a9 W1 c! X
    2.2.立体卷积与多特征输出6 L, w4 ]  y1 ?! |

    , d2 z" a- t+ O1 D* O8 v3 f2 U: l9 v    2.12.1 立体卷积。其实感觉立体卷积这个名字不好,确切的说应该是RGB图像的卷积,容我解释一下应该就能理解的更加透彻了。众所周知,RGB图像有三个通道,也就是意味着RGB图像是n×n×3n×n×3的矩阵,那么怎么对这个立方体进行卷积呢?4 y' D% s9 f! C0 u( U# e$ g

      Q0 O' d( c& N$ E+ F( W
    % B- y! O  v6 Q8 p# E5 n( G1 b% D$ C1 C+ n. P" o9 d. c
        看上图,左边是RGB三色通道下的图5×5×35×5×3,黄色的是卷积核3×3×33×3×3,当卷积步长s=1s=1时,最右边是输出图像4×4×14×4×1,具体是怎么运算的呢,同二维卷积,卷积核与原图像相乘相加,第一层卷积核和R做二维卷积,第二层卷积核和G做二维卷积,第三层卷积核和B做卷积,(卷积层数和输入的层数保持一致)将三者的结果相加求和,得到输出的第一个元素,以此类推,得到输出矩阵。3 R9 l' ~. i! D& _$ O

    $ y7 ?1 M1 Y- Z: h    2.22.2 多特征输出。先乱入一个重点,关于卷积核提取水平特征,竖直特征等特征的方法,可以先看看我的这个博客,介绍的比较简单。卷积核。在了解了如何提取想要的特诊之后,那么如何同时输出这些特征呢?看下图。通过设置多个卷积核来提取不同的特征,每增加一个卷积核,输出图像的维度就会加一,比如,有xx个卷积核,输出的图像就是n×n×xn×n×x的矩阵。
    % l& E4 u9 Z. \/ d: M0 u" U) h7 a7 m" Z2 O3 g1 M. U) d- v

    - c. l9 I1 p9 M% v0 s1 O
    2 ?3 _; T, b: E, U3.3.单层卷积网络& u+ }, S: Q$ l7 S4 M) ]$ M+ w
    : B4 f5 M3 N! C% @1 y
        3.13.1 激活函数与偏向。偏向可能翻译的不好,他的英文表达是bias,可能看了英文就理解的更生动吧。用最简单的形式介绍下激活函数和偏向。假设有一个输入xx,x+bx+b即为所求的输入加偏向,bb是随机常数。然后对x+bx+b进行激活,激活函数有很多种,举一个例子说明,看下图sigmoid的函数,(就是高中生物的那个S型增长曲线)。当输入的x+bx+b在[−∞,0][−∞,0]内,得到的yy在[−1,0][−1,0]之间;当输入的x+bx+b在[0,+∞][0,+∞]之间时,得到的yy在[0,1][0,1]之间,因此激活函数可以理解为一种映射关系,将输入的xx映射为yy。% R1 A/ s! ?' D4 K& ~2 ?4 F1 |& I- d
      V9 D4 b1 D- y$ n8 l7 X
    ! ?' b4 N* ]! O$ k, a: V
        3.23.2 偏向、激活函数在卷积中的应用。 , o9 r* L8 P" ]" q3 b' X6 R

    * a; _$ ?* v$ W  `8 `2 s# h% V) E9 T    如上图所示,承接上文,在得到卷积的输出之后,对输出的每一个像素做偏向、激活的操作,得到新的输出结果。7 a. T$ h& i1 V
      [8 L8 a1 }- F; T
        3.33.3 第一个卷积神经网络。接着看上面那个图,一次卷积之后会得到三个4×44×4的输出矩阵,将输出矩阵的元素排列成一个48×148×1的向量,在导入lofistic、softmax中去判断,你输入的图片是一只猫还是一只狗。当然还可以有多个卷积层,除了卷积层(conv)之外还可以有池化层(pool)和全连接层(FC),接下来介绍池化层和全连接层。* g9 w9 Z2 a+ z1 r. o, B9 M# t5 ?
    5 ]4 q% l1 T( i1 u& G
    4.4. 池化层- f8 `, V+ I  N, K" K
    9 c& e1 f5 @# \" e" N! I5 g
        4.14.1 最大池化。(用的比较广泛)。可以理解为取出特征值最大的做为输出或者取其平均值作为输出。 1 |) W/ Q+ P6 }! r5 \8 {" H

    " ]- h1 N3 d0 |. p  ?    4.24.2 平均池化 + ?' J+ ~& X) h) u6 @

    2 Q4 q' M# u$ x5 H) U5.5. 含有常见模块的最简单的卷积神经网络
    ; D- j, e1 C# n# ?! n2 p4 m8 N8 D5 W) j3 F! s; p1 B: O
    , q3 W* G" b% s$ z  T, e" w& q

    . Q, k" S0 o# M) d    结构很简单,首先是32×32×332×32×3的图像输入,第一层的内容是卷积,池化;第二层的内容是卷积,池化,第三层是全连接,全连接的形式和普通的神经网络一样,嗯,起码得有一丢丢神经网络的基础。然后得到最终的输出。
    - j8 z- n! g  ]% F, U6 Z2 x+ P1 q! q4 O7 q4 E: J( q
    6.6.python实践
    2 G  S: y7 @; e
    % Z8 A- H( V' i' q6 a$ e* z) d6 r. \2 t: k5 ~, E
    $ X# S1 }# s7 A) F* c
    zan
    转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
    您需要登录后才可以回帖 登录 | 注册地址

    qq
    收缩
    • 电话咨询

    • 04714969085
    fastpost

    关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

    手机版|Archiver| |繁體中文 手机客户端  

    蒙公网安备 15010502000194号

    Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

    GMT+8, 2026-6-15 22:10 , Processed in 0.628297 second(s), 52 queries .

    回顶部