在线时间 1630 小时 最后登录 2024-1-29 注册时间 2017-5-16 听众数 82 收听数 1 能力 120 分 体力 554753 点 威望 12 点 阅读权限 255 积分 171799 相册 1 日志 0 记录 0 帖子 5313 主题 5273 精华 18 分享 0 好友 163
TA的每日心情 开心 2021-8-11 17:59
签到天数: 17 天
[LV.4]偶尔看看III
网络挑战赛参赛者
网络挑战赛参赛者
自我介绍 本人女,毕业于内蒙古科技大学,担任文职专业,毕业专业英语。
群组 : 2018美赛大象算法课程
群组 : 2018美赛护航培训课程
群组 : 2019年 数学中国站长建
群组 : 2019年数据分析师课程
群组 : 2018年大象老师国赛优
数学建模(一)——卷积神经网络
" E0 P& Y9 P8 |4 n
+ U5 n: g. i. l" ?; a1 e1 x6 q3 G. z 大概建模一年多了吧,准备趁着这个暑假,把建模的东西整理一下,留个笔记和纪念,万一哪天不会了还能翻翻笔记。众所周知,建模这东西入门不难,网上各种教程一大把一大把,人家写的也很专业,我写的东西基本登不了大雅之堂,跟人家没法比就写点下里巴人的东西吧。# z- H- ]* Y: p( V
! a' N8 z1 m8 d( K7 t 1.1.概念引入
( B9 Y! g$ @' U9 g; [
( ^" f) {6 f4 g9 I! \9 ^ 1.11.1 图像处理中的卷积运算。看个图生动形象的理解一下下:
$ z' J" l$ Q) b! H# H1 B + e- o4 C& G% Q2 ^0 M
2 @) h/ Z9 D, Q w 在设置好矩阵之后,又该如何运算呢,来,看下面的动图。矩阵对应相乘相加得到卷积的结果。比如,对于左上角的元素4而言,它的运算方式就是:1×1+0×1+1×1+0×0+1×1+0×1+1×0+0×0+1×1=41×1+0×1+1×1+0×0+1×1+0×1+1×0+0×0+1×1=4 0 `3 t4 H9 C4 C& M0 J z
b- h5 z3 R) `8 c 1.21.2 填充padding。上面的操作看着貌似很好,但是有没有缺陷呢?当然有,第一个问题,5×55×5的矩阵和3×33×3的矩阵的卷积结果会得到3×33×3的输出矩阵,也就是原始图像在提取特征的过程中被缩小了,一直卷积的话图像会被一直缩小到一个像素,显然不是想要的结果;第二个问题,原始图像左上角的像素只参与一次运算,而他右边的像素参与了两次运算,是不是不公平?是的。那么如何解决这两个问题呢?
+ l6 d5 F# E2 w2 r7 t5 [3 C
+ v2 p5 d1 G$ W! H3 M 不失一般性,设原始图像为n×nn×n的矩阵,卷积核为f×ff×f的矩阵,那么输出结果就是(n−f+1)×(n−f+1)(n−f+1)×(n−f+1)的矩阵。言归正传,怎么解决上面的问题呢?答案是填充。在imange矩阵的周围在添加一层像素,使其变成(n+1)×(n+1)(n+1)×(n+1)的矩阵,而填充内容是随意的,如果添加pp层像素,原始图像就会变为(n+2p)×(n+2p)(n+2p)×(n+2p)的矩阵,为了使输出矩阵和原始矩阵的维度相同,就要满足下面的等式:
% z" z, a+ X. L" F1 f - H+ B& K3 O3 O6 D) t, X k
n+2p−f+1=n⇒p=(f−1)/2
5 B2 [3 L+ A% v5 k* u4 v3 O n+2p−f+1=n⇒p=(f−1)/2) L4 v. G3 M4 J3 `) A
1.31.3 卷积步长stride。上面的例子中,卷积的移动步长是1,当移动步长s=2s=2的时候呢,7×77×7和3×33×3的矩阵卷积输出的结果是3×33×3的矩阵(自己脑补,就不画图了),于是又得到一个规律,卷积输出结果的维度是(n+2p−fs+1)×(n+2p−fs+1)(n+2p−fs+1)×(n+2p−fs+1)。
. a9 Z" H; |9 k& r! E# Z, u4 u 9 ^" N7 X2 H0 o _3 B
1.41.4 卷积步长stride。上面的例子中,卷积的移动步长是1,当移动步长s=2s=2的时候呢,7×77×7和3×33×3的矩阵卷积输出的结果是3×33×3的矩阵(自己脑补,就不画图了),于是又得到一个规律,卷积输出结果的维度是(n+2p−fs+1)×(n+2p−fs+1)(n+2p−fs+1)×(n+2p−fs+1)。
: _- Q- |9 m' C1 ~
; T* c& P% l0 {; W 2.2.立体卷积与多特征输出1 K& u: x' Z/ t: i8 N4 Y
0 [( F7 g/ a# G0 ?( c8 ~
2.12.1 立体卷积。其实感觉立体卷积这个名字不好,确切的说应该是RGB图像的卷积,容我解释一下应该就能理解的更加透彻了。众所周知,RGB图像有三个通道,也就是意味着RGB图像是n×n×3n×n×3的矩阵,那么怎么对这个立方体进行卷积呢?
" o; m' f/ c* W3 K2 e) t) c " o6 ^/ S, F' o
! n: g7 q, d9 }1 }
$ v: [2 B% G. T/ }9 K
看上图,左边是RGB三色通道下的图5×5×35×5×3,黄色的是卷积核3×3×33×3×3,当卷积步长s=1s=1时,最右边是输出图像4×4×14×4×1,具体是怎么运算的呢,同二维卷积,卷积核与原图像相乘相加,第一层卷积核和R做二维卷积,第二层卷积核和G做二维卷积,第三层卷积核和B做卷积,(卷积层数和输入的层数保持一致)将三者的结果相加求和,得到输出的第一个元素,以此类推,得到输出矩阵。/ ?$ c% f2 k6 q* I4 c) P& I
8 t2 ~1 J- f% {& @& [
2.22.2 多特征输出。先乱入一个重点,关于卷积核提取水平特征,竖直特征等特征的方法,可以先看看我的这个博客,介绍的比较简单。卷积核。在了解了如何提取想要的特诊之后,那么如何同时输出这些特征呢?看下图。通过设置多个卷积核来提取不同的特征,每增加一个卷积核,输出图像的维度就会加一,比如,有xx个卷积核,输出的图像就是n×n×xn×n×x的矩阵。
; s, P" v) L8 H, {2 t9 @ 4 b% L8 S, B5 m1 I/ H: u
, ~2 }; P$ ]% w) m. \+ x7 a
# }% R9 H6 D) v5 ^ 3.3.单层卷积网络8 Q6 p3 y. R5 x9 t4 \0 ^
" g6 U4 s1 L: c1 G- ^ 3.13.1 激活函数与偏向。偏向可能翻译的不好,他的英文表达是bias,可能看了英文就理解的更生动吧。用最简单的形式介绍下激活函数和偏向。假设有一个输入xx,x+bx+b即为所求的输入加偏向,bb是随机常数。然后对x+bx+b进行激活,激活函数有很多种,举一个例子说明,看下图sigmoid的函数,(就是高中生物的那个S型增长曲线)。当输入的x+bx+b在[−∞,0][−∞,0]内,得到的yy在[−1,0][−1,0]之间;当输入的x+bx+b在[0,+∞][0,+∞]之间时,得到的yy在[0,1][0,1]之间,因此激活函数可以理解为一种映射关系,将输入的xx映射为yy。. D( Q/ `& S( u* Z, Y- z
; p: J2 O8 W: E9 p( N1 c( E
; T2 k" O' x, R3 |' Z- c, j
3.23.2 偏向、激活函数在卷积中的应用。
$ ?5 R3 E+ n- E0 y5 t1 ~ ) \; ^+ u, p) K- i4 o- Y8 b
如上图所示,承接上文,在得到卷积的输出之后,对输出的每一个像素做偏向、激活的操作,得到新的输出结果。
' u; t% ^7 Z* i3 L' f7 t; w- z 1 R! j( r8 P4 W3 Y3 n- L' U
3.33.3 第一个卷积神经网络。接着看上面那个图,一次卷积之后会得到三个4×44×4的输出矩阵,将输出矩阵的元素排列成一个48×148×1的向量,在导入lofistic、softmax中去判断,你输入的图片是一只猫还是一只狗。当然还可以有多个卷积层,除了卷积层(conv)之外还可以有池化层(pool)和全连接层(FC),接下来介绍池化层和全连接层。
6 I8 q' c* A0 b2 L, N' |' K
4 `, h4 W7 z) ] 4.4. 池化层# S# Y" Y! X9 J3 r7 j
: i: P; p4 p7 k! d8 j
4.14.1 最大池化。(用的比较广泛)。可以理解为取出特征值最大的做为输出或者取其平均值作为输出。 ! y. G5 ?5 w% ]9 d6 P
; ~$ u$ e) j/ B' W2 `' O! v- _1 }
4.24.2 平均池化
' s9 m8 p0 `1 H' f& R3 o- ?2 ]% f
' P0 s* K- Z0 f3 f- p3 Q 5.5. 含有常见模块的最简单的卷积神经网络
s0 X9 K# x! M5 C) g5 D5 l 1 l7 q% T% n7 x. O% a
$ w4 \; }/ U* ^0 v
7 [* G! l9 p7 d8 a
结构很简单,首先是32×32×332×32×3的图像输入,第一层的内容是卷积,池化;第二层的内容是卷积,池化,第三层是全连接,全连接的形式和普通的神经网络一样,嗯,起码得有一丢丢神经网络的基础。然后得到最终的输出。( i/ h- b2 x. Y* U/ I
6 q' P/ Q" }* Z8 s' G5 D* ?3 j
6.6.python实践
; F; f, m- A* Q B: p+ m2 ]
6 r9 v& S' b, K3 w 2 R$ T" h9 _ L- G% _" d2 b5 q
1 d2 n3 q# t3 N, G: x
zan