深度学习之感性理解-卷积神经网络
4 K: u4 L9 k/ ^. B7 e是什么
6 m/ o; g7 h, M( i% N干嘛的) z/ V) x: }; E1 s# C
卷积核
- z6 i0 ]0 k Z, Y8 A9 I$ q; ], \. }池化层
3 a' d. J: C, Y9 K+ C& n是什么
* j, |- S( @; E" O4 g3 C& ^前面我们介绍的神经网络称为全连接神经网络,因为前一层每个神经元的输出都作为下一层每个神经元的输入。卷积神经网络恰恰相反,不需要全连接,只有部分前一层输出做为后一层的输入。可以简单理解为有一张6X6像素的图片,还有一个3X3的窗口,然后进行从左到右,从上到下一格一格的移动,每次计算窗口里的值和对应图片值的乘积和作为新的像素点,放在一个新的图片里。5 K, u) k0 Z3 |- w6 B) s
![]()
* Y, C6 H1 c1 D2 V% s# Z如果将图片作为输入,窗口作为参数,对应的就是这种稀疏连接,共享参数的结构。
" ~8 @ j: k- g. |- q% A( x![]()
# Q4 }% A* Q; B. U" M; k6 v干嘛的
0 y+ X* R6 C* x1 j) t& U这样的连接方式虽然非常全面,不会漏掉任何一个神经元的作用,但是缺点也明显,这种连接使得参数过多,训练时间就会变长,比如处理大图片,像素个数可能有几百万维,参数数量太过庞大,导致训练时间过长,于是有大神提出了卷积神经网络(CNN)。
" [5 h- _; x8 K$ D+ ?, ?- _) P( k* k# F; k) g! ] ]4 r# D% ~, t+ J
卷积神经网络至少有一个卷积层,可以用来提取特征,也就是把图片抽象化,这样就可以减少一定的信息量,参数自然就少了,同时卷积层通过共享参数的方式工作,也可以减少参数。举个例子,如果我们要识别一只猫,如果用全连接的方式可能就会描述成,一只有黄色的大耳朵蓝眼睛身体肥大的波斯猫。但是通过卷积神经网络的卷积层后,会描述成一只猫,这样就提高了通用性,只描述了抽象的特征。$ P" [3 I! h% z8 C# S0 v2 \# d) L
' T5 G- s) e+ M3 h
比如如果我要想学习交通灯的特征,交通灯只在图片里的某一部分,并非全部,如果我把像素点一个个的观察过去,是不是有点浪费,能不能用个大的窗口,直接把交通灯给捕捉出来呢,这也是用CNN的一个特点。
n2 a( A$ j- R1 m$ T3 L ) R6 E1 B4 E/ b6 a: t
- L, ?! ^. ]' n$ H+ P6 p
卷积核+ W7 l: \8 f) z
就是上面所说的窗口,可以简单的理解为提取相应特征的参数,把高纬度的映射到低纬度,是一种有损压缩,他的表达式也可以看成
4 j! G$ H+ ~( N" s$ ^/ Ky=wx+b
9 l l1 @% O( C8 _' Y2 ~% i' R M2 j8 d0 U
![]()
/ j! Z% `7 `# F1 ], p8 T池化层一种处理层,类似卷积层,又进行了一次特征提取,减少下一层数据的处理量,进一步获取更为抽象的信息。主要分为最大池化和平均池化,即取窗口中最大的或者取平均数放入新图片里。 / G" y* N5 t5 E8 y2 u, C: g
![]()
3 X$ Y# o: V$ d" G9 H) M好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,图片均来自网络,侵删。有问题加我QQ数学中国浅夏32437105604 W' X4 c* V7 C K4 v) R
/ n7 f( j, Q. v/ a4 N, E/ T& N
5 {) b" w. D: [ T( t& `' C) N) i. g: p9 w
|