深度学习之感性理解-卷积神经网络
3 u0 N: S! A+ I' Q/ V是什么
9 O. z% q7 s9 |4 `干嘛的. f# q& x1 a' F! v
卷积核% ? a4 U9 N8 I# G+ u% u
池化层
( K N( C' W+ E$ V' O8 t) r3 C是什么4 T I& e0 i% c) z1 V$ J6 @3 a$ O! G
前面我们介绍的神经网络称为全连接神经网络,因为前一层每个神经元的输出都作为下一层每个神经元的输入。卷积神经网络恰恰相反,不需要全连接,只有部分前一层输出做为后一层的输入。可以简单理解为有一张6X6像素的图片,还有一个3X3的窗口,然后进行从左到右,从上到下一格一格的移动,每次计算窗口里的值和对应图片值的乘积和作为新的像素点,放在一个新的图片里。9 L: a" e; k" b* D& ]
$ s+ {1 G8 V/ A% v
如果将图片作为输入,窗口作为参数,对应的就是这种稀疏连接,共享参数的结构。
, C0 a+ b ]( P- o![]()
$ Y8 o* {# m0 r干嘛的
. m' ~0 c; M4 r$ ^: G7 k, t0 T; t这样的连接方式虽然非常全面,不会漏掉任何一个神经元的作用,但是缺点也明显,这种连接使得参数过多,训练时间就会变长,比如处理大图片,像素个数可能有几百万维,参数数量太过庞大,导致训练时间过长,于是有大神提出了卷积神经网络(CNN)。
3 S1 g* Z3 w3 Y" o+ ^/ ?9 E4 v8 B$ i8 e7 w! B
卷积神经网络至少有一个卷积层,可以用来提取特征,也就是把图片抽象化,这样就可以减少一定的信息量,参数自然就少了,同时卷积层通过共享参数的方式工作,也可以减少参数。举个例子,如果我们要识别一只猫,如果用全连接的方式可能就会描述成,一只有黄色的大耳朵蓝眼睛身体肥大的波斯猫。但是通过卷积神经网络的卷积层后,会描述成一只猫,这样就提高了通用性,只描述了抽象的特征。
7 t( e8 @3 y2 @% W o. l* d
5 x8 i [7 Z1 m5 o比如如果我要想学习交通灯的特征,交通灯只在图片里的某一部分,并非全部,如果我把像素点一个个的观察过去,是不是有点浪费,能不能用个大的窗口,直接把交通灯给捕捉出来呢,这也是用CNN的一个特点。9 e: d- x& m0 c( a |
![]()
/ b, l3 ^" P. s$ K: i
( u* `% o. _: U3 E卷积核
6 S8 y. y! F0 p' J% p Y就是上面所说的窗口,可以简单的理解为提取相应特征的参数,把高纬度的映射到低纬度,是一种有损压缩,他的表达式也可以看成
" q7 J# J2 h& j Jy=wx+b
2 n2 @# f- \; g& h9 @7 ]* A5 `# p+ _' s
' K5 P! |5 ]& E6 J 5 Q! Q5 N: }* H" k% P' b
池化层一种处理层,类似卷积层,又进行了一次特征提取,减少下一层数据的处理量,进一步获取更为抽象的信息。主要分为最大池化和平均池化,即取窗口中最大的或者取平均数放入新图片里。
, i1 l. @% \9 J ~1 z! G![]()
' @7 O# l! u$ c# U1 J好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,图片均来自网络,侵删。有问题加我QQ数学中国浅夏32437105600 d P; P" m6 r8 \; n b5 X! v8 [
' Z5 z; U& `' s7 K/ L, _
3 E0 I8 ]7 J5 p1 m8 J6 y
$ B( {. p% N7 S m7 [ |