深度学习之感性理解-卷积神经网络/ M/ G. N# ?" ?# {( L# B f
是什么
, r& `' P3 _1 }9 k5 N8 y干嘛的9 e8 k; b$ V7 ]/ O+ Z1 G8 D, L# N
卷积核) f1 p1 Y" a2 L2 B* |8 Q
池化层
2 F i8 d0 _7 w是什么2 j- D- g7 d5 A( l
前面我们介绍的神经网络称为全连接神经网络,因为前一层每个神经元的输出都作为下一层每个神经元的输入。卷积神经网络恰恰相反,不需要全连接,只有部分前一层输出做为后一层的输入。可以简单理解为有一张6X6像素的图片,还有一个3X3的窗口,然后进行从左到右,从上到下一格一格的移动,每次计算窗口里的值和对应图片值的乘积和作为新的像素点,放在一个新的图片里。
( C N/ Q& h) x/ G& x / Z' l3 o5 k' w2 W4 Z# B3 W) C: S
如果将图片作为输入,窗口作为参数,对应的就是这种稀疏连接,共享参数的结构。
0 c1 C2 h5 e% W& h ? $ W* y( u- C4 [
干嘛的, }1 K7 D/ A) I; @% k& l7 H
这样的连接方式虽然非常全面,不会漏掉任何一个神经元的作用,但是缺点也明显,这种连接使得参数过多,训练时间就会变长,比如处理大图片,像素个数可能有几百万维,参数数量太过庞大,导致训练时间过长,于是有大神提出了卷积神经网络(CNN)。, a; t/ q) B9 {6 ?& e9 j, [
. d7 E( D$ m R5 z( h
卷积神经网络至少有一个卷积层,可以用来提取特征,也就是把图片抽象化,这样就可以减少一定的信息量,参数自然就少了,同时卷积层通过共享参数的方式工作,也可以减少参数。举个例子,如果我们要识别一只猫,如果用全连接的方式可能就会描述成,一只有黄色的大耳朵蓝眼睛身体肥大的波斯猫。但是通过卷积神经网络的卷积层后,会描述成一只猫,这样就提高了通用性,只描述了抽象的特征。( k+ `( W g8 z5 T/ v
: M3 x) p; [# X比如如果我要想学习交通灯的特征,交通灯只在图片里的某一部分,并非全部,如果我把像素点一个个的观察过去,是不是有点浪费,能不能用个大的窗口,直接把交通灯给捕捉出来呢,这也是用CNN的一个特点。; ~9 d! D1 m# k+ m1 _; T8 A
![]()
9 Y( m2 r( ]% e5 o! A5 f! ]3 ]% e# H5 y* W. _9 A' D& S4 R/ K
卷积核; T. L. [ O8 F9 B" \( [1 h
就是上面所说的窗口,可以简单的理解为提取相应特征的参数,把高纬度的映射到低纬度,是一种有损压缩,他的表达式也可以看成
! y- ^5 W) ]# s$ r9 Hy=wx+b
" B1 b* E( ~- j. Q; T0 v, G- w$ V" E+ l7 u
![]()
/ z5 e& _1 V7 N" P5 }( D( g% e池化层一种处理层,类似卷积层,又进行了一次特征提取,减少下一层数据的处理量,进一步获取更为抽象的信息。主要分为最大池化和平均池化,即取窗口中最大的或者取平均数放入新图片里。
6 @: p- i9 T) C N2 \ * S2 T, T2 X# c& k
好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,图片均来自网络,侵删。有问题加我QQ数学中国浅夏3243710560! y! u$ y, K! d1 L- g
: O+ j- _' y- ?
/ c$ J1 D, T9 ^& `/ u j; D& m0 K. J) @( Z6 c! g4 @# _
|