深度学习之感性理解-卷积神经网络
; L" o7 W4 R; S是什么9 |& w: b7 F" K4 N* S1 l
干嘛的0 [2 t D# Q, P
卷积核1 H# ~' n) @- j) t8 D9 v) z- u0 o7 n$ J# h
池化层. t0 Z! M+ z/ s7 m5 J) T
是什么
! Q2 v- M R4 B" E5 I V, P8 X前面我们介绍的神经网络称为全连接神经网络,因为前一层每个神经元的输出都作为下一层每个神经元的输入。卷积神经网络恰恰相反,不需要全连接,只有部分前一层输出做为后一层的输入。可以简单理解为有一张6X6像素的图片,还有一个3X3的窗口,然后进行从左到右,从上到下一格一格的移动,每次计算窗口里的值和对应图片值的乘积和作为新的像素点,放在一个新的图片里。
2 _4 Q- S# f( `7 p7 x9 P ![]()
6 C2 T/ A( s/ o3 z0 u如果将图片作为输入,窗口作为参数,对应的就是这种稀疏连接,共享参数的结构。
2 h, I2 R* c' h$ `![]()
1 H% B2 D4 t& T) g$ U' x+ i- F, X干嘛的% P9 w/ Y3 D# K4 F, J
这样的连接方式虽然非常全面,不会漏掉任何一个神经元的作用,但是缺点也明显,这种连接使得参数过多,训练时间就会变长,比如处理大图片,像素个数可能有几百万维,参数数量太过庞大,导致训练时间过长,于是有大神提出了卷积神经网络(CNN)。
( x. T+ V! c: D1 l/ S0 K+ d9 Z, K6 c7 s
卷积神经网络至少有一个卷积层,可以用来提取特征,也就是把图片抽象化,这样就可以减少一定的信息量,参数自然就少了,同时卷积层通过共享参数的方式工作,也可以减少参数。举个例子,如果我们要识别一只猫,如果用全连接的方式可能就会描述成,一只有黄色的大耳朵蓝眼睛身体肥大的波斯猫。但是通过卷积神经网络的卷积层后,会描述成一只猫,这样就提高了通用性,只描述了抽象的特征。
$ W/ N# M: Z0 d% v% ^
% f! B5 k8 c9 m/ K+ ~比如如果我要想学习交通灯的特征,交通灯只在图片里的某一部分,并非全部,如果我把像素点一个个的观察过去,是不是有点浪费,能不能用个大的窗口,直接把交通灯给捕捉出来呢,这也是用CNN的一个特点。5 C) l3 d f, Z$ L. h) v, E
: r) h0 B4 |* r' k$ x+ }* R
$ T) c4 N% T1 v! H5 o7 X; [卷积核- J, k3 @( o" \, L. ?
就是上面所说的窗口,可以简单的理解为提取相应特征的参数,把高纬度的映射到低纬度,是一种有损压缩,他的表达式也可以看成
& Z+ |( J' F" `: v4 _y=wx+b
S `* l% {1 K# @1 H
D( k e# D! C* ?; R![]()
: C2 r/ n, g; X( U: M' Y池化层一种处理层,类似卷积层,又进行了一次特征提取,减少下一层数据的处理量,进一步获取更为抽象的信息。主要分为最大池化和平均池化,即取窗口中最大的或者取平均数放入新图片里。
% ^% g* T' G: U, D; w6 o* ]5 @![]()
3 c0 Y3 Z" [8 K& o! Y好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,图片均来自网络,侵删。有问题加我QQ数学中国浅夏3243710560
7 T) D& Y% f2 m* w8 }: r7 j9 f& U" t3 s' d1 B* |$ [
; {0 z4 K; B) P( g8 C
' a2 U1 G; c2 @0 ~. y. F- I |