深度学习之感性理解-卷积神经网络
8 l5 m- N0 s. T是什么
6 j/ ? R% {- p1 F" I+ n1 o& }# E I$ p干嘛的3 p+ m4 r. V3 h
卷积核
7 m9 T( N. p k+ B9 B0 n池化层- U) G) i4 d7 v9 y. Z
是什么
6 L4 i9 J5 R1 h9 K" S前面我们介绍的神经网络称为全连接神经网络,因为前一层每个神经元的输出都作为下一层每个神经元的输入。卷积神经网络恰恰相反,不需要全连接,只有部分前一层输出做为后一层的输入。可以简单理解为有一张6X6像素的图片,还有一个3X3的窗口,然后进行从左到右,从上到下一格一格的移动,每次计算窗口里的值和对应图片值的乘积和作为新的像素点,放在一个新的图片里。
1 q5 y2 u. k3 R 2 [# D+ Y' \ d* S
如果将图片作为输入,窗口作为参数,对应的就是这种稀疏连接,共享参数的结构。/ w/ X% Y4 U8 d1 b' t# {
) I3 h- H2 \- e8 f! b1 _1 a
干嘛的
7 _2 Y P; B; D9 g2 n! Z, {这样的连接方式虽然非常全面,不会漏掉任何一个神经元的作用,但是缺点也明显,这种连接使得参数过多,训练时间就会变长,比如处理大图片,像素个数可能有几百万维,参数数量太过庞大,导致训练时间过长,于是有大神提出了卷积神经网络(CNN)。
2 y6 G7 A4 W! [1 z' X0 R& S4 G& q+ m
0 b- o* y' ]( `; z- m卷积神经网络至少有一个卷积层,可以用来提取特征,也就是把图片抽象化,这样就可以减少一定的信息量,参数自然就少了,同时卷积层通过共享参数的方式工作,也可以减少参数。举个例子,如果我们要识别一只猫,如果用全连接的方式可能就会描述成,一只有黄色的大耳朵蓝眼睛身体肥大的波斯猫。但是通过卷积神经网络的卷积层后,会描述成一只猫,这样就提高了通用性,只描述了抽象的特征。 X) Q1 u' x8 M3 ] y" _) Z
( a6 U [3 H f: K6 o& l% Z比如如果我要想学习交通灯的特征,交通灯只在图片里的某一部分,并非全部,如果我把像素点一个个的观察过去,是不是有点浪费,能不能用个大的窗口,直接把交通灯给捕捉出来呢,这也是用CNN的一个特点。" J& ]% p& }5 h2 U$ \4 } d
![]()
* N7 `4 `, L0 A* @5 [* W0 j
/ Y+ I5 B6 d: Y2 E7 D" I卷积核4 x/ w# C, x! _8 C& u' s
就是上面所说的窗口,可以简单的理解为提取相应特征的参数,把高纬度的映射到低纬度,是一种有损压缩,他的表达式也可以看成$ R+ R4 ?) L; w5 S
y=wx+b: Q4 _# o; J$ y& F) e
, J/ [" u# ?& T& o- L6 Y4 Y
![]()
- z: x9 e& i+ J# c& _- M) s0 s池化层一种处理层,类似卷积层,又进行了一次特征提取,减少下一层数据的处理量,进一步获取更为抽象的信息。主要分为最大池化和平均池化,即取窗口中最大的或者取平均数放入新图片里。
9 [3 j l7 h/ y, w G7 z. P * X* U' s9 {( u5 g
好了,今天就到这里了,希望对学习理解有帮助,大神看见勿喷,仅为自己的学习理解,能力有限,请多包涵,图片均来自网络,侵删。有问题加我QQ数学中国浅夏3243710560
( H: G O G1 w; K
9 x$ B7 V g \2 O% S% u, g) U% N
$ S! {: U! g$ b! F4 s% z q1 c& |: K+ s' A$ o+ W/ f' r
|