查看: 3886|回复: 0

[其他资源] 深度学习之感性理解-卷积神经网络

字体大小: 正常放大

1178 主题	15 听众	1万积分

TA的每日心情

	开心 2023-7-31 10:17

签到天数: 198 天

[LV.7]常住居民III

自我介绍: 数学中国浅夏

电梯直达

1^#

发表于 2021-11-25 21:46 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

深度学习之感性理解-卷积神经网络
是什么
干嘛的
卷积核
池化层
是什么
前面我们介绍的神经网络称为全连接神经网络，因为前一层每个神经元的输出都作为下一层每个神经元的输入。卷积神经网络恰恰相反，不需要全连接，只有部分前一层输出做为后一层的输入。可以简单理解为有一张6X6像素的图片，还有一个3X3的窗口，然后进行从左到右，从上到下一格一格的移动，每次计算窗口里的值和对应图片值的乘积和作为新的像素点，放在一个新的图片里。

如果将图片作为输入，窗口作为参数，对应的就是这种稀疏连接，共享参数的结构。

干嘛的
这样的连接方式虽然非常全面，不会漏掉任何一个神经元的作用，但是缺点也明显，这种连接使得参数过多，训练时间就会变长，比如处理大图片，像素个数可能有几百万维，参数数量太过庞大，导致训练时间过长，于是有大神提出了卷积神经网络（CNN）。

卷积神经网络至少有一个卷积层，可以用来提取特征，也就是把图片抽象化，这样就可以减少一定的信息量，参数自然就少了，同时卷积层通过共享参数的方式工作，也可以减少参数。举个例子，如果我们要识别一只猫，如果用全连接的方式可能就会描述成，一只有黄色的大耳朵蓝眼睛身体肥大的波斯猫。但是通过卷积神经网络的卷积层后，会描述成一只猫，这样就提高了通用性，只描述了抽象的特征。

比如如果我要想学习交通灯的特征，交通灯只在图片里的某一部分，并非全部，如果我把像素点一个个的观察过去，是不是有点浪费，能不能用个大的窗口，直接把交通灯给捕捉出来呢，这也是用CNN的一个特点。

卷积核
就是上面所说的窗口，可以简单的理解为提取相应特征的参数，把高纬度的映射到低纬度，是一种有损压缩，他的表达式也可以看成
y=wx+b

池化层

一种处理层，类似卷积层，又进行了一次特征提取，减少下一层数据的处理量，进一步获取更为抽象的信息。主要分为最大池化和平均池化，即取窗口中最大的或者取平均数放入新图片里。