神经网络中的简单结构,感知机 神经网络的灵感来自于人类的中枢神经系统。与人类的大脑相似,我们希望通过构建神经网络能够准确地识别世界上的各种事物,例如区分苹果和橘子、香蕉等水果。具体而言,神经网络在许多应用领域都能发挥重要作用,如人脸识别、语音识别、手写体识别、文本翻译、智力游戏(如棋盘游戏或纸牌游戏),以及自动驾驶汽车和机器人等。 通过神经网络,我们可以实现人类认知的一些功能,并利用其潜力来解决各种现实世界的问题。神经网络以其高度并行、自适应的特性,在模式识别、决策制定和信息处理等方面展现出强大的能力 在生物神经网络中,一个神经元有多个突触。有树突,细胞核和突触树突是树状的神经纤维接收网络,它将电信号传送到细胞体,细胞体对这些输人信号进行整合并进行阚值处理。轴突是单根长纤维,它把细胞体的输出信号导向其他神经元。一个神经细胞的轴突和另一个神经细胞树突的结合点称为突触。神经元的排列和突触的强度(由复杂的化学过程决定)确立了神经网络的功能。图1-1 是两个生物神经元的简化图示。 对于单层神经网络而言,实现的过程与生物体一样,首先将我们输入的数据通过“树突”传入到“细胞核”中进行运算,将运算的结果通过“突触”进行输出。对计算机而言,神经网络的训练不需要训练数据的输入输出。需要训练的是细胞核,也就是运算中的权值和偏移量。 感知机是一种最简单的神经网络模型,只能进行二分类任务,它由一个线性模块和一个激活函数组成。 首先感知机接收一个包含多个输入特征的向量作为输入,每个输入特征都与一个权重相乘。每个输入特征和权重的乘积被累加求和,形成线性模块的输入。线性模块计算输入和权重的线性组合,并将其传递给激活函数。线性模块的输出可以表示为: linear_output = w1*x1 + w2*x2 + ... + wn*xn + b 其中,w1, w2, …, wn 是对应输入特征的权重,x1, x2, …, xn 是输入特征值。b是偏移量。 线性模块的输出经过激活函数的非线性转换。常用的激活函数是阶跃函数(step function),也称为单位阶跃函数或Heaviside函数。阶跃函数根据线性模块的输出值决定输出为1或0,表示感知机的分类结果。具体来说,当线性模块的输出大于或等于阈值时,激活函数输出为1;否则,输出为0。下图为常见激活函数图像。 激活函数输出的值可以判定物体的分类,这样就会产生一个判定界面,当向量在该判定界面一侧它是a物体,它在另一侧时为b物体。这个判定界面就是决策边界。感知机的决策边界是将不同类别的样本分开的超平面。在二分类问题中,感知机通过调整权重的数值来学习决策边界的位置。
3 s; r' o7 `; ?7 Z 初始时,感知机的权重通常被初始化为随机值。通过将输入样本输入感知机,计算输出并与标签进行比较,可以得到分类结果的误差。然后,根据误差进行权重的更新,迭代地进行训练,直到达到一定的训练次数或达到预定的停止条件。 感知机的原理相对简单,主要依赖于线性模块和阈值函数来进行二分类任务。然而,感知机存在一些限制,例如只能解决线性可分问题,并且对噪声敏感。后续的神经网络模型,如多层感知机(MLP)、卷积神经网络(CNN)和循环神经网络(RNN),被设计用来解决更复杂的问题和处理非线性关系
; P0 ^" R6 {. J$ @3 W" O% g: J) \/ y1 F
|