查看: 3022|回复: 0

[已经解决] 神经网络为啥要使用非线性激活函数

字体大小: 正常放大

1175 主题	4 听众	2872 积分

该用户从未签到

电梯直达

1^#

发表于 2023-9-30 09:41 |只看该作者 |倒序浏览

|招呼Ta 关注Ta

神经网络需要使用非线性激活函数的主要原因是为了赋予神经网络更强大的表示能力和学习能力。如果神经网络只由线性操作组成，那么整个网络实际上只能表示线性关系，无法捕捉到复杂的非线性关系，因此无法处理许多现实世界中的复杂问题。
以下是为什么要使用非线性激活函数的一些关键原因：

1.引入非线性：非线性激活函数引入了非线性操作，使神经网络能够学习和表示非线性关系。这对于解决许多问题非常关键，因为大多数现实世界的数据和问题都包含复杂的非线性特征。
2.多层表示：多层神经网络的层次结构使其能够学习逐渐抽象和表示数据的特征。非线性激活函数使每一层都能够执行非线性变换，从而可以逐渐构建出更高级的特征表示。
3.通用逼近性质：通过使用非线性激活函数，神经网络具有通用逼近定理的性质。这意味着在足够深的网络结构下，神经网络可以近似地表示任何连续函数，只要具备足够多的神经元和适当的参数。
4.解决分类问题：在分类问题中，非线性激活函数可以帮助网络学习非线性的决策边界，从而更好地划分不同类别的数据点。

常见的非线性激活函数包括：

5.Sigmoid函数：将输入映射到0和1之间的非线性输出。
6.双曲正切函数（tanh）：将输入映射到-1和1之间的非线性输出。
7.修正线性单元（ReLU）：在正数输入上返回输入值，负数输入返回0，是最常用的激活函数之一。
8.Leaky ReLU：与ReLU类似，但在负数输入上返回一个小的斜率，以解决ReLU的一些问题。
9.参数化ReLU（PReLU）：类似于Leaky ReLU，但斜率是可学习的。
10.指数线性单元（ELU）：在正数输入上返回输入值，负数输入时引入一个指数衰减。

这些非线性激活函数的选择通常取决于特定问题和神经网络架构的要求。总之，非线性激活函数使神经网络能够更好地适应非线性数据，并且提供了更强大的表示和学习能力，因此在神经网络中广泛使用。

zan