QQ登录

只需要一步,快速开始

 注册地址  找回密码
查看: 3437|回复: 0
打印 上一主题 下一主题

[已经解决] 模型出现梯度爆炸如何解决

[复制链接]
字体大小: 正常 放大

1189

主题

4

听众

2934

积分

该用户从未签到

跳转到指定楼层
1#
发表于 2023-7-21 11:17 |只看该作者 |倒序浏览
|招呼Ta 关注Ta
重新设计网络层更少的网络,在循环神经网络中,训练过程中在更少的先前时间步上进行更新。(沿时间的截断反方向传播)来缓解梯度爆炸问题。使用ReLU激活函数使用LSTM网络1 K! f5 E$ z$ q5 y9 A& L
LSTM(长短期记忆),是一种特殊的RNN, 在循环神经网络中,梯度爆炸发生可能是因为某种网络的训练本身存在不稳定性,如随时间的反向传播本质上是将循环网络转换成深层神经网络。
' |) J9 A; O9 G& C: D* P( v使用LSTM单元和相关的门类神经元结构可以减少梯度爆炸问题。使用梯度截断, 在训练过程中检查和限制梯度的大小,当梯度超过阈值就截断。对权重使用正则化。惩罚产生较大权重的损失函数。( H0 x, G" Y% x! A7 S
+ U" u) s( J+ [

" Z! B5 k2 e7 Z% i, [0 P& I( Z- X7 k5 g# }) E
5 H% Z: |4 F; X3 R- v
zan
转播转播0 分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0 微信微信
您需要登录后才可以回帖 登录 | 注册地址

qq
收缩
  • 电话咨询

  • 04714969085
fastpost

关于我们| 联系我们| 诚征英才| 对外合作| 产品服务| QQ

手机版|Archiver| |繁體中文 手机客户端  

蒙公网安备 15010502000194号

Powered by Discuz! X2.5   © 2001-2013 数学建模网-数学中国 ( 蒙ICP备14002410号-3 蒙BBS备-0002号 )     论坛法律顾问:王兆丰

GMT+8, 2026-6-13 03:48 , Processed in 0.424699 second(s), 50 queries .

回顶部