数学建模社区-数学中国
标题: 深度神经模型 [打印本页]
作者: 张志红 时间: 2023-9-26 17:52
标题: 深度神经模型
如果你看到了 NAN 的预测值,算法可能接收到了大梯度,产生了内存溢出。可以将这个视为在很多次迭代之后发生爆炸的矩阵乘法。减小学习率可以缩小这些数值。减少层数能够减少乘法的数量。剪切梯度也能够明显地控制这个问题。
0 L$ i: V( q$ \$ G5 c) H) f
-
-
深度神经模型.docx
1.01 MB, 下载次数: 0, 下载积分: 体力 -2 点
售价: 2 点体力 [记录]
[购买]
| 欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) |
Powered by Discuz! X2.5 |