数学建模社区-数学中国

标题: 深度神经模型 [打印本页]

作者: 张志红    时间: 2023-9-26 17:52
标题: 深度神经模型
如果你看到了 NAN 的预测值,算法可能接收到了大梯度,产生了内存溢出。可以将这个视为在很多次迭代之后发生爆炸的矩阵乘法。减小学习率可以缩小这些数值。减少层数能够减少乘法的数量。剪切梯度也能够明显地控制这个问题。
0 L$ i: V( q$ \$ G5 c) H) f

深度神经模型.docx

1.01 MB, 下载次数: 0, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]  [购买]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5