数学建模社区-数学中国

标题: 《神经语言模型的扩展规律》 [打印本页]

作者: 张志红    时间: 2024-6-16 10:09
标题: 《神经语言模型的扩展规律》
[color=rgba(0, 0, 0, 0.9)]该资料主要研究了神经语言模型在交叉熵损失上的经验扩展规律,讨论了这些扩展规律可能适用于其他生成建模任务,并提出了对未来研究方向的展望,包括模型并行性、稀疏性或分支结构等。
2 a, e7 \& K2 G9 K2 c1 E* o. j& d  e$ y% n3 g

23、Scaling Laws for Neural Language Models.pdf

2.38 MB, 下载次数: 1, 下载积分: 体力 -2 点

售价: 5 点体力  [记录]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5