数学建模社区-数学中国

标题: 《神经语言模型的扩展规律》 [打印本页]

作者: 张志红 时间: 2024-6-16 10:09
标题: 《神经语言模型的扩展规律》
[color=rgba(0, 0, 0, 0.9)]该资料主要研究了神经语言模型在交叉熵损失上的经验扩展规律，讨论了这些扩展规律可能适用于其他生成建模任务，并提出了对未来研究方向的展望，包括模型并行性、稀疏性或分支结构等。

23、Scaling Laws for Neural Language Models.pdf

2.38 MB, 下载次数: 1, 下载积分: 体力 -2 点

售价: 5 点体力 [记录]

欢迎光临数学建模社区-数学中国 (http://www.madio.net/)