数学建模社区-数学中国

标题: 对原始Transformer模型的详细解释 [打印本页]

作者: 张志红    时间: 2024-6-3 17:45
标题: 对原始Transformer模型的详细解释
[color=rgba(0, 0, 0, 0.9)]该论文是对 Transformer 论文《Attention is All You Need》的详细注释,它重新排序并删除了原始论文中的一些部分,并在整个文档中添加了注释。另外,论文里还拓展了一些Python代码示例,用于实现Transformer模型的不同组件,并提供了一些训练和使用模型的实用函数。
; G/ c( g1 M* i
; e: G5 U3 I# l5 \& f& V. q8 o( M: q% J

1、The Annotated Transformer.pdf

2.39 MB, 下载次数: 2, 下载积分: 体力 -2 点

售价: 2 点体力  [记录]






欢迎光临 数学建模社区-数学中国 (http://www.madio.net/) Powered by Discuz! X2.5