张志红 发表于 2024-6-15 09:28

《GPipe:使用流水线并行性高效训练巨型神经网络》

该论文介绍了一种名为GPipe的模型并行训练库,该训练库可以通过批处理分割流水线并行算法,高效地训练大型神经网络。

页: [1]
查看完整版本: 《GPipe:使用流水线并行性高效训练巨型神经网络》