ICML-TeraPipe Token-Level Pipeline Parallelism for Training Large-Scale Lan ...

收藏 2025-07-27

TeraPipe: Token-Level Pipeline Parallelism for Training
            Large-Scale Language Models

Zhuohan Li 1 Siyuan Zhuang 1 Shiyuan Guo 1 Danyang Zhuo 2 Hao Zhang 1 Dawn Song 1 Ion Stoica 1

         Abstract             bit floating-point numbers. This significantly exceeds the
                              memory capacity of existing hardware accelerators, such
Model parallelism has become a necessity for
                              as GPUs and TPUs, which makes mo ...

附件列表

ICML-TeraPipe Token-Level Pipeline Parallelism for Training Large-Scale Languag.pdf

大小:3.47 MB

只需: RMB 9 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群