ICML-1-bit Adam Communication Efficient Large-Scale Training with Adam’s Co ...

收藏 2025-08-11

1-bit Adam: Communication Efficient Large-Scale Training with Adam’s
            Convergence Speed

Hanlin Tang 1 2 Shaoduo Gan 3 Ammar Ahmad Awan 1 Samyam Rajbhandari 1 Conglong Li 1 Xiangru Lian 2
               Ji Liu 2 Ce Zhang 3 Yuxiong He 1

         Abstract                1. Introduction
Scalable training of large models (like BERT       Modern advancement of machine learning is heavily driven
and GPT-3) requires careful optimization rooted    by the advancement of comp ...

附件列表

ICML-1-bit Adam Communication Efficient Large-Scale Training with Adam’s Conve.pdf

大小:2.89 MB

只需: RMB 6 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群