ICML-On Proximal Policy Optimization’s Heavy-tailed Gradients

收藏 2025-07-28

On Proximal Policy Optimization’s Heavy-tailed Gradients

Saurabh Garg 1 Joshua Zhanson 2 Emilio Parisotto 1 Adarsh Prasad 1 J. Zico Kolter 2 Zachary C. Lipton 1
      Sivaraman Balakrishnan 3 Ruslan Salakhutdinov 1 Pradeep Ravikumar 1

         Abstract             Mnih et al., 2015), policy gradient methods (Williams, 1992;
Modern policy gradient algorithms such as Proxi-    Sutton et al., 2000; Mnih et al., 2016) have risen as a popu-
mal Policy Optimization (PPO) rely on an ...

附件列表

ICML-On Proximal Policy Optimization’s Heavy-tailed Gradients.pdf

大小:607.75 KB

只需: RMB 9 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群