ICML-Revisiting Peng’s Q($λ$) for Modern Reinforcement Learning

收藏 2025-07-27

Revisiting Peng’s Q(λ) for Modern Reinforcement Learning

  Tadashi Kozuno 1 * Yunhao Tang 2 * Mark Rowland 3 Remi Munos 4 Steven Kapturowski 3 Will Dabney 3
                  Michal Valko 4 David Abel 3

         Abstract                1996; Watkins, 1989; Peng & Williams, 1994; 1996; Precup
Off-policy multi-step reinforcement learning       et al., 2000; Harutyunyan et al., 2016; Munos et al., 2016;
algorithms consist of conservative and non-       Rowland et al., 2020), pot ...

附件列表

ICML-Revisiting Peng’s Q($λ$) for Modern Reinforcement Learning.pdf

大小:3.25 MB

只需: RMB 9 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群