计算视觉Search on the Replay Buffer Bridging Planning and Reinforcement Learning

2023D

收藏 2025-09-01

Search on the Replay Buffer:
      Bridging Planning and Reinforcement Learning

      Benjamin Eysenbachθφ , Ruslan Salakhutdinovθ , Sergey Levineφψ
            θ
            CMU, φ Google Brain, ψ UC Berkeley
               beysenba@cs.cmu.edu

                     Abstract
   The history of learning for control has been an exciting back and forth between
   two broad classes of algorithms: planning and reinforcement learning. Planning
   algorithms effectively reason ...

附件列表

计算视觉Search on the Replay Buffer Bridging Planning and Reinforcement Learning.pdf

大小:1.8 MB

只需: RMB 9 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群