全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
69 0
2025-08-10
Self-Imitation Learning via Generalized Lower
           Bound Q-learning

                      Yunhao Tang
                     Columbia University
                    yt2541@columbia.edu

                       Abstract
     Self-imitation learning motivated by lower-bound Q-learning is a novel and effec-
     tive approach for off-policy learning. In this work, we propose a n-step lower bound
     which generalizes the original return-based lower-bound Q-learning, and introduce
     a new fa ...
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群