全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
72 0
2025-08-08
Variational Policy Gradient Method for
   Reinforcement Learning with General Utilities

           Junyu Zhang                  Alec Koppel
     Department of Electrical Engineering             CISD
    Center for Statistics and Machine Learning      US Army Research Laboratory
    Princeton University, Princeton, NJ 08544         Adelphi, MD 20783
        junyuz@princeton.edu             alec.e.koppel.civ@mail.mil
        Amrit Singh Bedi               Csaba Szepesvári
           CISD          ...
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群