计算视觉Regret Minimization for Reinforcement Learning by Evaluating the Optima ...

2023D

收藏 2025-09-01

Regret Minimization for Reinforcement Learning by
Evaluating the Optimal Bias Function

         Zihan Zhang                Xiangyang Ji
         Tsinghua University             Tsinghua University
   zihan-zh17@mails.tsinghua.edu.cn          xyji@tsinghua.edu.cn

                     Abstract
   We present an algorithm based on the Optimism in the Face of Uncertainty (OFU)
   principle which is able to learn Reinforcement Learning (RL) modeled by Markov
   deci ...

附件列表

计算视觉Regret Minimization for Reinforcement Learning by Evaluating the Optimal.pdf

大小:623.33 KB

只需: RMB 9 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群