计算视觉Thompson Sampling with Information Relaxation Penalties

2023Hua

收藏 2025-08-11

Thompson Sampling with Information Relaxation
         Penalties

      Seungki Min             Costis Maglaras
      Columbia Business School       Columbia Business School
                  Ciamac C. Moallemi
               Columbia Business School

                     Abstract
   We consider a finite-horizon multi-armed bandit (MAB) problem in a Bayesian
   setting, for which we propose an information relaxation sampling framework.
   With this framework, we defin ...

附件列表

计算视觉Thompson Sampling with Information Relaxation Penalties.pdf

大小:386.89 KB

只需: RMB 9 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群