计算视觉Online EXP3 Learning in Adversarial Bandits with Delayed Feedback

2023D

收藏 2025-09-01

Online EXP3 Learning in Adversarial Bandits with
      Delayed Feedback

Ilai Bistritz1 , Zhengyuan Zhou23 , Xi Chen2 , Nicholas Bambos1 , Jose Blanchet1
                  1
                  Stanford University
         2
            New York University, Stern School of Business
                  3
                  IBM Research
   {bistritz,bambos,jose.blanchet}@stanford.edu, {zzhou,xchen3}@stern.nyu.edu

                     Abstract
   Consider a player that in  ...

附件列表

计算视觉Online EXP3 Learning in Adversarial Bandits with Delayed Feedback.pdf

大小:272.37 KB

只需: RMB 9 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群