ICML-Adapting to Delays and Data in Adversarial Multi-Armed Bandits

收藏 2025-08-11

Adapting to Delays and Data in Adversarial Multi-Armed Bandits

                  Andras Gyorgy 1 Pooria Joulani 1

         Abstract             1. Introduction
                              The multi-armed bandit problem is a canonical model for
We consider the adversarial multi-armed bandit    sequential decision making with limited feedback. In this
problem under delayed feedback. We analyze       model a learner makes a sequence of actions. After ev-
variants of th ...

附件列表

ICML-Adapting to Delays and Data in Adversarial Multi-Armed Bandits.pdf

大小:332.62 KB

只需: RMB 6 元马上下载

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

栏目导航

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群