全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管文库(原现金交易版)
78 0
2025-08-10
Hyperparameter Selection for Imitation Learning

  Leonard Hussenot * 1 2 Marcin Andrychowicz * 1 Damien Vincent * 1 Robert Dadashi 1 Anton Raichuk 1
  Lukasz Stafiniak 1 Sertan Girgin 1 Raphael Marinier 1 Nikola Momchev 1 Sabela Ramos 1 Manu Orsini 1
               Olivier Bachem 1 Matthieu Geist 1 Olivier Pietquin 1

             Abstract                 the expert implements an optimal policy according to an
                                  unknown reward function. This approach, also known ...
附件列表
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群