为什么Double DQN能解决Nature DQN的过度估计问题 - 经管之家

› 论坛 › 数据科学与人工智能 › 人工智能 › 深度学习

为什么Double DQN能解决Nature DQN的过度估计问题

1203

1

收藏 2020-01-16

看到的文章都说Double DQN将动作选择和价值估计分别放在当前网络和目标网络上计算，就能解决Nature DQN的过度估计问题，但是一直没想明白为什么，请问有没有哪位大神能解答一下，感谢~~~

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

2020-3-10 19:17:57

两个网络，一个网络A实时更新参数，另一个作为target网络B，隔一段时间复制A 的参数。这样学习过程更加稳定。

二维码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

相关推荐

栏目导航

热门文章

推荐文章

扫码加好友，拉您进群

各岗位、行业、专业交流群