经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
人工智能
›
深度学习
【李善宰和你讨论进化神经科学】第九记:
楼主
514050209
1146
1
收藏
2017-07-24
我们将Deep Q-Learning成功的基本思想与连续的行动领域相适应。 我们提出一个演员评论家,基于可以在连续动作空间上运行的确定性策略梯度的无模型算法。 使用相同的学习算法,网络架构和超参数,我们的算法强大地解决了20多个模拟物理任务,包括经典问题,如电动车摆动,灵巧操纵,腿式运动和汽车驾驶。 我们的算法能够找到其性能与通过规划算法发现的策略具有竞争力的策略,从而完全访问域及其衍生物的动态。 我们进一步证明,对于许多任务,算法可以直接从原始像素输入端到端学习策略。
1509.02971.pdf
大小:(648.14 KB)
只需: 20 个论坛币
马上下载
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
全部回复
沙发
钱学森64
2017-7-24 20:19:38
谢谢分享
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
栏目导航
深度学习
经管文库(原现金交易版)
爱问频道
经管高考
休闲灌水
求助成功区
热门文章
金融业发展的挑战和机遇
奇瑞2025年出口汽车超134.4万辆 蝉联中国车 ...
半年内连中2次彩票大奖
展望2026:学术智能体即将崛起?
CDA数据分析师:以数据思维赋能企业管理,驱 ...
CDA全国考点信息一览(更新于2025年12月10日 ...
Wooldridge的最新版Introductory Econometr ...
CDA Level III 认证考试大纲重磅更新并启用 ...
AI4S回归白盒符号主义,清华等联合发布SR-L ...
CDA数据分析脱产就业班于2025年12月08日开班 ...
推荐文章
26年寒假天津站|Gemini论文写作&数据分析 ...
2026JG学术冬训营:从Stata初高到Python机器 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
几种免费下载文献的方法----我的文献应助经
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群