经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
数据科学与人工智能
›
人工智能
›
人工智能论文版
多步截断SARSA强化学习算法
楼主
a智多星
552
0
收藏
2018-01-23
摘要:
提出了一种新的on-policy强化学习算法,其基本思想是按照一定学习策略,利用κ(κ>1)步的信息来估计TD(λ)回报值,从而加快对行动最优值估计的更新.更新速度比SARSA(0)算法快,但不象SARSA(λ)需要大量的计算.
原文链接
:http://www.cqvip.com//QK/97496X/200201/6165348.html
送人玫瑰,手留余香~如您已下载到该资源,可在回帖当中上传与大家共享,
欢迎来CDA社区交流学习
。(仅供学术交流用。)
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
统计软件SARS教程
SARS传播研究论文集
【转载】:千亿假货:经济SARS全球扩散
SARS源代码
跨种传染:SARS的教训
《财富》传染专题系列:比SARS更致命:蝙蝠病毒MERS是如何成为人类杀手的
一种状态集结因子化SARSA(λ)强化学习算法
我们要如何对新型冠肺炎、SARS事件进行反思?
SARS过后的市场走势
2003年 非典型肺炎疫情 SARS 数据 累计感染人数 每日新增人数
栏目导航
人工智能论文版
经管文库(原现金交易版)
爱问频道
计量经济学与统计软件
哲学与心理学版
休闲灌水
热门文章
CDA数据分析脱产就业班于2026年3月7日开班! ...
参数估计:CDA数据分析师的核心推断工具,用 ...
GeoSaaS永久会员版
全国国土利用现状、耕地、园地、林地分布等 ...
脑机接口行业系列报告:Neuralink带来的启示 ...
2025年全国公交路线及站点矢量数据
通往2026 中国消费者趋势前瞻
天堂的证据(〔美〕埃本·亚历山大)
Causal Inference: what if 25年11月版
芜宣机场,增长740%!
推荐文章
2026JG学术冬训营:从Stata初高到Python机器 ...
【必看】【本版版规,欢迎发悬赏贴求助】
【新课】26年3月|Gemini辅助论文写作与数据 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群