基于增强学习的空空导弹智能精确制导律研究

692

收藏 2018-01-04

摘要：根据现代战争的对抗格局，提出了空空导弹拦截高速大机动目标的智能制导律。这种制导律是采用基于Q—learning算法的。Q—learning的思想是直接优化一个可迭代计算的Q函数，并利用增强学习实现知识的自动获取，来扩展所能得到的知识资源。在Q—learning算法中，系统通过计算状态的值函数或者状态-动作对的值函数来控制导弹的飞行。根据环境的评价性回报函数来实现决策的优化。从而能够达到行为优化。这种制导规律只需要导弹和目标的位置、状态变量和法向过载的测量量。易于弹上实时实现，并且将这种制导律和传统制导相比较。结果表明：这种制导具有一定的智能行为。可以拦截大机动目标。这种智能制导方法有利于提高打击精度和载机的作战生存能力。

原文链接:http://www.cqvip.com//QK/92556X/200604/22806266.html

送人玫瑰，手留余香~如您已下载到该资源，可在回帖当中上传与大家共享，欢迎来CDA社区交流学习。（仅供学术交流用。）

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群