孙楚:基于强化学习的无人机自主机动决策方法论文

孙楚:基于强化学习的无人机自主机动决策方法论文

本文主要研究内容

作者孙楚,赵辉,王渊,周欢,韩瑾(2019)在《基于强化学习的无人机自主机动决策方法》一文中研究指出:提出了一种基于连续动作集强化学习的无人机机动决策方法。通过Actor-Critic强化学习构架下的NRBF神经网络输出状态真实效用值与连续动作控制变量,效用值与动作控制变量的输出层共用隐层以简化网络结构。结合相对熵理论设计隐层节点的自适应调整方法,有效减少了隐层节点数目。对输出动作控制变量,采用基于高斯分布的连续动作选择策略,并依据训练次数调整随机动作控制变量的概率分布,提升了网络对未知策略的探索能力。在3种不同空战态势下的仿真验证了该方法的有效性,结果表明该方法生成的策略鲁棒性较强,动作控制量更加精确。

Abstract

di chu le yi chong ji yu lian xu dong zuo ji jiang hua xue xi de mo ren ji ji dong jue ce fang fa 。tong guo Actor-Criticjiang hua xue xi gou jia xia de NRBFshen jing wang lao shu chu zhuang tai zhen shi xiao yong zhi yu lian xu dong zuo kong zhi bian liang ,xiao yong zhi yu dong zuo kong zhi bian liang de shu chu ceng gong yong yin ceng yi jian hua wang lao jie gou 。jie ge xiang dui shang li lun she ji yin ceng jie dian de zi kuo ying diao zheng fang fa ,you xiao jian shao le yin ceng jie dian shu mu 。dui shu chu dong zuo kong zhi bian liang ,cai yong ji yu gao si fen bu de lian xu dong zuo shua ze ce lve ,bing yi ju xun lian ci shu diao zheng sui ji dong zuo kong zhi bian liang de gai lv fen bu ,di sheng le wang lao dui wei zhi ce lve de tan suo neng li 。zai 3chong bu tong kong zhan tai shi xia de fang zhen yan zheng le gai fang fa de you xiao xing ,jie guo biao ming gai fang fa sheng cheng de ce lve lu bang xing jiao jiang ,dong zuo kong zhi liang geng jia jing que 。

论文参考文献

  • [1].多无人机协同搜索的模糊认知决策方法研究[J]. 魏瑞轩,周凯,茹常剑,关旭宁,车军.  中国科学:技术科学.2015(06)
  • [2].基于三支理论的无人机对地攻击认知决策方法[J]. 鲁鸿轩,魏瑞轩.  空军工程大学学报(自然科学版).2018(05)
  • [3].一种近似动态规划的无人机机动决策方法[J]. 黄长强,赵克新,韩邦杰,魏政磊.  电子与信息学报.2018(10)
  • [4].基于离散化分布密度的无人机粗糙决策方法[J]. 董慧芬,王晓丽,高庆吉.  系统工程与电子技术.2019(01)
  • [5].基于动态环境模型的卫星任务决策方法[J]. 陈曦,毛一岚,于龙江.  科学技术创新.2018(08)
  • [6].自主空战机动决策方法综述[J]. 周思羽,吴文海,张楠,张靖.  航空计算技术.2012(01)
  • [7].FDF 鲁棒决策方法研究[J]. 何英姿,张兵,吴宏鑫.  宇航学报.1998(03)
  • [8].基于马尔科夫网络的无人机机动决策方法研究[J]. 罗元强,孟光磊.  系统仿真学报.2017(S1)
  • [9].一种多目标攻击逻辑与决策方法[J]. 王红,高晓光,张滋烈.  兵工学报.1997(03)
  • [10].基于多智能体的无人作战平台多机协同对抗多目标任务决策方法[J]. 姚宗信.  航空科学技术.2008(03)
  • 论文详细介绍

    论文作者分别是来自火力与指挥控制的孙楚,赵辉,王渊,周欢,韩瑾,发表于刊物火力与指挥控制2019年04期论文,是一篇关于无人作战飞机论文,机动决策论文,强化学习论文,连续动作论文,神经网络论文,火力与指挥控制2019年04期论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自火力与指挥控制2019年04期论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。

    标签:;  ;  ;  ;  ;  ;  

    孙楚:基于强化学习的无人机自主机动决策方法论文
    下载Doc文档

    猜你喜欢