本文主要研究内容
作者孙楚,赵辉,王渊,周欢,韩瑾(2019)在《基于强化学习的无人机自主机动决策方法》一文中研究指出:提出了一种基于连续动作集强化学习的无人机机动决策方法。通过Actor-Critic强化学习构架下的NRBF神经网络输出状态真实效用值与连续动作控制变量,效用值与动作控制变量的输出层共用隐层以简化网络结构。结合相对熵理论设计隐层节点的自适应调整方法,有效减少了隐层节点数目。对输出动作控制变量,采用基于高斯分布的连续动作选择策略,并依据训练次数调整随机动作控制变量的概率分布,提升了网络对未知策略的探索能力。在3种不同空战态势下的仿真验证了该方法的有效性,结果表明该方法生成的策略鲁棒性较强,动作控制量更加精确。
Abstract
di chu le yi chong ji yu lian xu dong zuo ji jiang hua xue xi de mo ren ji ji dong jue ce fang fa 。tong guo Actor-Criticjiang hua xue xi gou jia xia de NRBFshen jing wang lao shu chu zhuang tai zhen shi xiao yong zhi yu lian xu dong zuo kong zhi bian liang ,xiao yong zhi yu dong zuo kong zhi bian liang de shu chu ceng gong yong yin ceng yi jian hua wang lao jie gou 。jie ge xiang dui shang li lun she ji yin ceng jie dian de zi kuo ying diao zheng fang fa ,you xiao jian shao le yin ceng jie dian shu mu 。dui shu chu dong zuo kong zhi bian liang ,cai yong ji yu gao si fen bu de lian xu dong zuo shua ze ce lve ,bing yi ju xun lian ci shu diao zheng sui ji dong zuo kong zhi bian liang de gai lv fen bu ,di sheng le wang lao dui wei zhi ce lve de tan suo neng li 。zai 3chong bu tong kong zhan tai shi xia de fang zhen yan zheng le gai fang fa de you xiao xing ,jie guo biao ming gai fang fa sheng cheng de ce lve lu bang xing jiao jiang ,dong zuo kong zhi liang geng jia jing que 。
论文参考文献
论文详细介绍
论文作者分别是来自火力与指挥控制的孙楚,赵辉,王渊,周欢,韩瑾,发表于刊物火力与指挥控制2019年04期论文,是一篇关于无人作战飞机论文,机动决策论文,强化学习论文,连续动作论文,神经网络论文,火力与指挥控制2019年04期论文的文章。本文可供学术参考使用,各位学者可以免费参考阅读下载,文章观点不代表本站观点,资料来自火力与指挥控制2019年04期论文网站,若本站收录的文献无意侵犯了您的著作版权,请联系我们删除。
标签:无人作战飞机论文; 机动决策论文; 强化学习论文; 连续动作论文; 神经网络论文; 火力与指挥控制2019年04期论文;