激励势场论文-邓慈云

激励势场论文-邓慈云

导读:本文包含了激励势场论文开题报告文献综述及选题提纲参考文献,主要关键词:算法分析,激励学习,人工势场,路径规划

激励势场论文文献综述

邓慈云[1](2009)在《激励势场算法的复杂性研究》一文中研究指出当面对求解一个问题的新算法的时候,我们的兴趣在于形成这样一种粗略的认识:新算法预期能有多好,对于同一个问题它比其他的算法如何。计算复杂性研究能够提供这种认识。对算法的分析能够帮助我们对算法更深入地理解,并能够提出有根有据的改进。尤为重要的是,正确分析所需要的仔细全面的审查常常使得算法更好和更有效地实现。激励学习因为具有较强的在线自适应性以及对复杂系统的自学习能力,受到机器人导航研究者的关注。目前,激励学习对于许多现实的问题,如大尺度和部分可观测环境,仍然是没有解决的问题。这些问题采用传统的算法很难满意地解决。通过利用人工势场将激励学习问题转换为路劲规划问题。然后为解决人工势场中的局部最小问题,应用虚拟水流法的概念提出的一种新的人工势场算法。实验结果表明该方法在激励学习系统中是有效的。但只有当解析的结果与经验研究一致的时候,我们才会确信算法的合理性以及分析过程的正确性。为了说明该方法的合理性和正确性,本论文将从解析的结果与经验研究两方面对此算法进行了分析和研究。主要工作陈述如下:(1)对算法复杂性分析的方法、涉及的数学知识、研究现状和现实意义进行了综述性介绍。(2)研究了人工势场中斥力势函数和引力势函数的选取,重点研究了如何将激励学习模型转换成人工势场模型。(3)用网格世界问题对激励势场模型进行了测试。实验结果表明:该算法能简洁有效地给出理想的解。(4)给出了虚拟水流算法的数学模型,分析在最坏的情况下,其算法时间复杂度为O((n(n-1))/2)同时求出了算法的空间复杂度。(本文来源于《长沙理工大学》期刊2009-05-01)

万杰[2](2009)在《激励势场算法收敛性研究》一文中研究指出机器人学的研究进入了一个崭新的发展阶段,近年来,随着应用要求不断增强,机器人技术得到了持续发展。这样延伸出了许多新的技术研究领域,也带动了这些领域的技术水平的提高。其中,路径规划技术越来越多的受到研究者的关注,涌现出了一系列的新型路径规划方法。为了保障这些方法的严密性,各种规划方法收敛性方面的证明越来越受到研究者们的重视。本文旨在对激励势场模型中的虚拟水流算法的收敛性进行研究。该模型是结合激励学习与人工势场法并应用虚拟水流算法提出来的。仿真实验表明该算法能够克服势场法中的局部最小点问题,表明了该方法的正确性和有效性。本文对该算法的收敛性进行了数学上的证明。本文首先对课题研究的背景和现实意义进行了简要介绍,对算法特别是机器人导航方面的算法与收敛性方面的有关要点进行了阐述。并对国内外机器学习有关收敛性问题的研究进行了综述性介绍。其次对人工势场法及激励学习理论进行了说明。然后重点研究了如何将激励学习模型转换成人工势场模型,即利用激励学习和人工势场的优点应用虚拟水流法构建一个具有记忆学习功能的激励势场模型。在此基础上,给出了从虚拟水流算法中提炼出来的数学模型。最后,本文利用迭代理论及梯度理论等优化证明方法对该算法的收敛性进行了研究与证明。(本文来源于《长沙理工大学》期刊2009-03-01)

刘泽文[3](2008)在《基于人工势场的激励学习问题研究》一文中研究指出激励学习因具有较强的在线自适应性和对复杂系统的自学习能力,备受机器人导航研究者的关注。但其在连续状态和动作空间的泛化,局部环境的反应式控制,大状态空间和部分可观测环境定性导航等都存在着亟待解决的问题,且用传统的算法很难满意地解决这些问题。本文利用人工势场和激励学习的优点针对机器人在较大状态空间和部分可观测环境下的导航问题进行了研究。本文首先对激励学习研究现状,课题研究的背景和现实意义进行了综述性介绍,并分析了当前激励学习中两种比较成熟的方法,瞬时差分法和Q学习方法。其次,研究了人工势场中斥力势函数和引力势函数的选取,人工势场法的优缺点。然后重点研究了如何将激励学习模型转换成人工势场模型,即利用激励学习和人工势场的优点应用虚拟水流法如何构建一个具有记忆学习功能的激励势场模型。最后,用叁个着名的网格世界问题对激励势场模型进行了测试,同时在较大状态空间中用Q学习和HQ学习等方法做了对比实验。实验结果表明:对较大状态空间和部分可观测环境新方法都能简洁有效地给出理想的解;与Q学习和HQ学习等方法相比激励势场模型更稳定有效。(本文来源于《长沙理工大学》期刊2008-03-01)

易良[4](2007)在《基于激励学习和人工势场法的机器人路径规划》一文中研究指出近年来,随着应用要求不断增强,机器人技术得到了持续发展。作为一门高科技综合学科,机器人技术的发展延伸出了许多新的技术研究领域,也带动了这些领域的技术发展。其中,路径规划技术作为机器人系统中的一项关键技术,受到研究者们地一致关注。至今,随着机器人技术地不断发展,涌现出了一系列的新型路径规划方法。本文旨在结合激励学习方法和人工势场法,提出一种新的机器人路径规划方法。该方法利用激励学习理论中的奖赏函数建立势函数形成势场,然后从势场中提取奇异特征形成子目标点,再通过给予一定启发条件在线探索子目标,从而实现机器人路径规划。传统人工势场法中局部最小值问题一直是备受关注的问题。恰恰相反,本文方法中由于恰当利用局部最小值点形成子目标点,变弊为利,从而不存在此问题的困扰。仿真实验表明此方法有良好的可行性和有效性。(本文来源于《长沙理工大学》期刊2007-03-01)

激励势场论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

机器人学的研究进入了一个崭新的发展阶段,近年来,随着应用要求不断增强,机器人技术得到了持续发展。这样延伸出了许多新的技术研究领域,也带动了这些领域的技术水平的提高。其中,路径规划技术越来越多的受到研究者的关注,涌现出了一系列的新型路径规划方法。为了保障这些方法的严密性,各种规划方法收敛性方面的证明越来越受到研究者们的重视。本文旨在对激励势场模型中的虚拟水流算法的收敛性进行研究。该模型是结合激励学习与人工势场法并应用虚拟水流算法提出来的。仿真实验表明该算法能够克服势场法中的局部最小点问题,表明了该方法的正确性和有效性。本文对该算法的收敛性进行了数学上的证明。本文首先对课题研究的背景和现实意义进行了简要介绍,对算法特别是机器人导航方面的算法与收敛性方面的有关要点进行了阐述。并对国内外机器学习有关收敛性问题的研究进行了综述性介绍。其次对人工势场法及激励学习理论进行了说明。然后重点研究了如何将激励学习模型转换成人工势场模型,即利用激励学习和人工势场的优点应用虚拟水流法构建一个具有记忆学习功能的激励势场模型。在此基础上,给出了从虚拟水流算法中提炼出来的数学模型。最后,本文利用迭代理论及梯度理论等优化证明方法对该算法的收敛性进行了研究与证明。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

激励势场论文参考文献

[1].邓慈云.激励势场算法的复杂性研究[D].长沙理工大学.2009

[2].万杰.激励势场算法收敛性研究[D].长沙理工大学.2009

[3].刘泽文.基于人工势场的激励学习问题研究[D].长沙理工大学.2008

[4].易良.基于激励学习和人工势场法的机器人路径规划[D].长沙理工大学.2007

标签:;  ;  ;  ;  

激励势场论文-邓慈云
下载Doc文档

猜你喜欢