摆起倒立论文-毛文杰

导读:本文包含了摆起倒立论文开题报告文献综述及选题提纲参考文献，主要关键词:倒立摆,强化学习,最小二乘策略迭代,核方法

摆起倒立论文文献综述

毛文杰^[1]（2018）在《强化学习在倒立摆起摆及平衡控制中的应用研究》一文中研究指出倒立摆系统是一个典型的多变量、非线性、高阶次、强耦合的自不稳定系统,只有采用行之有效的控制方法才能使其稳定在平衡位置附近。控制中的许多关键问题,如跟踪问题、镇定问题、鲁棒性问题、非线性问题等都能在倒立摆的控制过程中反映出来。同时,双足机器人的行走、卫星和火箭的位姿调整等均与倒立摆系统具有相似之处。因此,对倒立摆系统的研究具有重要的理论价值和应用价值。传统的倒立摆控制方法如PID控制、LQR控制等都是基于模型的控制,实际中很难获得倒立摆系统的精确的数学模型。强化学习作为机器学习的一种,其与监督学习不同之处在于其不需要教师信号,它强调与环境的交互过程中获得评价性反馈信号,利用评价信息来实现行为决策的优化,不需要知道系统模型,这就避免了因建模造成的误差。因此,本文将强化学习应用于倒立摆的起摆及平衡控制任务中,重点研究了强化学习算法在倒立摆平衡控制中的应用。本文的主要成果有:(1)起摆控制方面,研允了基于Q学习算法的倒立摆起摆控制。一级倒立摆起摆仿真控制实验表明了Q学习算法在倒立摆起摆控制中的有效性。(2)平衡控制方面,在深入研究实现了最小二乘策略迭代(Least Square Policy Itcration,LSPI)以及基于稀疏核机器的最小二乘策略迭代(Kernel-based LSPI,KLSPI)两种有效的解决倒立摆平衡控制问题的强化学习算法的基础上,针对LSPI算法逼近能力、泛化能力差,KLSPI算法计算复杂度高、计算成本大的问题,提出了一种基于极限学习机(Extreme Learning Machine,ELM)的最小二乘策略迭代(ELM-LSPI)算法,在提高传统LSPI算法逼近精度、泛化能力的同时,控制了其计算成本。一级倒立摆控制仿真实验结果表明KLSPI算法和本文提出的ELM-LSPI算法均能提高LSPI算法的收敛能力和泛化能力,但ELM-LSPI算法的计算成本远小于KLSPI算法,更利于后续的实物研究和在线算法的拓展。(本文来源于《西安理工大学》期刊2018-06-30）

孙成安^[2]（2018）在《体操机器人摆起和倒立平衡的控制研究》一文中研究指出体操机器人是根据仿生思想而设计的一种教学娱乐用机器人,它的驱动装置数目通常比自身的自由度数目要少,因而是欠驱动机器人。欠驱动系统具有高度非线性、时变和强耦合的特点,在控制方面具有很大的挑战;具有成本低、重量轻的特点,可以应用在航空航天等对能量消耗有严格要求的领域,前景非常广阔。因而,欠驱动系统的控制研究具有重要的理论和应用价值。首先,本文在查阅了大量国内外关于体操机器人文献的基础上,将Acrobot机器人模型作为研究欠驱动系统控制问题的一个重要参考,采用Lagrange方程建立了所研究体操机器人的动力学模型,并对其所要完成的摆起和大回环动作进行了分析,分析结果表明在运动过程中机器人手爪的受力最大。在此分析基础上利用ANSYS软件对手爪受力状态进行了应力分析。体操机器人的动力学模型在Matlab/Simulink平台上完成,其正确性通过数学仿真得以验证。其次,推导了体操机器人的摇起、大回环和倒立平衡控制算法。根据哈密顿方程证明其运动控制不能使用线性思维进行研究;本文采用了两种不同算法用于实现摇起控制,这两个算法都是基于部分反馈线性化而提出的,它们设计理念是相同的,那就是均利用积分反演的方式。倒立平衡问题是把动力学方程在倒立平衡的位置进行近似线性化,并判断方程的可控性,然后采用LQR算法对各个参数计算。再次,根据体操机器人实物动力学模型及上述控制算法,在Matlab/Simulink及ADAMS中对部分反馈线性化方法进行了数学和机构仿真分析,可以看出,在主动关节摇起过程中体操机器人的能量得以蓄积,重心不断提升,实现了机器人的倒立平衡,完成了机器人的大回环运动。同时,也获得了主动关节的力矩曲线,从而方便电机的选型。最后,搭建实物平台,并在平台上利用前述控制方法完成体操机器人的摇起及大回环控制实验。实验结果表明本文设计的控制算法可以实现预期设定的体操动作。(本文来源于《哈尔滨工业大学》期刊2018-06-01）

刘继光,王丽军,袁浩^[3]（2015）在《自立倒立摆系统的自摆起及稳定控制》一文中研究指出首先基于拉格朗日方程建立了自立倒立摆系统的数学模型,然后采用线性二次型最优控制与PD控制相结合的控制方法,并通过设计开关控制来实现2个控制器的切换,最终实现对倒立摆系统的自摆起和稳定控制。(本文来源于《实验技术与管理》期刊2015年11期）

但远宏,徐鹏,谭智,李祖枢^[4]（2015）在《旋转二级倒立摆摆起倒立混合控制》一文中研究指出参考仿人智能控制思想,提出一种混合控制策略,实现了旋转二级倒立摆摆起倒立控制。将旋转二级倒立摆的摆起倒立稳定过程分为能量累积、姿态调整以及稳定控制叁个阶段。基于无源系统理论的分析方法设计出摆杆的能量累积策略,以动力学分析方法设计出摆杆的姿态调整策略,以局部线性化方法进行摆杆的倒立稳定控制。仿真和实时实验结果证明了算法的有效性。(本文来源于《世界科技研究与发展》期刊2015年05期）

尹亚光^[5]（2013）在《基于非线性时间序列模型的倒立摆起摆预测控制研究》一文中研究指出倒立摆是一种常见的验证控制算法的自然不稳定实验装置,具有典型的多变量、非线性、强耦合特性。对其进行研究是检验各种控制算法是否有效的重要途径,也具有工程应用价值。本文主要研究了RBF-ARX非线性时间序列建模方法和预测控制在一级直线倒立摆系统起摆控制中的应用。传统对倒立摆控制的研究多数基于其物理模型,需要对其运动机理进行准确的分析,存在一些缺点：由于有些参数难以精确测量,建模时进行了一定程度上的简化,影响了模型的精确度。本文采取模型辨识的方法建立倒立摆模型,克服了物理建模的不足。RBF-ARX模型全称为具有径向基函数神经网络型系数的带外生变量的自回归模型,用RBF神经网络来逼近ARX模型中的函数系数。这样它既具有RBF网络优秀的逼近性能,也能利用ARX模型中的自回归与滑动平均结构来控制模型的复杂度。在此基础上,设计了数据辨识实验,用采集到的数据进行RBF-ARX模型辨识。文中详细说明了模型参数的初始化方法,利用结构化非线性参数优化方法SNPOM进行参数寻优,以及如何根据AIC准则与其它因素对模型阶次进行估计。之后建立了倒立摆起摆与稳摆阶段的两个RBF-ARX单输入单输出模型,并在平衡位置增加位置控制,建立了一输入两输出的RBF-ARX模型,经过数据检验,证明RBF-ARX模型具有较高的精度。利用辨识到的模型,设计预测控制器。通过选择适当的角度进行模型切换,进行单输入单输出与一输入二输出系统仿真,取得了较好的效果。最后进行实时控制实验,实现了直线一级倒立摆的起摆,对其角度进行了控制。通过与能量反馈起摆效果进行比较,证明基于RBF-ARX模型的预测控制在倒立摆类非线性、快速系统中的有效性。(本文来源于《中南大学》期刊2013-05-01）

汪青华^[6]（2013）在《基于偏差函数的倒立摆起摆策略研究》一文中研究指出倒立摆系统作为一个复杂、不稳定的非线性系统,在控制理论与控制算法的验证方面起着重要作用。倒立摆系统的研究方法与思想也被广泛用于双足机器人行走的平衡控制、多级火箭发射控制及卫星姿态控制等多个重要研究方向。倒立摆系统以其成本低、结构相对简单、参数易于调整等优点,一直吸引着人们的关注和研究。如何快速实现倒立摆的起摆,并在较大角度范围内实现倒立摆的稳摆是一个重要的控制问题。本论文提出了一种基于偏差函数的起摆策略,依次分别对一级倒立摆和二级倒立摆进行起摆控制。本文的主要工作如下：(1)建立了倒立摆系统的非线性数学模型,在平衡点附近进行了处理,使其在局部可以当做一个线性模型来求解。并分析了倒立摆系统在平衡点处的能控性、能观测性和稳定性。(2)针对一级倒立摆系统,设计并仿真实现了基于偏差函数的起摆控制策略。通过引入一个与角度相关的偏差函数来调节控制量,其优点在于当摆杆处于自然下垂状态时施加的控制量比较大,易于实现快速起摆,也便于调节控制参数。在满足设定条件时,误差反馈函数可以设计成多种形式。与能量控制、模糊控制、棒棒控制等常用的起摆控制方法相比,基于误差反馈的方法能在较短的时间内实现起摆。在选取同样的反馈函数并设定相同初始控制量的情况下,对不同长度摆杆的倒立摆系统进行了起摆控制仿真。结果显示摆杆能够在短时间内被甩到竖直向上的平衡位置,这说明基于误差反馈的控制策略具有鲁棒性。(3)将所提出的误差反馈方法应用于二级倒立摆的起摆控制器设计。首先,采用逐级起摆方式,根据摆杆起摆的过程,设计叁个不同的控制器；然后,采用同步起摆方式,同步起摆的控制算法与逐级起摆基本相同,只是在控制参数上存在一定差异；仿真结果显示,误差反馈的算法实现了二级倒立摆系统的起摆控制,使得起摆控制参数调节更加方便；最后,分两种情况变换摆杆的长度,仿真验证误差反馈算法的鲁棒性。(4)最后,在上述仿真工作的基础上,进行了一级倒立摆起摆控制实验。通过实物验证了所设计控制方案的有效性。(本文来源于《大连理工大学》期刊2013-04-25）

陈聪^[7]（2012）在《直线倒立摆摆起与平衡控制的研究与实现》一文中研究指出倒立摆是一个典型的高阶次、多变量、强耦合的自然不稳定非线性系统,有着深厚的理论研究和工程应用背景,其控制难度将随着摆杆数的增加而不断增大。被控对象越复杂,就越是难以建立精确地数学模型,而倒立摆系统本身又具有极强的非线性和不稳定性,使得针对线性化模型进行控制系统设计的各种理论在解决倒立摆这类复杂系统的控制问题时也显得无能为力。因此,基于现有研究成果,本文得到一种新的控制律计算方法,称之为动态设计变量优化方法。该方法具有一定的有效性和实用性,可用于解决该类非线性问题。本文以直线倒立摆为研究对象,针对直线倒立摆非线性系统的摆起控制和平衡控制问题进行研究,主要工作内容如下：首先,阐述了倒立摆的系统特性、发展历程和研究现状,说明了该类研究在工程实践和控制理论发展中的价值和意义,介绍了倒立摆系统的分类和控制问题的类型,并提出本文的主要工作内容。其次,对直线一级和二级倒立摆系统的简化模型进行受力分析和数学计算,应用达朗贝尔原理和分析力学原理,建立了相对较为精确的直线一级和二级倒立摆的非线性力学模型,分别得到相应的系统微分方程,为后面的研究奠定基础。再次,以系统微分方程为基础,运用动态设计变量优化算法,利用Visual Fortran Powerstation4.0编写优化计算和仿真分析程序,获得摆起控制和平衡控制的相关数据,对直线一级和二级倒立摆的摆起控制和平衡控制进行计算和仿真,验证了动态设计变量优化算法在倒立摆控制问题中的可行性和有效性。然后,以直线一级倒立摆为研究对象,介绍了倒立摆装置的组成和结构,简述了简易倒立摆装置的设计和制作过程,完成该装置的设计、制作和安装,并进行了控制演示实验,为今后的研究打下了一定的基础。最后,对全文所做的工作进行总结,针对现阶段工作的不足,确定今后研究工作的内容和重心,并对未来进一步的研究和实践提出展望和设想。(本文来源于《沈阳建筑大学》期刊2012-11-01）

张永立,程会锋,李洪兴^[8]（2011）在《逆系统轨迹控制二级倒立摆自动摆起》一文中研究指出将逆系统轨迹控制应用于二级倒立摆的自动摆起控制系统,离线求解非线性方程两点边值问题,得到系统的参考轨迹;采用逆系统前馈控制和基于H∞控制的增益调度反馈控制对参考轨迹进行精确跟踪,实现二级倒立摆的自动摆起;当两摆杆摆起到竖直倒立位置后,采用变增益H∞反馈控制器进行稳定控制.仿真实验结果表明,该方案在较短的摆起时间内实现了二级倒立摆两摆杆的自动摆起,稳定性和鲁棒性明显提高.(本文来源于《大连理工大学学报》期刊2011年06期）

张永立,李洪兴,苗志宏,程会锋^[9]（2011）在《基于变增益LQR控制方法的二级倒立摆自动摆起》一文中研究指出为了实现导轨受限情况下二级倒立摆非线性系统的自动摆起控制,提出了基于变增益LQR控制方法的自动摆起控制方案.首先,基于Lyapunov函数,设计了变参数切换控制器,通过限制小车运动的最大速度,将小车位移控制在一定的范围内,并将第一级摆杆从下垂位置摆起到倒立位置;其次,采用变增益LQR控制方法将第一级摆杆稳定在倒立位置,同时,采用等效小车法将第二级摆杆摆起到倒立位置;最后,采用变增益LQR控制方法将两摆杆同时稳定在倒立平衡点.变增益LQR控制器的鲁棒性较强,避免了由于摆杆状态变化而引起小车位移的冲击.仿真和实物实验均验证了该控制方案的有效性.(本文来源于《系统工程理论与实践》期刊2011年07期）

张永立,程会锋,李洪兴^[10]（2011）在《叁级倒立摆的自动摆起与稳定控制》一文中研究指出采用非线性逆系统轨迹控制实现叁级倒立摆的自动摆起,并设计了变增益LQR控制器将其稳定在竖直倒立位置.首先,叁级倒立摆从静止下垂状态摆起到竖直倒立位置的过程,从数学角度看是一个两点边值问题,通过求解该两点边值问题获得摆起的标称轨迹,利用逆系统方法设计前馈控制,同时结合增益调度反馈控制使摆起过程稳定;其次,在稳定控制阶段,采用基于逐点线性化的变增益LQR控制器,实现倒立摆的稳定控制.仿真实验验证了本方案的有效性.(本文来源于《控制理论与应用》期刊2011年01期）

摆起倒立论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

体操机器人是根据仿生思想而设计的一种教学娱乐用机器人,它的驱动装置数目通常比自身的自由度数目要少,因而是欠驱动机器人。欠驱动系统具有高度非线性、时变和强耦合的特点,在控制方面具有很大的挑战;具有成本低、重量轻的特点,可以应用在航空航天等对能量消耗有严格要求的领域,前景非常广阔。因而,欠驱动系统的控制研究具有重要的理论和应用价值。首先,本文在查阅了大量国内外关于体操机器人文献的基础上,将Acrobot机器人模型作为研究欠驱动系统控制问题的一个重要参考,采用Lagrange方程建立了所研究体操机器人的动力学模型,并对其所要完成的摆起和大回环动作进行了分析,分析结果表明在运动过程中机器人手爪的受力最大。在此分析基础上利用ANSYS软件对手爪受力状态进行了应力分析。体操机器人的动力学模型在Matlab/Simulink平台上完成,其正确性通过数学仿真得以验证。其次,推导了体操机器人的摇起、大回环和倒立平衡控制算法。根据哈密顿方程证明其运动控制不能使用线性思维进行研究;本文采用了两种不同算法用于实现摇起控制,这两个算法都是基于部分反馈线性化而提出的,它们设计理念是相同的,那就是均利用积分反演的方式。倒立平衡问题是把动力学方程在倒立平衡的位置进行近似线性化,并判断方程的可控性,然后采用LQR算法对各个参数计算。再次,根据体操机器人实物动力学模型及上述控制算法,在Matlab/Simulink及ADAMS中对部分反馈线性化方法进行了数学和机构仿真分析,可以看出,在主动关节摇起过程中体操机器人的能量得以蓄积,重心不断提升,实现了机器人的倒立平衡,完成了机器人的大回环运动。同时,也获得了主动关节的力矩曲线,从而方便电机的选型。最后,搭建实物平台,并在平台上利用前述控制方法完成体操机器人的摇起及大回环控制实验。实验结果表明本文设计的控制算法可以实现预期设定的体操动作。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

摆起倒立论文参考文献

[1].毛文杰.强化学习在倒立摆起摆及平衡控制中的应用研究[D].西安理工大学.2018

[2].孙成安.体操机器人摆起和倒立平衡的控制研究[D].哈尔滨工业大学.2018

[3].刘继光,王丽军,袁浩.自立倒立摆系统的自摆起及稳定控制[J].实验技术与管理.2015

[4].但远宏,徐鹏,谭智,李祖枢.旋转二级倒立摆摆起倒立混合控制[J].世界科技研究与发展.2015

[5].尹亚光.基于非线性时间序列模型的倒立摆起摆预测控制研究[D].中南大学.2013

[6].汪青华.基于偏差函数的倒立摆起摆策略研究[D].大连理工大学.2013

[7].陈聪.直线倒立摆摆起与平衡控制的研究与实现[D].沈阳建筑大学.2012

[8].张永立,程会锋,李洪兴.逆系统轨迹控制二级倒立摆自动摆起[J].大连理工大学学报.2011

[9].张永立,李洪兴,苗志宏,程会锋.基于变增益LQR控制方法的二级倒立摆自动摆起[J].系统工程理论与实践.2011

[10].张永立,程会锋,李洪兴.叁级倒立摆的自动摆起与稳定控制[J].控制理论与应用.2011

标签：倒立摆; 强化学习; 最小二乘策略迭代; 核方法;

摆起倒立论文-毛文杰

摆起倒立论文文献综述

摆起倒立论文开题报告

摆起倒立论文参考文献

猜你喜欢