导读:本文包含了时滞随机最优控制论文开题报告文献综述及选题提纲参考文献,主要关键词:时滞系统,乘性噪声,最优估计,最优控制
时滞随机最优控制论文文献综述
梁笑[1](2018)在《具有时滞的乘性噪声随机系统最优估计和控制研究》一文中研究指出本文研究具有时滞的乘性噪声随机系统最优估计和控制问题.分别针对随机时滞系统的线性最优估计问题、通讯延时和数据丢包网络控制系统的最优估计和控制问题、输入时滞乘性噪声随机系统的线性二次高斯(LQG)问题、数据丢包多控制器系统的最优控制和镇定性问题以及多时滞乘性噪声随机系统的线性二次(LQ)问题进行了深入研究.主要学术贡献及创新点:第一,在没有时间戳标记的情形下,解决了具有随机时滞和数据丢包网络控制系统的线性最优估计问题.通过构造新的量测方程和自回归滑动平均模型(ARMA模型)-状态空间模型转换技术,将具有随机时滞的量测方程转化为标准的只含加性噪声的系统,利用标准卡尔曼滤波得到线性最优估计器.第二,有限时域下给出了具有通讯延迟和数据丢包网络控制系统最优估计器和最优控制器的显式解,无限时域下得到了闭环系统镇定的充要条件.另外,证明了闭环系统镇定只与系统矩阵特征值和丢包概率有关,与通讯延迟无关.第叁,针对具有输入时滞的乘性噪声随机系统LQG问题,当状态可以被完全观测时,首次给出了 LQG问题最优控制器的显式解,得到了最优控制器存在且唯一的充要条件,当状态被部分观测时,得到了次优线性状态估计反馈控制器.第四,针对具有丢包乘性噪声的多控制器系统最优估计和控制问题,利用极大值原理给出了有限时域最优控制器存在且唯一的充要条件,首次给出无限时域下闭环系统镇定的充要条件.在镇定性问题的研究中,根据最优性能指标构造Lyapunov函数的方法,为其他镇定性问题的研究提供了一种新思路.第五,本文研究了多状态时滞系统和多输入时滞系统的有限时间随机LQ问题,与已有文献要求控制加权矩阵为正定不同,本文只要求控制加权矩阵为半正定,给出了最优控制器的显式解.具体研究内容按照章节顺序包括如下几个方面:1.研究了同时具有随机时滞和丢包的网络控制系统线性最优估计问题.在没有时间戳标记的情形下,将同一时刻接收到的所有量测之和定义为一个新的量测,于是随机时滞量测系统转化为具有多个定常时滞和乘性噪声的量测系统,其中乘性噪声用已知概率分布的二进制随机变量来表示.利用ARMA模型-状态空间模型转换技术和标准的卡尔曼滤波得到线性最优估计器.进一步分析了估计器的收敛性和稳定性.2.针对网络控制系统中同时具有通讯延迟和数据丢包的最优估计和控制问题.首先,根据受丢包影响的量测信号得到了最优估计器,基于最优估计器和标准的里卡蒂方程给出了最优的LQR控制器.需要指出的是,最优估计器和最优控制器可以分开计算.其次,得到了闭环系统均方镇定的充要条件.需要强调的是闭环系统镇定只与系统矩阵的特征值和丢包概率有关,与输入时滞无关.3.研究了具有输入时滞的乘性噪声系统LQG问题.首先,当状态可以被精确观测时,得到了最优的LQG控制器,该控制器由状态的条件期望和基于耦合里卡蒂方程的加性确定项组成.利用完全配方法和正倒向差分方程的解,得到了最优控制器的显式解.其次,当状态被部分观测时,得到了线性最优估计器,通过线性化线性最优估计器并利用得到的最优LQG控制结果,给出了次优线性状态估计反馈控制器.4.研究了当地控制器和远程控制器同时作用在网络控制系统的最优控制和镇定性问题.基于受丢包影响的量测信号给出了最优估计器,利用最优估计器和两个耦合的里卡蒂方程得到了有限时域最优控制器存在的充要条件.当没有加性噪声时,闭环系统在均方意义下可镇定当且仅当两个代数里卡蒂方程有唯一解.当加性噪声存在时,给出了闭环系统在均方意义下有界的充分条件.5.针对具有多状态时滞/多输入时滞的乘性噪声随机系统LQ问题,分别给出了最优LQ控制器的显式解.对于多状态时滞情形,最优LQ控制器是当前状态和历史状态的线性函数.对于多输入时滞情形,最优LQ控制器是状态和历史输入的线性函数.关键技术是基于耦合里卡蒂方程来定义值函数和完全配方法.(本文来源于《山东大学》期刊2018-05-12)
张久霜[2](2018)在《有乘噪声的随机离散时滞系统最优控制问题及其应用》一文中研究指出本文研究了有乘噪声的随机离散时滞系统最优控制问题及其在通讯网络中的应用,运用自适应动态规划迭代算法给出了该系统的最优控制.在随机控制系统中,信号在传输时不可避免的会产生时间延迟,在无线网络控制系统中,传感器、促动器和控制器在网络中进行数据传输时也会产生延时和丢包问题.于是,本文模拟了有乘噪声的随机离散时滞系统,运用动态规划的方法给出了系统的最优解.在此基础上,又讨论了有网络诱导延迟和丢包的无线网络控制系统,并解决了其最优控制问题.本文通过动态规划的方法设计了使有乘噪声的随机离散时滞系统的目标函数最小的控制策略,解决了有网络诱导延迟和丢包的无线网络系统的最优控制问题,给出了最优控制的一般形式,并给出了问题的仿真实例,表明了自适应动态规划方法在该类问题上的可行性及适用性.(本文来源于《曲阜师范大学》期刊2018-03-28)
王建龙,魏立峰[3](2017)在《一类时滞随机最优松驰控制的最大值原理》一文中研究指出本文通过引入更为一般的松驰控制过程,考虑带有时滞的随机最优控制系统,以解决控制集合U受到凸性条件限制的问题。在Hamilton函数满足关于状态变量和控制变量存在凹性假设的条件下,借助对偶方法和超前倒向随机微分方程的良好性质,给出了带有时滞的随机最优松驰控制问题的最大值原理。(本文来源于《中国海洋大学学报(自然科学版)》期刊2017年S1期)
许洁[4](2017)在《时滞重随机控制系统的随机最大值原理及其应用》一文中研究指出本文主要研究当状态方程是包含时滞的重随机微分方程时的最优控制问题.首先利用鞅表示定理和压缩映像原理给出含有时滞的重随机微分方程解的存在唯一性条件.进而在控制域为凸的假设下,利用经典的变分法给出最优控制所满足的必要条件,得到时滞重随机控制系统的最大值原理,并将此结论应用到线性二次最优控制问题中,得到最优控制的显示表达式.此外,我们对线性正倒向重随机Hamilton系统进行研究,定义相应的矩阵Riccait方程,在适当的假设条件下,给出一类线性正倒向重随机微分方程解的存在唯一性条件.由于Riccati方程是求解线性二次最优控制问题的关键,本文利用倒向随机微分方程的理论讨论了一类倒向随机Riccati方程解的存在唯一性条件.(本文来源于《吉林大学》期刊2017-06-01)
滕俊超,朱位秋[5](2016)在《谐和与宽带随机激励下拟可积哈密顿系统的最优时滞控制》一文中研究指出研究在谐和与宽带随机激励下拟可积哈密顿系统的最优时滞控制。首先,简要叙述谐和与宽带随机激励下的最优时滞控制问题的提法;其次,将时滞的控制力用非时滞的状态变量近似表示,从而将原时滞控制系统转换为非时滞的控制系统;然后,考虑到系统固有频率与谐和激励频率之间可能的共振关系,运用随机平均法,得到部分平均It随机微分方程,再运用随机动态规划原理,建立动态规划方程,即Hamilton-Jacobi-Bellman(HJB)方程,求解得到控制力,通过求解与完全平均的It随机微分方程对应的Fokker-Planck-Kolmogorov(FPK)方程或者Monte Carlo数值模拟得到系统的响应;最后,将上述控制策略应用于潜水艇纵轴振动控制,并通过Monte Carlo数值模拟结果来评估这一控制策略的控制效果和控制效率。(本文来源于《振动工程学报》期刊2016年02期)
滕俊超[6](2015)在《谐和与宽带随机激励下拟可积哈密顿系统的最优时滞控制》一文中研究指出本文研究在谐和与宽带随机激励下拟可积哈密顿系统的最优时滞控制问题。首先,简要叙述谐和与宽带随机激励下的时滞最优控制问题的一般提法;其次,将时滞的控制力用非时滞的状态变量近似表示,从而将原时滞受控系统转换为非时滞的受控系统;然后,考虑到系统频率与谐和激励频率之间可能的共振关系,运用广义谐和函数平均法,将系统状态从位移和速度的形式转换为能量与相位差的形式,得到新的部分平均Ito随机微分方程,再根据随机动态规划原理,建立动态规划方程,即Hamilton-Jacobi-Bellman(HJB)方程,求解得到控制力的具体形式,通过求解与完全平均的Ito微分方程对应的Fokker-Planck-Kolmogorov (FPK)方程或者Monte Carlo数值模拟得到系统的响应;最后,将上述控制策略应用于一个潜水艇纵轴振动控制系统并利用Monte Carlo数值模拟结果,通过控制效果和控制效率来评估本文研究的控制策略。(本文来源于《浙江大学》期刊2015-06-10)
杨园华,韩春艳,刘晓华[7](2014)在《有界随机测量时滞的网络控制系统的最优估计(英文)》一文中研究指出在假设测量没有丢包的情况下,研究了带有随机测量时滞的网络控制系统的最优估计问题.利用已知的时滞分布概率,建立新的模型来描述随机时滞测量.进一步将带有时滞的测量等价成每个通道是单时滞的多通道测量,从而利用新息重组方法,通过求解黎卡提方程求解最优估计器.最后给出仿真实例验证了该算法的有效性.(本文来源于《控制理论与应用》期刊2014年02期)
王汀[8](2013)在《带约束的非线性时滞随机最优控制系统》一文中研究指出本文以控制输入带约束且含时滞的非线性随机系统作为研究对象,寻找最优控制使得代价函数达到最小。我们设计了这一类随机控制问题的局部最优控制算法,其主要步骤是:首先根据欧拉公式和泰勒展开式,将连续型的随机控制系统作离散化处理,这样原问题就转化为以某个确定性控制律及其相应的状态轨迹的增量表示的线性二次高斯问题,再利用贝尔曼动态规划原理求解满足约束条件并使得代价函数最小的局部最优控制律及其相应的最优状态轨迹。特别地,当代价函数为二次型时,我们证明了Hessian矩阵H是正定的,从而也就证明了线性二次高斯问题的最优控制是存在的。最后我们以双关节六块肌肉手臂模型作为数值模拟的例子,验证了算法的可行性和有效性,同时还对该手臂模型的某些参数作了敏感性分析。(本文来源于《华东理工大学》期刊2013-12-04)
徐忠四[9](2013)在《粘弹性胶体缓冲器非线性时滞动力系统建模及随机最优控制研究》一文中研究指出粘弹性胶体缓冲器是履带车辆悬挂系统的一个部件,对车辆平顺性、缓冲性和悬挂系统的正常工作有着至关重要的作用。粘弹性胶体缓冲器主要由粘弹性胶体、活塞、缸体等组成。粘弹性胶体是一种可压缩的聚硅氧烷材料,其性能介于液压油和橡胶之间。当受到外力作用时,活塞压缩粘弹性胶体,吸收能量并储存势能;当外力消失后,粘弹性胶体膨胀,推动活塞回位。设计粘弹性胶体缓冲器时,最关键的是要建立阻抗力与活塞位移和速度之间的数学模型,其中的刚度与阻尼也随着活塞位移和速度发生变化。从数学上讲,阻抗力与活塞位移、速度、刚度、阻尼之间的关系是非线性时滞动力系统的本构关系。该本构关系是一非线性泛函,具有明显的非光滑、强非线性特性。描述非线性时滞动力系统的数学模型是非线性时滞微分方程(组)。本文采用理论分析与试验研究相联合的方法,研究了非线性时滞动力系统的解法、数学建模方法及随机最优控制理论,确定了缓冲器刚度和阻尼的调控范围,建立了阻抗力与活塞位移、速度、刚度、阻尼之间的关系,推导出非线性悬挂与线性悬挂之间的最佳阻尼比,为胶体缓冲器和车辆悬挂系统的动力学匹配提供了理论指导和方法依据。在非线性时滞动力系统的解法研究中,根据时滞微分方程的分类,介绍了时滞微分方程解的存在性和唯一性定理;对一阶和二阶时滞微分方程进行了振动性分析,讨论了微分方程振动解和非振动解存在的条件,为后续冲击性能试验提供理论支撑;介绍了时滞微分方程的稳定性概念,分析了时滞微分方程和常微分方程稳定性的本质不同,基于常微分方程奈奎斯特(Nyquist)稳定性判据和时滞微分方程稳定性切换分析方法,将二者有机联合讨论了时滞系统稳定性区间的稳定性分析方法,为后续的研究和讨论奠定了基础。从理论上定性分析了履带车辆悬挂系统的非线性特性,初步探索了非线性悬挂系统中胶体缓冲器的刚度变化规律。在此基础上为了定量研究胶体缓冲器的刚度变化规律,建立了非线性悬挂系统的动力学方程组。从数学上讲,上述方程组的求解问题涉及到非线性微分方程的解法研究,针对求解非线性微分方程没有统一而普适方法的问题,讨论了初值变换法和增量谐波平衡非线性参数辨识法用于求解强非线性方程的周期解,并且分析了两种解法的优缺点。基于上述研究,综合了初值变换法的非线性等效处理优点和增量谐波平衡法的灵活控制算法的收敛性优点,提出了一种无条件稳定的线性加速度逐步积分法对非线性方程组进行数值求解的新方法。利用该方法以装有胶体缓冲器的非线性悬挂为例,详细研究了非线性悬挂动力学微分方程的数值求解过程,最终获得了胶体缓冲器的刚度与压缩位移之间关系式,为胶体缓冲器的设计和数学建模提供了理论依据。在数学建模方法中,研究了非线性时滞动力系统的动刚度和动阻尼特性,提出了一种非线性时滞动力系统时域与频域相联合的数学建模方法,建立了阻抗力与位移、速度、频率、振幅和阻尼系数之间时域频域相统一的数学模型,并且用非线性参数的优化分离辨识方法对该模型的参数进行参数辨识。在此基础上,用变刚度的Maxwell流体模型对粘弹性胶体缓冲器进行数学建模。分别推导了该胶体缓冲器在进程和回程过程中的阻抗力公式,并用冲击试验验证该模型的可行性。基于随机最优控制理论,分析了胶体缓冲器在车辆悬挂系统中的四种布置方案,确定了履带车辆悬挂系统的性能评价指标,建立了履带车辆整车悬挂系统的动力学方程。为了确定粘弹性胶体缓冲器最佳阻尼比的调控范围,研究了粘弹性胶体缓冲器和车辆悬挂系统的动力学匹配,本质是研究非线性时滞动力系统随机最优控制问题。研究了白噪声和非白噪声激励下的非线性系统的能量包线随机平均法与动态规划原理,提出了将二者联合起来研究非线性时滞动力系统随机最优控制问题的方法,得到非线性时滞动力系统的最优控制规律。将该最优控制规律与悬挂系统的平顺性和缓冲性能指标相联合,推导出了悬挂系统的绝对加速度和相对位移的均方根值与胶体缓冲器的阻尼比的关系式,为胶体缓冲器和车辆悬挂系统的动力学匹配研究提供了理论依据;将该最优控制规律与履带车辆整车悬挂系统的动力学方程相联合,推导出了车辆垂直振动加速度与车速、路况和阻尼比之间的关系式,进而确定了最佳阻尼比的调控范围。最后,用RecurDyn软件对履带车辆在E级和G级路面上进行了整车建模和仿真分析,表明本文设计的胶体缓冲器能够有效地改善悬挂系统的性能。将设计好的胶体缓冲器进行静压和动压试验,在不同速度下进行多次试验,验证了胶体缓冲器能够达到所要求的技术性能指标,并验证了胶体缓冲器具有良好的抗冲击特性和稳定性。(本文来源于《中北大学》期刊2013-05-31)
邢蕾[10](2012)在《时滞带跳随机问题的最优控制理论研究》一文中研究指出本文考虑时滞带跳随机问题的最优控制问题.在Chen, Wu, Hu,(?)ksendal, Di Nunno等人的工作基础上,应用前人提出的重要思想,将已有结果进行了推广和深入研究.主要结论有叁:一是时滞带跳随机系统的最大值原理和最优控制存在的充分条件;二是在最大值原理基础上,研究时滞带跳随机系统的线性二次控制问题,包括时滞带跳随机系统最优控制的显性表达式,广义Riccati方程的建立,以及一类带时滞状态与控制变量的性能指标问题的线性二次控制;叁是应用Malliavin分析和前向积分等工具,研究了带跳随机Volterra方程的非适应控制问题,给出了该问题的广义最大值原理,将这一结论应用于经济中用带跳时滞随机系统描述的现金流的最优控制问题.最后,我们还对今后的工作做了展望.(本文来源于《吉林大学》期刊2012-12-01)
时滞随机最优控制论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文研究了有乘噪声的随机离散时滞系统最优控制问题及其在通讯网络中的应用,运用自适应动态规划迭代算法给出了该系统的最优控制.在随机控制系统中,信号在传输时不可避免的会产生时间延迟,在无线网络控制系统中,传感器、促动器和控制器在网络中进行数据传输时也会产生延时和丢包问题.于是,本文模拟了有乘噪声的随机离散时滞系统,运用动态规划的方法给出了系统的最优解.在此基础上,又讨论了有网络诱导延迟和丢包的无线网络控制系统,并解决了其最优控制问题.本文通过动态规划的方法设计了使有乘噪声的随机离散时滞系统的目标函数最小的控制策略,解决了有网络诱导延迟和丢包的无线网络系统的最优控制问题,给出了最优控制的一般形式,并给出了问题的仿真实例,表明了自适应动态规划方法在该类问题上的可行性及适用性.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
时滞随机最优控制论文参考文献
[1].梁笑.具有时滞的乘性噪声随机系统最优估计和控制研究[D].山东大学.2018
[2].张久霜.有乘噪声的随机离散时滞系统最优控制问题及其应用[D].曲阜师范大学.2018
[3].王建龙,魏立峰.一类时滞随机最优松驰控制的最大值原理[J].中国海洋大学学报(自然科学版).2017
[4].许洁.时滞重随机控制系统的随机最大值原理及其应用[D].吉林大学.2017
[5].滕俊超,朱位秋.谐和与宽带随机激励下拟可积哈密顿系统的最优时滞控制[J].振动工程学报.2016
[6].滕俊超.谐和与宽带随机激励下拟可积哈密顿系统的最优时滞控制[D].浙江大学.2015
[7].杨园华,韩春艳,刘晓华.有界随机测量时滞的网络控制系统的最优估计(英文)[J].控制理论与应用.2014
[8].王汀.带约束的非线性时滞随机最优控制系统[D].华东理工大学.2013
[9].徐忠四.粘弹性胶体缓冲器非线性时滞动力系统建模及随机最优控制研究[D].中北大学.2013
[10].邢蕾.时滞带跳随机问题的最优控制理论研究[D].吉林大学.2012