随机最大值原理论文-张宇

随机最大值原理论文-张宇

导读:本文包含了随机最大值原理论文开题报告文献综述及选题提纲参考文献,主要关键词:随机发展方程,随机生成元,最大值原理

随机最大值原理论文文献综述

张宇[1](2019)在《具随机生成元的受控随机发展方程的Pontryagin型最大值原理(英文)》一文中研究指出本文研究了当控制区域是凸集时带有随机生成元的受控正向随机发展方程的Pontryagin型最大值原理.运用Malliavin分析方法,本文给出了当p≥2时控制系统温和解的存在唯一性,运用转置方法获得了当1<q≤2时对偶系统的适定性,并运用凸变分方法推导了相应的最大值原理.(本文来源于《四川大学学报(自然科学版)》期刊2019年03期)

李瑞敬[2](2019)在《平均场正倒向随机控制系统的最大值原理》一文中研究指出该文研究具有时间不连续效用函数的平均场随机系统最优控制问题.其中,扩散项系数包含控制变量且控制区域非凸.借助于延拓的Ekeland变分原理及递归方法,建立平均场理论框架下一般形式的随机最大值原理.最后,求解一个线性二次问题以论证结果的可行性.(本文来源于《数学物理学报》期刊2019年01期)

陈雁楠[3](2018)在《带约束的随机递归最优控制问题的全局最大值原理》一文中研究指出Pontryagiin及其团队[1]在二十世纪五十年代首次提出了确定性最优控制系统的最大值原理,但因为随机积分的存在该原理不能平行推广到随机最优控制系统中,Peng[5]通过对变分进行二阶泰勒展开得到经典的随机最大值原理。Duffie和Epstein[11]引入了连续时间下递归效用的概念,之后,有很多学者研究了随机递归最优控制系统的局部最大值原理。然而,全局最大值原理却未得到解决,Peng[21]提出如下公开问题:“当函数f非线性依赖于z时的全局最大值原理是公开问题”。该公开问题的主要难点是状态变量的二阶变分方程和二阶伴随方程未知。最终,Hu[26]通过引入两个新的伴随方程克服了这两个难点,并得到随机递归最优控制系统的全局最大值原理。本文主要研究带约束的随机递归最优控制系统的全局最大值原理,将Yong和Zhou[27]中的约束条件拓展到带递归效用的情况就是本文所要求的约束条件。本文主要分为两个部分:第一部分,研究一维情况的带约束的随机递归最优控制系统的全局最大值原理。考虑由随机微分方程和倒向随机微分方程y(t)= Φ(x(T))+ f(s,x(s),y(s),z(s),u(s))ds-z(s)dW(s),共同描述的随机递归最优控制系统,其中,定义代价泛函为J(u·))= y(0).同时,要求状态过程满足如下状态约束:Eh(x(T),y(0))+ E ∫0T g(t,x(t),y(t),z(t),u(t))dt ∈ T,(?)其中,h和g均为给定函数。该问题可以描述为在可行控制集u[0,T]上最小化上述代价泛函。即存在一个最优控制u(·)使得下式成立:本文的研究目标是获得最优控制u(·)满足的必要条件。在推导最大值原理的过程中,首先定义惩罚代价泛函,然后利用针状变分、Ekeland变分原理和泰勒展开,之后引入两个新的倒向随机微分方程和一个新的随机微分方程,其适应解分别为(p0(.),q0(.)),(P0(.),Q0(.))和γ(·),随后利用Ito公式,并介绍一个哈密尔顿函数来得到变分不等式,最后通过取极限得到一维情况的带约束的随机递归最大值原理和横截条件。本文的创新就在于引入这叁个新方程,使得上述约束条件下的随机递归最大值原理得以解决。另外,在h和g同时等于零,且Γ为全集Rl的情况下,也就是说,并没有受到状态约束的束缚,经过推导可以得到本文所得到的最大值原理与Hu[26]中的无约束情况的最大值原理相同。第二部分,研究多维情况的带约束的随机递归最优控制系统的全局最大值原理。首先,将状态过程(x(.),y(.),z(.))及其满足的微分方程推广到高维情况,代价泛函会变为y的复合函数形式,即J(u(.))=H(y(0)),相应地,约束条件会变为如下形式:Eh(x(T),H(y(0)))+ E ∫0T g(t,x(t),y(t),z(t),u(t))dt ∈T.与一维情况的定理推导过程大致相同,不同的是泰勒展开时需考虑y的复合导函数Hy(y(0)),所以一维情况中新引入的叁个微分方程在推广到高维情况后也会做出相应的一些变化。同时,也需要引入高维的哈密尔顿函数来得到多维情况的带约束的随机递归最优控制系统的全局最大值原理。当各个维度都为一时,即多维情况回归到一维情况,本文得到的两个定理将有相同的结论。同样,本文得到的多维情况的带约束的随机递归最大值原理经过推导也可以缩减为Hu[26]中多维情况的无约束最大值原理。(本文来源于《山东大学》期刊2018-04-25)

王建龙,魏立峰[4](2017)在《一类时滞随机最优松驰控制的最大值原理》一文中研究指出本文通过引入更为一般的松驰控制过程,考虑带有时滞的随机最优控制系统,以解决控制集合U受到凸性条件限制的问题。在Hamilton函数满足关于状态变量和控制变量存在凹性假设的条件下,借助对偶方法和超前倒向随机微分方程的良好性质,给出了带有时滞的随机最优松驰控制问题的最大值原理。(本文来源于《中国海洋大学学报(自然科学版)》期刊2017年S1期)

许洁[5](2017)在《时滞重随机控制系统的随机最大值原理及其应用》一文中研究指出本文主要研究当状态方程是包含时滞的重随机微分方程时的最优控制问题.首先利用鞅表示定理和压缩映像原理给出含有时滞的重随机微分方程解的存在唯一性条件.进而在控制域为凸的假设下,利用经典的变分法给出最优控制所满足的必要条件,得到时滞重随机控制系统的最大值原理,并将此结论应用到线性二次最优控制问题中,得到最优控制的显示表达式.此外,我们对线性正倒向重随机Hamilton系统进行研究,定义相应的矩阵Riccait方程,在适当的假设条件下,给出一类线性正倒向重随机微分方程解的存在唯一性条件.由于Riccati方程是求解线性二次最优控制问题的关键,本文利用倒向随机微分方程的理论讨论了一类倒向随机Riccati方程解的存在唯一性条件.(本文来源于《吉林大学》期刊2017-06-01)

陈丽诗[6](2017)在《关于带递归效用的平均场最优控制问题的随机最大值原理》一文中研究指出Peng[1]在1998年提出一个重要的公开问题:"除了一些特殊情形,当f非线性依赖于z时相应的全局最大值原理是一个公开问题"。[2]和[3]研究了这个公开问题,但是他们所得到的最大值原理仍包含未知参数。公开问题的主要难点在于倒向随机微分方程(简记为BSDE)的生成元f(x,y,z,u)是非线性依赖于z的,这是无论在理论还是实际生活中都存在的一种典型状态。2015年Hu[4]最终解决了这个历时已久的公开问题。在Hu[4]的基础上,本文将结论推广至平均场情形,并考虑了完全耦合的部分可观测的平均场随机最优控制问题。本文主要分为两部分。第一部分,我们研究带递归效用函数的平均场最优控制问题的随机最大值原理。我们得到了带递归效用函数的平均场倒向随机微分方程(简记为MFBSDE)的变分方程,且得到了新的最大值原理。控制域不必为凸且MFBSDE的生成元可包含z。我们考虑如下状态方程:带递归效用的平均场随机最优控制问题为在可容许控制集μ[0,T]上最小化(2)式中的代价泛函J(u(·)),即找到最优控制u,使得我们的目的是得到最小化代价泛函时,最优控制u(·)所能满足的条件。我们的主要思想是利用Ekeland变分原理以及相应的伴随方程得到最优控制的必要条件。本部分的主要难点在于:(1)如何得到MFBSDE的二阶变分方程的具体形式(与[15]不同)。(2)关于z的变分方程的二次形式导致二阶伴随方程十分复杂。第二部分我们考虑了一种完全耦合的正倒向随机系统的部分可观测的平均场随机最优控制问题。在正向扩散系数不包含控制变量且控制域不必为凸的假设下,由Ekeland变分原理并利用针状变分法,我们得到庞特里亚金型的最大值原理,并且相关的伴随过程为平均场情形下的正倒向随机微分方程(简记为FBSDE)的解。而完全耦合的正倒向随机最优控制问题的一般最大值原理仍是一个公开问题。我们定义如下代价泛函:当系数满足Lipschitz条件、可积性条件和G-单调性条件时,方程(5)存在唯一解,其中正向扩散系数不包含控制。我们应用Ekeland变分原理及相应的伴随方程得到完全耦合情形下的部分可观测的平均场随机最大值原理。(本文来源于《山东大学》期刊2017-05-14)

王垒[7](2017)在《一般情形下的平均场随机最大值原理》一文中研究指出本文中,考虑了两种平均场类型的随机控制问题,状态方程的系数依赖于解以及解的分布,且代价泛函也是平均场类型的。我们首先来看如下的状态过程,平均场SDE的控制问题:代价泛函为有如下假设:(H3.1)(2)b,σ关于(x,μ,v)的导数满足Lipschitz条件并有界。(3)h,Φ关于(X,μ,v)和(x,μ)的导数是Lipschitz连续的且被C(1 + |x| + |v|)和C(1+|x|)界住。(4)b,σ关于(x,μ)是Lipschitz连续和线性增长的,关于控制v是一致的。(H3.2)H(x,μ,p,q,v)关于v是凸的。在控制域为凸的情况下,我们考虑使得代价泛函达到最小值随机最优控制所满足的条件。通过凸扰动和对偶的技巧得到最优化控制的必要条件,也得到了控制最优的充分条件。我们接下来看如下的状态过程,解耦的控制问题:其中b,σ,f,Φ是给定的映射且初值ζ是一个F0可测的随机变量。有如下假设:(2)b,σ,f 关于(x,μ,u),(x,y,z,v,u)的导数是 Lipschitz 连续的且有界。(3)关于(x,μ)的导数是Lipschitz连续的且被C(1+|x|)界住。(4)对任意的控制 u,f(·,0,0,δ0,u)∈HF2(0,T;Rm)。(5)b,σ关于(x,μ)是 Lipschitz 连续和线性增长的,f 关于(x,y,z,v)是 Lipschitz连续的,关于控制u是一致的。代价泛函为同理,我们利用凸扰动和对偶的技巧,便可以得到满足最优控制的必要条件。(本文来源于《山东大学》期刊2017-05-14)

王瑜[8](2017)在《分数布朗运动驱动的随机比例方程及其随机最大值原理》一文中研究指出本文主要介绍了由分数布朗运动驱动的随机比例微分方程及其最大值原理.随机过程可以用来描述很多现实生活中的问题.同时,人们又在追求问题的最优解决方案.这使得最优问题成为了数学领域的一个重要分支.随机最优控制问题是随机控制科学的基本问题之一,在工业领域,经济领域,乃至生物医学等领域都有广泛应用.随着经济和技术的飞速发展,各个领域中的实际问题对于时间精度的要求不断提高,特别是在股票交易和卫星发射这些因时间延迟会产生重大影响的领域,带有时滞的微分方程被广泛应用.这使得对带有时滞性的随机微分方程的研究也逐渐成为热点.随机比例微分方程正是一种特殊的带有时滞性的随机微分方程.在对现实问题的研究过程中,很多领域中的问题都已经逐渐显现出其所具有的分形特性,尤其是在金融领域,大量研究已经证实金融市场具有分形的特征.相较于标准布朗运动而言,具有“有偏的随机游走”性质的分数布朗运动可以更好的刻画分形的这一特征.因此,本文将分数布朗运动引入到了对于随机比例方程最大值的研究当中.本文主要利用高斯过程驱动的随机比例微分方程与布朗运动驱动的随机比例微分方程的关系,将布朗运动情形下的一些结果拓展到高斯过程情形下.对分数布朗运动驱动的随机比例方程最优控制问题的研究,主要利用庞特里亚金的最大值原理所阐述的对偶原理,得到相应随机最优控制问题的最大值原理,并推导得出最优控制问题的必要条件.(本文来源于《吉林大学》期刊2017-05-01)

史敬涛[9](2016)在《带Poisson跳跃的正倒向随机微分对策的最大值原理与动态规划之间的关系》一文中研究指出本文研究了带Poisson跳跃的零和正倒向随机微分对策的最大值原理与动态规划之间的关系;在一定的可微性假设下,建立了对偶过程、广义Hamilton函数和值函数之间的联系;作为主要结果的应用,讨论了金融市场中一类带有模型不确定性的递归效用投资组合优化问题.(本文来源于《中国科学:数学》期刊2016年09期)

贾秀利,关丽红,汤宇[10](2016)在《分数阶Brown运动驱动的带跳随机微分方程的随机最大值原理》一文中研究指出利用经典的变分法,考虑分数阶Brown运动驱动的带跳随机微分方程的最优控制问题,得到了该控制问题的随机最大值原理,其相应的伴随方程为一类分数阶Brown运动驱动的倒向随机微分方程.(本文来源于《吉林大学学报(理学版)》期刊2016年03期)

随机最大值原理论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

该文研究具有时间不连续效用函数的平均场随机系统最优控制问题.其中,扩散项系数包含控制变量且控制区域非凸.借助于延拓的Ekeland变分原理及递归方法,建立平均场理论框架下一般形式的随机最大值原理.最后,求解一个线性二次问题以论证结果的可行性.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

随机最大值原理论文参考文献

[1].张宇.具随机生成元的受控随机发展方程的Pontryagin型最大值原理(英文)[J].四川大学学报(自然科学版).2019

[2].李瑞敬.平均场正倒向随机控制系统的最大值原理[J].数学物理学报.2019

[3].陈雁楠.带约束的随机递归最优控制问题的全局最大值原理[D].山东大学.2018

[4].王建龙,魏立峰.一类时滞随机最优松驰控制的最大值原理[J].中国海洋大学学报(自然科学版).2017

[5].许洁.时滞重随机控制系统的随机最大值原理及其应用[D].吉林大学.2017

[6].陈丽诗.关于带递归效用的平均场最优控制问题的随机最大值原理[D].山东大学.2017

[7].王垒.一般情形下的平均场随机最大值原理[D].山东大学.2017

[8].王瑜.分数布朗运动驱动的随机比例方程及其随机最大值原理[D].吉林大学.2017

[9].史敬涛.带Poisson跳跃的正倒向随机微分对策的最大值原理与动态规划之间的关系[J].中国科学:数学.2016

[10].贾秀利,关丽红,汤宇.分数阶Brown运动驱动的带跳随机微分方程的随机最大值原理[J].吉林大学学报(理学版).2016

标签:;  ;  ;  

随机最大值原理论文-张宇
下载Doc文档

猜你喜欢