导读:本文包含了零和微分对策论文开题报告文献综述及选题提纲参考文献,主要关键词:自适应动态规划,非线性零和微分对策,事件触发,神经网络
零和微分对策论文文献综述
崔黎黎,张勇,张欣[1](2018)在《非线性零和微分对策的事件触发自适应动态规划算法》一文中研究指出针对一类非线性零和微分对策问题,本文提出了一种事件触发自适应动态规划(event-triggered adaptive dynamic programming,ET--ADP)算法在线求解其鞍点.首先,提出一个新的自适应事件触发条件.然后,利用一个输入为采样数据的神经网络(评价网络)近似最优值函数,并设计了新型的神经网络权值更新律使得值函数、控制策略及扰动策略仅在事件触发时刻同步更新.进一步地,利用Lyapunov稳定性理论证明了所提出的算法能够在线获得非线性零和微分对策的鞍点且不会引起Zeno行为.所提出的ET--ADP算法仅在事件触发条件满足时才更新值函数、控制策略和扰动策略,因而可有效减少计算量和降低网络负荷.最后,两个仿真例子验证了所提出的ET--ADP算法的有效性.(本文来源于《控制理论与应用》期刊2018年05期)
张保凯[2](2017)在《跳扩散系统的零和线性二次随机微分对策问题》一文中研究指出随机线性二次问题是一类经典的最优控制问题,一些非线性控制问题可以用线性二次问题做逼近。讨论加上跳扩散的系统更加符合现实应用的发展需要,特别是在日益繁荣的金融市场中,一些均值方差投资组合问题和风险控制问题可以转化为随机线性二次控制问题;真实市场中存在竞争对手,竞争对手共同参与市场并影响市场,这启发我们将部分此类问题转化为零和微分对策问题,而考虑跳扩散的系统则更加符合金融市场随机性的规律。本文研究了一类带泊松跳的零和线性二次随机微分对策问题,且其扩散项系数不为零。基于对相关黎卡堤方程的研究,给出了一类闭环形式的最优反馈控制策略对,在一定程度上拓展了带跳线性二次问题的结果。我们运用Hamadene线性变换将对策问题与另一个控制问题联系起来,讨论了对策问题的哈密顿系统及黎卡堤方程并给出了解的存在唯一性证明。在跳扩散系统的零和线性二次随机微分对策问题中,控制变量由两部分组成,可以看成是两个玩家同时参与系统且共同影响状态变量;状态方程是线性的正向随机微分方程,并且它是由一个d-维标准布朗运动和一个泊松随机鞅测度所驱动的;目标函数是关于状态变量和控制变量的二次形式,玩家一希望目标函数一达到最大(或最小),玩家二则希望目标函数二达到最小(或最大)。玩家一和玩家二相互制约、相互影响。由于对策问题的特殊性,我们需要考虑容许控制、容许策略、容许反馈控制以及容许反馈策略定义的合理性。此外,我们分别定义了玩家一、玩家二以及对策问题的值,最终能够在这种动态的博弈中取得一个均衡点,即最优反馈控制策略对。(本文来源于《山东大学》期刊2017-05-19)
唐矛宁,孟庆欣[3](2016)在《带跳的完全耦合正倒向随机系统的非零和随机微分对策的变分公式及其应用》一文中研究指出本文主要研究由Brown运动和Poisson随机鞅测度共同驱动的完全耦合的正倒向随机系统的开环双人非零和随机微分对策问题.利用Hamilton函数和相应的对偶方程直接获得了性能指标的一个变分公式,其中对偶方程是一个线性正倒向随机微分方程,并且对经典的状态过程和性能指标的变分计算及其相应的Taylor展开均不需要考虑.作为应用,利用获得的变分公式在一个统一的框架下证明了开环Nash均衡点存在的一个必要条件(随机最大值原理)和一个充分条件(验证定理).本文中系统的控制区域要求是非空凸集,而且所有对手的可允许控制允许同时出现在状态方程的漂移项、扩散项和跳跃项.(本文来源于《中国科学:数学》期刊2016年02期)
孙景瑞[4](2014)在《线性二次二人零和随机微分对策》一文中研究指出本文研究了一类线性二次二人零和随机微分对策问题(简称SLQG),主要目的是对其开环和闭环鞍点进行刻画与比较.本文中,状态方程是非齐次的,决策者采取的控制允许出现在状态方程的漂移项和扩散项中,性能指标中的加权矩阵可以是不定的或奇异的,状态过程与控制过程的交叉项,两个控制过程的交叉项,以及状态过程、控制过程的一阶项允许出现在性能指标中.根据时间区间的不同,我们对有限时区和无穷时区的情形分别进行了讨论.对有限时区的SLQG问题,状态方程中的系数矩阵可以是无界的,性能指标带有终端惩罚.在适当条件下,我们得到状态方程的解的存在唯一性.对于开环鞍点,我们利用变分的方法,证明了开环鞍点存在当且仅当某个带有约束条件的正倒向随机微分方程(简称FBSDE)存在适应解,且某种凸-凹性条件成立.进步,我们讨论了开环上下值函数与开环鞍点的关系.对一类确定性的线性二次二人零和微分对策问题,Zhang [SIAM J. Control Optim.,2005,43:2157-2165]证明了开环上下值函数的有限性与开环鞍点的存在性之间的等价性.这一结果在一般情形下并不成立,我们得到一个较弱的结论:开环上下值函数的有限性蕴含着凸-凹性条件成立.对于闭环鞍点,我们利用解耦的方法,诱导出Riccati微分方程,证明了闭环鞍点的存在性与Riccati微分方程的正则解的存在性等价,并给出了闭环鞍点及值函数的表达式Riccati微分方程可能存在多个解,但正则解是唯一的.通过比较开环和闭环鞍点的特征我们发现,对于闭环鞍点的存在性,凸-凹性条件不是必要的,因此闭环鞍点存在不能导致开环鞍点存在,然而却可以诱导出带有约束条件的FBSDE的适应解的存在性;另一方面,Riccati微分方程解的正则性这一要求则使得开环鞍点的存在性也不能蕴含闭环鞍点的存在性.另外,对线性二次随机最优控制问题而言,闭环最优策略存在将导致开环最优控制存在.前面指出,闭环鞍点的存在性不能蕴含开环鞍点的存在性,因此,这一点使我们只能将线性二次随机最优控制问题形式上看作是问题SLQG的特例.对无穷时区的SLQG问题,我们假设状态方程的系数矩阵和性能指标中的加权矩阵为常值矩阵.作为关键步骤,我们首先证明了,在较为温和的条件下,一类无穷时区上的线性随机微分方程/倒向随机微分方程存在唯一平方可积解/适应解.对于开环鞍点,当状态方程的系数矩阵满足一定条件时,我们有类似于有限时区情形的结论.不同的地方在于此时的FBSDE是定义在无穷区间上的,需要讨论其L2-稳定适应解的存在性.对于闭环鞍点,我们引入代数Riccati方程(简称ARE)及其稳定化解的概念,并利用矩阵不等式的方法证明了闭环鞍点的存在性等价于相应的ARE的稳定化解的存在性.进一步,我们给出了闭环鞍点及值函数的表达式.本文首先回顾了微分对策,特别是二人零和微分对策的历史发展及其研究现状.然后讨论有限/无限区间上线性随机微分方程和倒向随机微分方程的适定性.接下来,分别对有限时区和无穷时区的SLQG问题进行讨论,得到开环和闭环鞍点的刻画,并给出一些例子来阐释相应的结果.最后,我们对文章进行总结并介绍一些相关问题.(本文来源于《中国科学技术大学》期刊2014-08-01)
娄延俊[5](2013)在《平均场倒向随机微分方程的线性二次最优控制及非零和微分对策》一文中研究指出本文主要基于正倒向随机微分方程、平均场正倒向随机微分方程和最优控制理论,研究了一类特殊的初始条件耦合的平均场正倒向随机微分方程,然后研究了该类方程的线性二次最优控制以及非零和微分对策问题,最后我们进一步研究了平均场线性正倒向随机系统的近似最优控制问题。首先我们主要研究了下列初始条件耦合的平均场正倒向随机微分方程在单调性假设条件下解的存在性和唯一性:然后我们给出了上述方程组中正向方程的伴随方程,利用相应的平均场正倒向随机微分方程的解得到了线性二次最优控制问题的最优控制的显式解,也得到了非零和微分对策问题的纳什均衡点的显式解,并且分别证明了它们是唯一的。其次,我们研究了平均场正倒向线性随机控制系统的近似最优控制问题。结合Zhou [25]我们给出了近似最优控制的定义,证明了近似最优控制的充分性条件和必要性条件。(本文来源于《山东大学》期刊2013-05-18)
张欣,会国涛,罗艳红[6](2012)在《基于ADP方法求解未知非线性零和微分对策问题》一文中研究指出针对一类未知非线性系统的二人零和微分对策问题,提出了一种基于近似动态规划(ADP)方法的控制方案.该方案首先通过设计一个基于递归神经网络(RNN)模型的辨识方案来近似未知非线性系统动态.通过在RNN模型中增加一个新型的调整项,保证了所建立的RNN模型的动态与原未知系统动态的误差渐近收敛到零.然后在此RNN模型基础上,应用ADP方法求解鞍点存在或者不存在情况下的最优性能指标以及最优控制策略.最后通过一个仿真例子验证了所提方案的有效性.(本文来源于《东北大学学报(自然科学版)》期刊2012年12期)
王皓[7](2009)在《反射倒向随机微分方程及其在混合零和微分对策,可逆投资问题及偏微分方程中的应用》一文中研究指出形如的方程被称为倒向随机微分方程(BSDE)。线性的倒向随机微分方程是由Bismut在1973年研究随机最优控制的最大值原理时首次引入的。1990年,Pardoux和Peng首先证明了系数满足Lipschitz条件的非线性倒向随机微分方程解的存在唯一性。1992年,着名经济学家Dufffe和Epstein也独立的地引入了一类特殊类型的倒向随机微分方程用以刻画金融中的递归效用函数。随后,学者们进一步的研究了不同条件下这类方程的可解性及相关性质,并广泛应用于数理金融、随机控制和经济管理等领域,使倒向随机微分方程理论得到了进一步的完善和发展。倒向随机微分方程在金融中有广泛的应用。我们看到,完备市场模型下未定权益在某一时刻T的期望收益可以用一个动态投资组合来复制,其定价过程恰好可以由一个倒向随机微分方程的解Y来描述,对应的另一个过程Z则是相应的对冲投资组合。在实际应用中,金融市场中许多重要的衍生产品均可以通过随机微分方程给出理论价格。倒向随机微分方程的另一个重要应用是给出了一类偏微分方程的概率解释。1991年,Peng利用倒向随机微分方程对一类二阶拟线性抛物型偏微分方程做出了概率解释,将着名的Feynman-Kac公式推广到非线性的情形,为偏微分方程的发展和应用提供了更广阔的空间。本文主要研究倒向随机微分方程解的存在性和唯一性,及其在混合零和微分-积分对策问题,在可逆投资问题以及在偏微分-积分方程的概率表示等问题上的应用。以下是本文的结构和主要结论。第一章:简要回顾倒向随机微分方程的历史及已有的经典结果,同时介绍本文中所讨论问题的背景及总体思路。第二章:研究了一类由布朗运动和与之独立的泊松过程共同驱动的双边反射倒向随机微分方程解的存在性和唯一性,其中,上下边界(障碍过程)分别是一个右连左极的过程。更确切的讲,一方面,这里的信息流是由布朗运动和与之独立的泊松过程共同生成的;另一方面,障碍过程可能包含两种类型的跳,既可以是可料的,也可以是不可达的。在不假设Mokobodski条件的情况下,我们需要寻找一个五元适应过程组(Y, Z, V, K~±),其中K~±是右连左极的非减过程,使得对任意t<T:这里,B是布朗运动,(?)是与之独立的泊松过程所对应的鞅测度。利用由Hamadene & Hassani在文章[52]中所提出的“局部解”这一有用的工具,我们证明了,当倒向随机微分方程的生成元是满足Lipschitz条件,障碍过程及其左极限过程完全可分时,即:倒向随机微分方程(0.0.1)存在唯一解。本章的主要结论是;定理2.3.2.(存在唯一性)在假设条件[H]成立的前提下,以(f,ξ, L, U)为系数的双边反射倒向随机微分方程存在唯一解,即:存在唯一的五元组(Y, Z,V,K~+,K~-)满足(0.0.1)。在这章的第二部分,作为第一部分存在唯一性的应用,我们考虑了一类混合零和随机微分对策问题。假设在一个带跳的模型中c_1和c_2通过两种形式:控制跟停时进行博弈。受控系统有如下机制:博弈停止时刻,c_1需要支付给c_2如下形式的现金流问题的实质是寻找一个c_1和c_2都接受的平衡点,我们称之为博弈问题存在一个值。通过引入具有(0.0.1)结构的倒向随机微分方程,我们证明了这类博弈问题存在一个值,即下面的关系成立:并且我们可以讲这类博弈问题的值函数用相关的倒向随机微分方程的解来表示。这一部分的主要结果是:定理2.4.1我们有如下关系成立:即Y_0是这个博弈问题的值。第叁章:研究了一类系数不满足平方可积条件时双边反射的倒向随机方程的解的存在唯一性。粗略的讲,我们寻找一个四元适应过程组(Y,Z,K~+,K~-)满足如下方程:更确切的说,一方面,我们削弱了系数ξ,(f(t,ω,0,0))_(t≤T),以及边界的平方可积条件。在本章中,我们仅仅假设对于某个p∈]1,2[,ξ,sup(?)和(?)是L~p可积的。另一方面,在不假设Mokobodski条件的情况下,我们利用局部解这一有力工具以及Hamadene&Popier在文章[63]中获得的此类单边反射问题的有关结果,我们证明了,当边界完全可分时,即倒向随机微分方程(0.0.2)存在唯一解。定理3.3.1.(存在唯一性)在假设条件[H']成立的前提下,以(f,ξ, L, U)为系数的双边反射倒向随机微分方程存在唯一解,即:存在唯一的四元组(Y, Z, K~+, K~-)满足(0.0.2)。第四章:在不确定模型中,研究了一类风险敏感的转换问题。一方面,我们在一个不确定的模型中(注意不确定性跟随机现象的区别)考虑一类转换问题(有时也称之为开关问题)。换言之,我们无法确定未来市场中的随机现象将一直由某个概率测度P来描述,取而代之的,我们只知道它会由一族概率测度中的某一个来描述。另一方面,在研究这类问题的同时,通过引入一类指数型的效用函数,我们考虑了管理者对于风险的喜恶程度。在本章中,我们考虑了一个风险厌恶的管理者在Knight不确定性面前如何进行抉择的转换问题。为了解决这个间题,我们引入了如下的反射倒向随机微分方程的系统:这里g_(12), g_(21)表示进行转换所带来的沉没成本,H~*是该问题对应的哈密尔顿函数。通过这个系统,我们通过如下定理给出了最佳策略的刻画定理:定理4.2.1.存在两对叁元组(Y~i,Z~i,K~i),i=1,2满足(0.0.3),并且另外,我们有如下关于最佳管理策略(产~*,u~*)的描述:(?),对于n≥0,n=0,…,并且在本章的最后,我们考虑如下带相互关联障碍的偏微分方程系统:其中Φ_i由下式定义:注意到,在马氏框架下,这个系统是前面我们给出的系统的确定性版本。我们证明了,这时反射倒向随机微分方程系统(0.0.3)解能够给出偏微分方程系统(0.0.4)的唯一粘性解的概率表示。第五章:通过引入一类合适的不耦合的正倒向随机微分方程,我们研究了一类抛物型的偏微分积分方程的索伯列夫弱解的概率解释。粗略的说,我们研究如下的偏微分积分方程的变分形式:其中L是对应于一个跳扩散过程的二阶积分微分算子,其定义如下:在本章中,我们将Bally和Matoussi在文章[5]中引入的随机流方法推广到模型带跳的情形。借助于随机流的良好性质及随机试验函数的引入,我们证明了如下的主要结果:定理5.3.1.在适当的条件下,PIDE(0.0.5)存在唯一的索伯列夫弱解u.我们有如下的概率解释:u(t,x)=Y_t~(t,x),其中(?)是一个合适的马尔科夫倒向随机微分方程的解,另外,我们有(?),(本文来源于《山东大学》期刊2009-10-24)
王光臣[8](2007)在《部分可观测信息下的线性二次非零和随机微分对策》一文中研究指出结合正倒向随机微分方程理论和滤波技术,给出了一类部分可观测信息下线性二次非零和随机微分对策问题的纳什均衡点.(本文来源于《山东大学学报(理学版)》期刊2007年06期)
吴臻,于志勇[9](2005)在《带随机跳跃的线性二次非零和微分对策问题》一文中研究指出对于一类以布朗运动和泊松过程为噪声源的正倒向随机微分方程,在单调性假设下,给出了解的存在性和唯一性的结果.然后将这些结果应用于带随机跳跃的线性二次非零和微分对策问题之中,由上述正倒向随机微分方程的解得到了开环Nash均衡点的显式形式.(本文来源于《应用数学和力学》期刊2005年08期)
陈阳舟[10](1996)在《关于时变线性系统二次型两人零和微分对策:问题可解的充分必要条件和解的解析构造》一文中研究指出本文讨论了有限时区上时变系统以及无限时区上时变周期系统线性二次型两人零和微分对策(LQG)。证明了Nash平衡点(鞍点)解以及Stackelberg平衡点解存在的等价性,并给出了解存在的一系列充分必要条俄解的解析构造以及对策值。求解问题的关键在于一系列黎卡提(Riccati)方程或者哈米颁(Hamilton)方程解的存在性及其求解。特别指出了LQG中产生的黎卡提方程与线性二次型最优调节器问题中的黎卡提方程之间的联系。(本文来源于《1996年中国控制会议论文集》期刊1996-09-01)
零和微分对策论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随机线性二次问题是一类经典的最优控制问题,一些非线性控制问题可以用线性二次问题做逼近。讨论加上跳扩散的系统更加符合现实应用的发展需要,特别是在日益繁荣的金融市场中,一些均值方差投资组合问题和风险控制问题可以转化为随机线性二次控制问题;真实市场中存在竞争对手,竞争对手共同参与市场并影响市场,这启发我们将部分此类问题转化为零和微分对策问题,而考虑跳扩散的系统则更加符合金融市场随机性的规律。本文研究了一类带泊松跳的零和线性二次随机微分对策问题,且其扩散项系数不为零。基于对相关黎卡堤方程的研究,给出了一类闭环形式的最优反馈控制策略对,在一定程度上拓展了带跳线性二次问题的结果。我们运用Hamadene线性变换将对策问题与另一个控制问题联系起来,讨论了对策问题的哈密顿系统及黎卡堤方程并给出了解的存在唯一性证明。在跳扩散系统的零和线性二次随机微分对策问题中,控制变量由两部分组成,可以看成是两个玩家同时参与系统且共同影响状态变量;状态方程是线性的正向随机微分方程,并且它是由一个d-维标准布朗运动和一个泊松随机鞅测度所驱动的;目标函数是关于状态变量和控制变量的二次形式,玩家一希望目标函数一达到最大(或最小),玩家二则希望目标函数二达到最小(或最大)。玩家一和玩家二相互制约、相互影响。由于对策问题的特殊性,我们需要考虑容许控制、容许策略、容许反馈控制以及容许反馈策略定义的合理性。此外,我们分别定义了玩家一、玩家二以及对策问题的值,最终能够在这种动态的博弈中取得一个均衡点,即最优反馈控制策略对。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
零和微分对策论文参考文献
[1].崔黎黎,张勇,张欣.非线性零和微分对策的事件触发自适应动态规划算法[J].控制理论与应用.2018
[2].张保凯.跳扩散系统的零和线性二次随机微分对策问题[D].山东大学.2017
[3].唐矛宁,孟庆欣.带跳的完全耦合正倒向随机系统的非零和随机微分对策的变分公式及其应用[J].中国科学:数学.2016
[4].孙景瑞.线性二次二人零和随机微分对策[D].中国科学技术大学.2014
[5].娄延俊.平均场倒向随机微分方程的线性二次最优控制及非零和微分对策[D].山东大学.2013
[6].张欣,会国涛,罗艳红.基于ADP方法求解未知非线性零和微分对策问题[J].东北大学学报(自然科学版).2012
[7].王皓.反射倒向随机微分方程及其在混合零和微分对策,可逆投资问题及偏微分方程中的应用[D].山东大学.2009
[8].王光臣.部分可观测信息下的线性二次非零和随机微分对策[J].山东大学学报(理学版).2007
[9].吴臻,于志勇.带随机跳跃的线性二次非零和微分对策问题[J].应用数学和力学.2005
[10].陈阳舟.关于时变线性系统二次型两人零和微分对策:问题可解的充分必要条件和解的解析构造[C].1996年中国控制会议论文集.1996