约束变量论文-胡琴琴

约束变量论文-胡琴琴

导读:本文包含了约束变量论文开题报告文献综述及选题提纲参考文献,主要关键词:变量选择,对偶,超高维数据,经验似然

约束变量论文文献综述

胡琴琴[1](2015)在《高维模型的约束变量选择和条件特征筛选》一文中研究指出高维数据频繁地出现在社会生活和科学研究的诸多领域,例如生物医学成像、X线断层摄影术、以及金融学和地球科学等等。在高维数据中,协变量或者参数的个数p大于样本个数n。传统的统计推断方法已经不再适用这种“大p,小n”数据。而稀疏性原则假设仅有少量预测变量对响应变量有影响,在这个原则下,现在已经有很多针对高维模型的变量选择和特征筛选方法。在实际问题研究中,根据先前的调查研究和经验常识,研究者们经常可以假设参数满足某些约束条件或者确定一些重要预测变量。本文旨在充分利用这些约束条件和己知活跃协变量信息,继而提高参数估计和变量选择的效果,降低协变量之间相关性对特征筛选的影响。在本文第二章中,我们研究了高维模型中参数约束下的变量选择问题。参数约束是实际研究过程中常见的假设条件,研究者们根据问题背景和经验常识可以确定参数满足一定的限制条件。例如Fan et a1.(2012)考虑证券投资组合问题,研究如何分配资金投资p个不同的证券以达到最大的回报。这个问题中就暗含有一个线性等式参数约束∑jp=1βj=1。合理利用参数的约束条件,可以提高参数估计和变量选择的效果,比如经典统计中的约束最小二乘方法。在第二章,我们具体研究了约束广义Lasso方法(简称为lcg-lasso),讨论了相应的对偶问题以及算法实现问题,还得到了约束广义Lasso的自由度公式,并以此探讨了调和参数的选择问题。具体地说,在高维线性模型中,我们考虑如下的约束优化问题,其中‖·‖d表示向量的ld范数,λ≥0为调和参数,Rs×p和f∈Rs分别是根据所研究的问题具体设定的惩罚矩阵,约束矩阵和约束向量。选择合适的D,C,d,E和f,使得Lasso(Tibshirani,1996)和它的一系列变体,例如adaptivelasso (Zou,2006), fused lasso (Tibshirani et al.,2005)和广义Lasso (Tibshirani and Tay-lor,2011)等,以及Fan et al.(2012)中的约束型问题都成为了lcg-lasso的特例。首先,我们考虑X为列满秩矩阵情形,忽略不影响优化求解的常数,根据拉格朗日对偶理论得到lcg-lass o的对偶问题为范数。而且,我们还得到原始解β和对偶解之间的关系,很显然,1cg-lasso的对偶问题是标准二次规划。而且与原问题相比,其对偶问题所含的未知参数个数少,所有的约束条件也都是简单的箱约束,所以我们能够很方便地用2.4节中简单有效的坐标下降法进行求解。另一方面,我们还研究了约束广义Lasso的自由度问题,并通过最小化风险估计选择最优调和参数。首先,我们根据对偶问题的KKT条件,定义了对偶解边界集并按照对偶解和原始解的关系,得到原始解的边界集4和召,其中4是Dβ不等于0的下标集合,B是不等式约束等号成立的下标集合。通过对偶解的边界集及其性质,我们得到了对偶解的精确表达式,继而得到原始解β和拟合μ=Xβ的表达式。我们在2.3节中证明了对偶解的边界集和β分别是关于y的局部常数函数和连续函数,以及应的一致Lipschtiz性,最终得到μ做为y的函数是连续且几乎处处可微的。因此,根据Stein引理(Stein,1981),我们证明得到,当y服从正态分布时,对于任意的的自由度表达式,G的零空间的维数。但是,在实际应用中,设计矩阵X不一定满足列满秩的条件。在这种情形下,上述方法不再适用。因此,在第二章中,我们提出用简单的类Elastic Net方法来处理非列满秩设计矩阵问题。我们在原问题lcg-lasso上额外增加一个l2惩罚项,即其中7>0为一较小的正数。假设β*是上述优化问题的解,我们得到μ=Xβ*的自由度就可以通过最小化风险估计来选择最优的调和参数。鉴于Mallows'Cp准则和AIC/BIC准则之间的关系,我们定义如下BIC类型的准则,其中ωn。是一个可选常数。当上述准则为Mallows'Cp准则或者AIC准则,当ωn。=log(n),BIC-类型准则即为通常的BIC准则。于是,我们可以选择使得上述BIC类型准则达到最小值的λ为约束广义Lasso (lcg-lasso)的最优调和参数。在第叁章,我们研究了已知部分活跃协变量或者强相关的预测变量条件下的超高维参数模型的特征筛选问题。Fan and Lv(2008)首次强调了特征筛选在超高维数据分析中的重要性,建议两阶段变量选择来提高变量选择和参数估计的效率,即先对超高维数据进行粗略的大幅度降维(特征筛选,feature screening),再进行精细的变量选择。自Fanand Lv(2008)提出SIS (Sure Independence Screening)特征筛选方法这一开创性工作以来,大量文献就开始致力于超高维数据中特征筛选问题的研究。大多数的特征筛选方法都是通过排序边际效应进行筛选,例如预测变量与响应变量的边际相关性。但是,简单的边际效应特征筛选方法深受预测变量之间相关性的影响,例如舍弃了隐藏型重要变量,错误选入了与活跃预测变量强相关的非活跃预测变量。在现实应用中,基于一些预先研究和经验常识,研究者们能够事先确定一些与所研究的响应变量相关的预测变量。在第叁章中,我们利用这一条件信息,在超高维线性和广义线性模型中提出了新的基于条件边际经验似然的条件特征筛选方法(简称为CMELR-CSIS)。假设XC是事先确定的活跃预测变量集合,考虑如下的矩条件:对于任意向量或者矩阵βC,其中αj可视为中心化变量与响应变量Y之间的相关系数。根据上述矩条件,我们构建条件边际经验似然,并得到如下条件边际经验似然比,是拉格朗日乘子,并满证明了真实参数的边际经验似然比很小,而在错误参数值处的边际经验似然比将以很大的概率发散,所以我们考虑用lj(0)作为特征筛选工具。但是gij(c)(0)中包含未知的参数1,所以我们给出了在线性条件下lj(0)的估计值lj(0)。最终,我们选择集合作为剩余活跃指标集的估计,其中γn是预先定义的阈值,A表示模型中所有活跃预测变量的下标集合。我们称这种特征筛选方法为基于条件边际经验似然比的条件特征筛选,简称为CMELR-CSIS。CMELR-CSIS因为继承了经验似然方法的优点,所以不需要太多关于分布的假设。而且所需的算法简单,只需要计算零点处的的条件边界经验似然比,不需要估计参数以及迭代算法。CMELR-CSIS具备sure screening性质,并在合适的阂值下,也能很好地控制所选入的预测变量个数。大量的数值模拟研究验证了,在存在强相关预测变量情况下,以前的非条件特征筛选方法表现不尽如意或者直接崩溃,但是新条件特征筛选方法CMELR-CSIS的表现却极为出色。通过不同的模型和条件设置,我们再次证实了条件特征筛选方法的有效性,验证了CMELR-CSIS对条件指标集C的选择具有稳健性,并且在没有任何条件集合的信息时,提供了有效的两阶段方法来构建CMELR-CSIS。在第四章,我们主要考虑超高维多指标异方差模型中均值函数和方差函数的特征筛选问题。现有的特征筛选方法主要是针对回归模型中均值函数的活跃预测变量。但是,方差函数在统计理论和应用中有着至关重要的地位。虽然Zhu et al.(2011)和Lin etal.(2013)在没有模型结构的条件下,筛选得到活跃预测变量集合的估计,但是不能具体区分哪些活跃预测变量是属于均值函数,哪些活跃预测变量是属于方差函数。在本文第四章,我们主要研究如下超高维多指标异方差模型,其中gμ(·)和gv(·)表示未知的光滑函数,X为p维的预测变量向量,ε与预测变量独立,其均值为E(ε)=0,方差为E显然,很多流行的半参数回归模型都是上述多指标模型的特例,例如部分线性模型,单指标模型和部分线性单指标模型等等。首先,我们证明了文中第叁章中的CMELR-CS IS可以自然拓展到多指标同方差模型或者多指标异方差模型中均值函数的特征筛选。这是因为,在一定正则条件下,我们证明下列等价条件成立,其中Aμ。表示均值函数的活跃指标集。于是,我们根据条件边际经验似然比得到了目标集合的估计其中γn为预先给定的阈值参数,lj是条件边际经验似然比的估计值,表示满足等式的拉格朗日乘子。为了不产生混淆,我们称针对多指标模型中均值函数的这种条件特征筛选方法为EL-CFS。另一方面,关于异方差模型中方差函数的特征筛选,由于平方Y2之间相关性同时包含均值函数和方差函数的指标信息。而且,在正则条件下,我们证明了其中是上述异方差模型的活跃指标集,集合Av表示模型中方差函数的活跃指标集。因此,我们可用作为目标集合的估计,其中γn是预先确定的阈值参数,需要注意的是,此时估计。由于此条件特征筛选方法是EL-CFS的修正版,所以我们简称之为:mEL-CFS。显然,可以做为异方差模型中方差函数的活跃指标集D∩Av的估计。而且,我们证明了集合是方差函数活跃指标集的一个相合估计。因此,通过EL-CFS和mEL-CFS两步条件特征筛选,我们能够分别得到多指标异方差模型中均值函数和方差函数活跃指标集的相合估计。EL-CFS 和 mEL-CFS避免了多指标异方差模型中未知的link函数gμ和gv的非参数估计,而且在强相关的协变量情况下,依然能很好的工作。理论结果表明当模型维数以样本容量的指数级增长时,条件特征筛选方法EL-CFS和mEL-CFS仍然具有sure screening性质。在数值模拟研究中,通过不同的模型设置证实了EL-CFS和mEL-CFS的有效性。而且,作为条件特征筛选方法,EL-CFS和mEL-CFS对条件预测变量集合选择具有稳健性。(本文来源于《山东大学》期刊2015-05-15)

李义奇[2](2010)在《农村小型金融机构发展的约束变量是风险控制》一文中研究指出在政策支持,市场也有较强需求的情况下,我国农村小型金融机构的发展,主要的制约因素是风险控制问题。有关部门应以硬化风险约束和建立良好治理机制为前提,来设计、推广农村小型金融机构,在机构本土化、地方政府干预、监管体制、市场退出以及建立简单透明的机构运作体制等方面,尝试突破农村小型金融机构风险控制难题。(本文来源于《金融理论与实践》期刊2010年03期)

许美凤[3](2008)在《公共物品多元化供给的约束变量分析》一文中研究指出随着经济社会的进步,传统的政府一元化公共物品供给模式已经不能有效地满足市场的需求。文中首先简要介绍了公共物品的层次性、特性的动态性与边界的模糊性,接着主要对影响公共物品多元化供给的约束变量进行详细分析,最后总结了受多种变量约束下的几种公共物品的供给方式。(本文来源于《工会论坛(山东省工会管理干部学院学报)》期刊2008年01期)

丁栋虹[4](1999)在《从经济发展的企业约束变量看我国改革导向的重新定位》一文中研究指出中国企业改革的理论与实践在导向上存在明显的错位:过多地纠缠于国有企业的改革,对如何促进非国有企业发展的关注严重不足。本文讨论的非国有企业,包含私有的,也包含非私有的,如合资企业、股份制企业、个体企业。一、非国有企业而不是国有企业才是中国经济发展的约束...(本文来源于《经济理论与经济管理》期刊1999年04期)

刘连寿,蔡勖[5](1983)在《非完全约束变量的概率分布》一文中研究指出本文讨论了受到非完全约束的随机变量的概率分布.(本文来源于《华中师院学报(自然科学版)》期刊1983年03期)

约束变量论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在政策支持,市场也有较强需求的情况下,我国农村小型金融机构的发展,主要的制约因素是风险控制问题。有关部门应以硬化风险约束和建立良好治理机制为前提,来设计、推广农村小型金融机构,在机构本土化、地方政府干预、监管体制、市场退出以及建立简单透明的机构运作体制等方面,尝试突破农村小型金融机构风险控制难题。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

约束变量论文参考文献

[1].胡琴琴.高维模型的约束变量选择和条件特征筛选[D].山东大学.2015

[2].李义奇.农村小型金融机构发展的约束变量是风险控制[J].金融理论与实践.2010

[3].许美凤.公共物品多元化供给的约束变量分析[J].工会论坛(山东省工会管理干部学院学报).2008

[4].丁栋虹.从经济发展的企业约束变量看我国改革导向的重新定位[J].经济理论与经济管理.1999

[5].刘连寿,蔡勖.非完全约束变量的概率分布[J].华中师院学报(自然科学版).1983

标签:;  ;  ;  ;  

约束变量论文-胡琴琴
下载Doc文档

猜你喜欢