导读:本文包含了不可忽略缺失论文开题报告文献综述及选题提纲参考文献,主要关键词:GSNM,GSNMM,不可忽略缺失数据,变量选择
不可忽略缺失论文文献综述
唐琳[1](2017)在《带有不可忽略缺失数据的广义半参数非线性模型的统计推断》一文中研究指出缺失数据普遍存在于各个研究领域,一直以来都是统计学研究的热门课题之一.目前国内外用来分析半参数模型中的缺失数据的方法以及建立的统计理论大多都是基于缺失数据是可忽略的假设进行的.然而,在实际应用中,很多的数据其缺失机制是不可忽略的,如某种药物药效研究中,由于药物本身的副作用使得受试者放弃该药物的治疗等等.此时,若仍用可忽略缺失数据的假设进行统计推断可能导致不合理甚至是错误的统计推断结果.因此,本论文针对广义半参数非线性模型(GSNM)和广义半参数非线性随机效应模型(GSNMM),在不可忽略缺失数据的假设下,研究了GSNM的非参数函数和参数估计、变量选择、GSNMM的Bayes分析和Bayes局部影响分析.本论文的主要研究内容包括:1.基于广义半参数非线性模型(GSNM),在响应变量存在不可忽略缺失数据的情况下,通过考虑缺失数据机制的Logistic回归模型,讨论了广义半参数非线性模型的模型参数、非参数函数以及缺失数据机制模型中未知参数的估计问题.首先基于Fan et al.(1998)的局部核估计(local kernel estimation)思想以及Riddles(2013)的调整倾向得分法(propensity score adjustment),给出了GSNM中非参数函数的估计,然后借助于EM算法讨论了GSNM未知参数的极大似然估计,并在一定条件下证明了估计量的渐近性质.2.基于SCAD(Fan and Li,2001)和自适应LASSO(Zou,2006)惩罚函数,研究了GSNM以及缺失数据机制模型的变量选择问题.借助惩罚似然函数的思想,通过对GSNM中的模型参数和缺失数据机制模型中的回归系数同时进行惩罚,并通过极大惩罚似然函数得到了参数的惩罚估计,从而实现参数的同时估计和变量选择,没有被压缩为零的参数和回归系数所对应的自变量就选取为重要变量.在存在缺失数据的条件下,常用的惩罚参数选取准则如广义交叉核实法(GCV)和贝叶斯准则(BIC)等不易实施,因此采用ICQ(Ibrahim et al.,2008)准则选取合适的惩罚参数,并证明了 ICQ准则能相合地选取正确模型,同时还证明了参数惩罚估计量的Oracle性质.3.在半参数随机效应模型的研究中,大多数文献都是假设随机效应服从某一特定的参数分布,但是在许多实际问题的分析过程中,随机效应可能来自某一非参数分布,此时再假设随机效应服从参数分布有可能与实际情况相违背.因此,针对广义半参数非线性随机效应模型(GSNMM)中的随机效应,可以考虑用Dirichlet过程先验分布来刻画,同时考虑协变量带有测量误差项,并假设误差项服从偏正态分布,这样更能反映实际数据呈现出的有偏和重尾等性质.为了获得参数、非参数函数和随机效应等的Bayes估计,采用Gibss抽样从后验分布中抽取样本.4.基于Zhu et al.(2011),讨论了GSNMMs的Bayes局部影响分析方法,该方法能同时评价模型对个体数据、先验分布、DP先验和缺失数据机制的微小扰动的敏感性.考虑了数据、先验分布、DP先验和缺失机制模型的单一的或同时的扰动模型,通过构造Bayes扰动流形反映扰动模型的结构和扰动程度,并在不同的目标函数下定义了一阶和二阶调整Bayes局部影响诊断统计量,该诊断统计量可用来度量各种扰动对模型的影响.为了计算Bayes局部影响诊断统计量,采用MCMC算法从联合后验分布中抽取样本.(本文来源于《云南大学》期刊2017-06-01)
辛然[2](2017)在《带有不可忽略缺失的部分线性模型的识别与推断》一文中研究指出缺失数据作为复杂数据的一种,在生物医学、教育学和经济学等研究领域中普遍存在,目前国内外大部分对于数据缺失问题的研究都是基于数据缺失机制为可忽略的情况下。但一些实际问题,如当调查所在单位的员工的工资情况时,收入低和收入高的员工偏向于不填写问卷,这样一些问题使得缺失数据中所反映的信息在很多情况下是不可忽略的,如果仍使用处理可忽略缺失的研究方法处理不可忽略缺失的问题,将会导致最终估计的结果出现偏差。所以研究不可忽略缺失数据的估计方法具有很强的现实意义。部分线性模型,作为半参数模型中最经典的模型之一,相比起一般常用的参数模型,有不可替代的优势,而在不可忽略缺失数据的问题解决上,至今还没得到很好的发展。本文对带有不可忽略缺失的数据使用部分线性模型进行统计推断,其主要研究内容包括:(1)构建了一个部分线性模型的参数化模型,根据Miao、Geng的缺失模型的识别方法,讨论了不可忽略缺失情况下,当缺失机制为logistic模型时的该模型的识别问题。(2)基于倾向得分的逆概率加权方法,对部分线性模型的未知量进行估计,根据Qin,Leung和Shao的经验似然统计推断方法,针对不可忽略缺失数据,对缺失概率函数进行估计。所得的估计量具有良好的渐近性质。(3)通过合理的模拟研究,验证了本文所提出的方法的可行性。(本文来源于《云南大学》期刊2017-03-01)
雷伟[3](2016)在《带有不可忽略缺失数据的混合线性模型的贝叶斯统计推断》一文中研究指出缺失数据广泛存在于生命科学、农业、社会经济、环境科学等领域,但经典的统计数据研究中,大多是对完全数据进行统计分析,因此对缺失数据特别是不可忽略缺失数据的研究是非常必要的.混合线性模型是一般线性回归模型的推广与发展,其在研究分析重复观测数据(如面板数据、纵向数据)、分组数据以及空间数据时都具有明显的特有优势.混合线性模型不再受制于传统的线性模型中对响应变量的诸多假设(如独立性、方差齐性),并可以根据实际数据的特点,相对灵活地确定其协方差的结构.本文用贝叶斯的方法对包括协变量和响应变量存在不可忽略缺失的混合线性模型进行统计研究,运用Gibbs与Metropolis-Hastings抽样相结合的办法处理缺失数据与随机效应,从而得到模型参数的贝叶斯估计,并用叁个模拟试验与一个实际例子验证方法的有效性.结果表明,该方法不仅适用于混合线性模型,也适用于广义混合线性模型.(本文来源于《云南大学》期刊2016-05-01)
李斌[4](2015)在《IRT框架下的不可忽略缺失过程建模及Bayes估计研究》一文中研究指出项目反应理论(IRT)是克服了经典测验理论(CTT)的局限,在潜在特质理论基础上发展起来的,主要是探讨被试在测验项目上的反应与被试潜在特质之间的关系,因此项目反应理论的核心问题是参数估计问题。参数估计过程中,常常要求数据完整,对于缺失数据的项目参数估计引起了国内外广大学者的重视。由于不可忽略缺失的广泛存在,缺失数据的处理方法是项目反应理论的一个研究热点。本文主要研究教育与心理测量中的不可忽略缺失数据的建模和估计问题。利用项目反应模型来拟合缺失指标,对观测数据和缺失数据联合建模,基于数据扩充技术的Gibbs抽样方法,同时给出对观测数据模型和缺失指标模型的后验估计。第一章对项目反应理论的发展,当前国内外的研究现状及本篇论文的主要工作进行了简要的介绍;第二章介绍了相对于经典测验理论项目反应理论的优势,本文采用的项目反应模型,MCMC估计方法以及一些基本概念、基本理论。第叁章研究了二级评分模型下不可忽略缺失数据的Bayes估计问题,采用二级评分模型来拟合观测数据,用Rasch拟合缺失指标,对观测数据和缺失数据的联合建模,进而采用Gibbs抽样方法,给出对观测数据模型和缺失指标模型的后验估计。第四章研究了等级评分模型下不可忽略缺失数据的Bayes估计问题,用等级评分模型拟合观测数据,Rasch拟合缺失指标,通过联合建模,利用Gibbs估计方法对模型进行参数估计。每章均通过模拟研究验证了所用方法有效的减小了由于忽略缺失数据估计参数时产生的偏差,论文最后给出了阶段性总结,提出未来的研究方向和工作设想。(本文来源于《沈阳师范大学》期刊2015-05-26)
杨志煌[5](2015)在《不可忽略缺失数据下非线性模型的经验似然推断》一文中研究指出本文成功地将经验似然方法应用到带有不可忽略响应变量缺失的非线性模型。所有的目标参数的经验似然估计量或者经验似然函数将通过两步获得。第一步,假设缺失机制是一个参数Logistic回归模型后,应用极大似然估计方法可以得到缺失概率(倾向得分函数)的一个相合估计。一旦获得缺失概率的相合估计,基于指数倾斜模型,本文获得叁个渐进无偏的估计方程,这也是下文的运用经验似然方法的核心思想。特别的,叁个无偏估计方程的定义分别基于逆概率加权、非参插补、增强逆概率加权。第二步,将计算所有的目标参数的经验似然估计量或者经验似然函数。基于第一步构建的无偏估计方程,建立了获得回归系数的经验似然置信区间或者置信域的理论和方法,且研究了所提出的经验似然比统计量的极限分布的理论性质。同时,本文获得了目标参数的经验似然估计量且还研究了该估计量渐进分布的性质。在我们实际的研究当中,有关于协变量的辅助信息可以使用。为此,本文还提出了基于辅助信息的目标参数的两步更有效的经验似然估计量。在使用辅助信息以后,目标参数的经验似然估计量或者经验似然函数也将通过两步获得,唯一的区别在于使用辅助信息可以获得更好而且更有效的估计。另外,在获得参数化的缺失概率(倾向得分函数)的相合估计后,本文提出的基于辅助信息的经验似然方法可以很好地解决估计方程中参数个数小于估计方程个数的问题。更重要的是参数化的倾向得分函数估计比半参数的核实样本估计方法要更稳定更好。本文还系统地研究了在辅助信息使用以后所提出的经验似然估计量的大样本性质。最后,用两个数值模拟研究和一个实例分析来说明所提出的理论在有限样本下具有较好的表现。(本文来源于《云南大学》期刊2015-05-01)
谢锦瀚[6](2015)在《带有不可忽略缺失数据的广义线性模型的经验似然推断》一文中研究指出在生物医学、教育学和经济学等研究领域中,缺失数据普遍存在.它们是统计研究中的热门问题.目前国内外大部分对这一方面的研究都是基于缺失机制为可忽略缺失的假设下对广义线性模型建立统计理论.但一些实际问题(如:涉及隐私问题)导致越来越多的缺失数据是不可忽略的.若仍采用现存的处理可忽略缺失数据的方法处理不可忽略缺失数据,会导致估计效果不好.因此,研究带有不可忽略缺失数据的广义线性模型是具有实际意义的.然而,由于不可忽略缺失数据的存在,使得研究变得很困难,至今还没得到很好的发展.本文对带有不可忽略缺失数据的广义线性模型采用经验似然的方法进行参数估计,其主要研究内容包括:(1)针对不可忽略缺失数据,采用倾向得分调整(propensity score adjustment)的方法对缺失概率函数进行估计,所得的估计具有相合性.(2)基于逆概率加权的插补方法所新建的无偏估计方程,在有辅助信息或没有辅助信息的情况下,采用经验似然的方法进行参数估计,并讨论了所得的经验似然估计具有相合性和渐近正态性.(3)通过大量的模拟研究及实例分析,验证了本文所提出的方法具有稳健性和有效性.(本文来源于《云南大学》期刊2015-05-01)
李斌,李晓毅,付志慧[7](2015)在《IRT框架下不可忽略缺失数据的Bayes估计》一文中研究指出项目反应理论主要研究被试在测验项目上的反应和成绩与潜在特质间的关系,能否有效的估计模型中的参数是项目反应理论能否得以应用的前提。数据的完整性对参数估计有一定的影响。而项目反应过程中,数据的缺失是常见的。缺失数据的机制影响了处理方法。因此,针对不可忽略缺失数据,利用潜变量建模法,采用等级评分模型拟合观测指标,Rasch模型拟合缺失指标。同时用Gibbs抽样法抽取参数,给出估计。通过模拟研究,验证了所用方法有效的减小了由于忽略缺失数据估计参数时产生的偏差。(本文来源于《沈阳师范大学学报(自然科学版)》期刊2015年02期)
和燕,彭燕梅,唐年胜[8](2012)在《含不可忽略缺失数据非线性再生散度模型参数的Bayes估计》一文中研究指出给出协变量带有不可忽略缺失数据的非线性再生散度模型的Bayes方法,缺失数据机制由Logistic回归模型来确定.Gibbs抽样技术和Metropolis-Hastings算法(简称MH算法)用来得到模型参数、缺失数据机制中回归系数的联合Bayes估计,并用实例加以说明.(本文来源于《生物数学学报》期刊2012年02期)
和燕,彭燕梅,唐年胜[9](2011)在《带不可忽略缺失数据的再生散度随机效应模型的Bayes估计》一文中研究指出在响应变量带有不可忽略缺失数据的前提下得到非线性再生散度随机效应模型的Bayes方法.缺失数据机制由Logistic回归模型定义,根据Gibbs抽样技术和MH算法得到模型参数、随机效应因子以及缺失数据机制中回归系数的联合Bayes估计,并进行了实例分析.(本文来源于《宁夏大学学报(自然科学版)》期刊2011年03期)
付英姿,陈雪东[10](2011)在《带有不可忽略缺失数据的广义部分线性模型的贝叶斯分析》一文中研究指出广义部分线性模型是广义线性模型和部分线性模型的推广,是一种应用广泛的半参数模型.本文讨论的是该模型在线性协变量和响应变量均存在非随机缺失数据情形下参数的Bayes估计和基于Bayes因子的模型选择问题,在分析过程中,采用了惩罚样条来估计模型中的非参数成分,并建立了Bayes层次模型;为了解决Gibbs抽样过程中因参数高度相关带来的混合性差以及因维数增加导致出现不稳定性的问题,引入了潜变量做为添加数据并应用了压缩Gibbs抽样方法,改进了收敛性;同时,为了避免计算多重积分,利用了M-H算法估计边缘密度函数后计算Bayes因子,为模型的选择比较提供了一种准则.最后,通过模拟和实例验证了所给方法的有效性.(本文来源于《数学进展》期刊2011年03期)
不可忽略缺失论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
缺失数据作为复杂数据的一种,在生物医学、教育学和经济学等研究领域中普遍存在,目前国内外大部分对于数据缺失问题的研究都是基于数据缺失机制为可忽略的情况下。但一些实际问题,如当调查所在单位的员工的工资情况时,收入低和收入高的员工偏向于不填写问卷,这样一些问题使得缺失数据中所反映的信息在很多情况下是不可忽略的,如果仍使用处理可忽略缺失的研究方法处理不可忽略缺失的问题,将会导致最终估计的结果出现偏差。所以研究不可忽略缺失数据的估计方法具有很强的现实意义。部分线性模型,作为半参数模型中最经典的模型之一,相比起一般常用的参数模型,有不可替代的优势,而在不可忽略缺失数据的问题解决上,至今还没得到很好的发展。本文对带有不可忽略缺失的数据使用部分线性模型进行统计推断,其主要研究内容包括:(1)构建了一个部分线性模型的参数化模型,根据Miao、Geng的缺失模型的识别方法,讨论了不可忽略缺失情况下,当缺失机制为logistic模型时的该模型的识别问题。(2)基于倾向得分的逆概率加权方法,对部分线性模型的未知量进行估计,根据Qin,Leung和Shao的经验似然统计推断方法,针对不可忽略缺失数据,对缺失概率函数进行估计。所得的估计量具有良好的渐近性质。(3)通过合理的模拟研究,验证了本文所提出的方法的可行性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
不可忽略缺失论文参考文献
[1].唐琳.带有不可忽略缺失数据的广义半参数非线性模型的统计推断[D].云南大学.2017
[2].辛然.带有不可忽略缺失的部分线性模型的识别与推断[D].云南大学.2017
[3].雷伟.带有不可忽略缺失数据的混合线性模型的贝叶斯统计推断[D].云南大学.2016
[4].李斌.IRT框架下的不可忽略缺失过程建模及Bayes估计研究[D].沈阳师范大学.2015
[5].杨志煌.不可忽略缺失数据下非线性模型的经验似然推断[D].云南大学.2015
[6].谢锦瀚.带有不可忽略缺失数据的广义线性模型的经验似然推断[D].云南大学.2015
[7].李斌,李晓毅,付志慧.IRT框架下不可忽略缺失数据的Bayes估计[J].沈阳师范大学学报(自然科学版).2015
[8].和燕,彭燕梅,唐年胜.含不可忽略缺失数据非线性再生散度模型参数的Bayes估计[J].生物数学学报.2012
[9].和燕,彭燕梅,唐年胜.带不可忽略缺失数据的再生散度随机效应模型的Bayes估计[J].宁夏大学学报(自然科学版).2011
[10].付英姿,陈雪东.带有不可忽略缺失数据的广义部分线性模型的贝叶斯分析[J].数学进展.2011