导读:本文包含了缺失偏倚论文开题报告文献综述及选题提纲参考文献,主要关键词:选择性偏倚,随机缺失,多重填补,样本选择模型
缺失偏倚论文文献综述
赵俊康,王彤,荣惠英,孟繁龙[1](2014)在《不同缺失机制并存时偏倚校正的模拟研究》一文中研究指出目的探讨在医疗费用调查中针对因变量数据所存在的选择性偏倚和随机无应答问题的两阶段校正方法。方法通过模拟得出不同程度随机缺失和非随机缺失并存时的多个数据集。首先对随机缺失(MAR)通过预测均数匹配法(PMM)、倾向性得分法(PS)、基于Bootstrap的EM算法(EMB)和马尔科夫链蒙特卡洛算法(MCMC)四种填补方法进行多重填补(第一阶段);在此基础上对选择性偏倚造成的缺失数据进行样本选择模型拟合(第二阶段);最后对多个拟合结果进行合并。对模拟出的结果以标准偏倚、均方误差的平方根和可信区间平均长度作为评价填补方法优劣的标准。结果在任意一种缺失情况下,PS法的结果相对不理想。当非随机缺失为轻度时,不同程度随机缺失情况下的填补方法选择为:在随机缺失也为轻度时,MCMC法最好;在随机缺失为中度时,EMB法最好;在随机缺失为重度时,PMM法最好。当非随机缺失为中度时,无论随机缺失程度如何,MCMC都是最好的方法;当非随机缺失为重度时,无论随机缺失程度如何,PMM都是最好的方法。结论 PMM、EMB和MCMC法均是处理随机缺失较好的填补方法,可以根据本次研究的模拟结果有选择的将填补方法运用于各种不同缺失情况的实际调查。(本文来源于《中国卫生统计》期刊2014年04期)
赵俊康[2](2012)在《不同缺失机制并存时偏倚校正的模拟研究》一文中研究指出目的:本研究主要针对以往医疗费用调查中的因变量数据既存在应就医而因贫困等原因未就医导致的0截取或选择性偏倚问题,又存在随机的无应答造成的因变量缺失现象,提出了针对这两类重要的无应答偏倚机制并存时的两阶段校正方法,从而为正确估计相对弱势的人群的医疗费用及其影响因素提供方法学依据。方法:通过统计模拟得出不同程度随机缺失和非随机缺失并存时的多个数据集。首先利用非缺失数据(不包括含有非随机缺失数据的个体观测值)对单纯无应答按照随机缺失(MAR)机制通过预测均数匹配法(PMM)、倾向性得分法(PS)、基于Bootstrap的EM算法(EMB)和马尔科夫链蒙特卡洛算法(MCMC)四种填补方法进行多重填补(第一阶段);在此基础上对选择性偏倚造成的缺失数据进行样本选择模型拟合以校正数据非随机缺失造成的偏倚(第二阶段);最后对多个样本选择模型拟合结果进行合并。对模拟出的结果以标准偏倚、均方误差的平方根和可信区间平均长度作为评价填补方法优劣的标准。结果:通过模拟研究发现随着随机和非随机缺失率的增加,各项标准的值均不同程度的增加,说明填补方法准确度和精确度也在逐渐降低。在任意一种缺失情况下,由于PS法的标准偏倚绝对值超过了规定的界值,故该法不可取;而PMM、EMB和MCMC法均得出较好的结果。当非随机缺失为轻度时,不同程度随机缺失情况下的填补方法选择为:在随机缺失也为轻度时,MCMC法最好;在随机缺失为中度时,EMB法最好;在随机缺失为重度时,PMM法最好。当非随机缺失为中度时,无论随机缺失程度如何,MCMC都是最好的方法;当非随机缺失为重度时,无论随机缺失程度如何,PMM都是最好的方法。结论:PMM、EMB和MCMC法均是处理随机缺失较好的填补方法,可以根据本次研究的模拟结果有选择的将填补方法运用于各种不同缺失情况的实际调查,其预期结果也能为同类调查研究中针对这两类缺失并存时的数据填补提供统计方法学上的依据。(本文来源于《山西医科大学》期刊2012-05-27)
傅雯卿[3](2010)在《人类基因组分析中的缺失偏倚效应研究和拷贝数变异的突变估计》一文中研究指出技术的革命将遗传学的研究引入了组学的时代,通过芯片技术的运用产生了大量的遗传数据。为了深入地对数据进行挖掘,其他学科,如统计学、信息学等,与遗传学的结合越来越紧密。本文就五年来本人攻读博士学位期间的工作进行了总结,期望通过对两部分工作的介绍,展示统计学运用于解决遗传学问题的实例。其一,我们对高通量单核苷酸多态分型平台的缺失偏倚现象及其对后续分析的影响进行了探究。高通量、低成本的分型平台的出现,使全基因组关联分析成为了可能。但是研究者往往将关注的目标及于如何提高分型的准确率,而忽视了另一质量问题——缺失数据的存在。为了研究缺失现象对全基因组关联分析的影响,我们对四个主流分型平台(TaqMan(?) SNP分型平台、GenomeLabTM SNPstream分型平台、BeadLab (Illumina)分型平台和Human Mapping 500K (Affymetrix)芯片)的缺失数据进行了重测序分型,实验证实了缺失偏倚现象在多个平台中均普遍存在。进而,我们从理论上分析了缺失偏倚对后续分析的影响,如等位基因/基因型频率的估计、哈迪——温伯格平衡检验和不同疾病模型下关联分析统计功效的影响等。研究显示,缺失偏倚往往导致关联分析统计功效的下降,而且这种下降通常要比单纯的样本缺失造成的影响严重。我们还分别比较了缺失偏倚、分型错误对频率估计、关联分析的影响。通过分析获知,大多数情况下因为分型质量问题造成的分析偏差可以通过提高分型响应度,即使会牺牲一定的分型准确率来尽可能避免、减小。这一发现提示我们过去通常对处于分型边界的读点进行不判读的做法需要被修正。如果是为了降低分析偏差,在全基因组关联分析中,分型响应度和错误率的筛选标准要互相配合。我们建议修改现行的质量控制标准,可以适当增加响应度的阈值而降低对分型准确率的要求。其二,我们提出了近似估计拷贝数变异突变率的统计新方法。人类基因组中存在着拷贝数变异,而且这种变异和孟德尔遗传疾病、复杂疾病以及进化中的基因组可塑性相关。为了更好的理解拷贝数变异相关性状的成因,研究拷贝数变异的生成机制、估计它的突变率是十分重要的。多项用于揭示拷贝数变异成因的研究已经开展起来;但是从基因组水平对拷贝数变异突变率进行实验估计还是一个不现实的问题,它需要大量的样本量和精确的分型技术。本研究提出了一种可以运用群体基因型数据对拷贝数变异突变率进行近似估计的方法。这一估计可以通过基因组中不同拷贝数变异的比较,找寻到拷贝数变异的突变热点。运用该方法我们分析了来自HapMap计划的叁个群体、4,330个拷贝数变异位点,发现大多数的拷贝数变异突变率大致在10-5/代水平,这与分子实验观察到的零星突变率估计相一致。值得一提的是,有132(3.0%)个拷贝数变异的突变率可达10-3/代水平,被认为是突变热点。进一步的分析发现,基因组结构和重排机制的不同可能造成了人类基因组中拷贝数变异热点的存在。在不久的将来,由二代测序技术产生的海量数据将不断地涌现出来,许多悬而未决的遗传问题有望获得解决。对这些数据的挖掘工作离不开统计学、信息学等的运用,让我们做好准备迎接生命科学发展的这一黄金时代的到来。(本文来源于《复旦大学》期刊2010-06-02)
缺失偏倚论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
目的:本研究主要针对以往医疗费用调查中的因变量数据既存在应就医而因贫困等原因未就医导致的0截取或选择性偏倚问题,又存在随机的无应答造成的因变量缺失现象,提出了针对这两类重要的无应答偏倚机制并存时的两阶段校正方法,从而为正确估计相对弱势的人群的医疗费用及其影响因素提供方法学依据。方法:通过统计模拟得出不同程度随机缺失和非随机缺失并存时的多个数据集。首先利用非缺失数据(不包括含有非随机缺失数据的个体观测值)对单纯无应答按照随机缺失(MAR)机制通过预测均数匹配法(PMM)、倾向性得分法(PS)、基于Bootstrap的EM算法(EMB)和马尔科夫链蒙特卡洛算法(MCMC)四种填补方法进行多重填补(第一阶段);在此基础上对选择性偏倚造成的缺失数据进行样本选择模型拟合以校正数据非随机缺失造成的偏倚(第二阶段);最后对多个样本选择模型拟合结果进行合并。对模拟出的结果以标准偏倚、均方误差的平方根和可信区间平均长度作为评价填补方法优劣的标准。结果:通过模拟研究发现随着随机和非随机缺失率的增加,各项标准的值均不同程度的增加,说明填补方法准确度和精确度也在逐渐降低。在任意一种缺失情况下,由于PS法的标准偏倚绝对值超过了规定的界值,故该法不可取;而PMM、EMB和MCMC法均得出较好的结果。当非随机缺失为轻度时,不同程度随机缺失情况下的填补方法选择为:在随机缺失也为轻度时,MCMC法最好;在随机缺失为中度时,EMB法最好;在随机缺失为重度时,PMM法最好。当非随机缺失为中度时,无论随机缺失程度如何,MCMC都是最好的方法;当非随机缺失为重度时,无论随机缺失程度如何,PMM都是最好的方法。结论:PMM、EMB和MCMC法均是处理随机缺失较好的填补方法,可以根据本次研究的模拟结果有选择的将填补方法运用于各种不同缺失情况的实际调查,其预期结果也能为同类调查研究中针对这两类缺失并存时的数据填补提供统计方法学上的依据。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
缺失偏倚论文参考文献
[1].赵俊康,王彤,荣惠英,孟繁龙.不同缺失机制并存时偏倚校正的模拟研究[J].中国卫生统计.2014
[2].赵俊康.不同缺失机制并存时偏倚校正的模拟研究[D].山西医科大学.2012
[3].傅雯卿.人类基因组分析中的缺失偏倚效应研究和拷贝数变异的突变估计[D].复旦大学.2010