缺失数据论文-衡明莉,陈丽嫦,王骏

缺失数据论文-衡明莉,陈丽嫦,王骏

导读:本文包含了缺失数据论文开题报告文献综述及选题提纲参考文献,主要关键词:临床试验,缺失数据,统计分析

缺失数据论文文献综述

衡明莉,陈丽嫦,王骏[1](2019)在《临床试验中缺失数据处理方法研究》一文中研究指出临床试验中会因各种原因导致数据缺失。数据缺失会引入潜在偏倚,不恰当的缺失数据处理方法将引入更多的偏倚。本文就当前常见的缺失数据处理方法进行介绍,以期为相关人员在处理缺失数据时提供参考。(本文来源于《中国临床药理学杂志》期刊2019年22期)

项程,陈艾荣,李其恒,马如进[2](2019)在《基本风速预测中缺失历史数据的修订方法》一文中研究指出基本风速预测及制定中,经常会碰到历史数据的缺失现象,从而带来有效数据量少、风速预测效率不高的问题。为了尽可能避免这一现象带来的影响,对缺失历史数据进行修订是一个十分重要的环节。提出了基本风速预测中缺失数据的修订方法。统计了各气象台站的最大风速数据缺失率,介绍了目前采用的数据修订方法。根据数据缺失的特点及关注的对象,选用多重填补法对缺失的数据进行修订,并详细介绍了该方法的填补步骤。选用两个具体填补算例对日最大风速值数据修订进行说明,并用极值Ⅰ型概率模型对比了填补前后数据预测百年一遇风速的效果。结果表明,利用经缺失数据填补后的风速数据文件得到的历年最大风速序列,可以有效改善由于数据记录缺失造成的年最大风速值的遗漏,更好地预测基本风速。(本文来源于《南京工业大学学报(自然科学版)》期刊2019年06期)

张婷,张德干,高瑾馨[3](2019)在《面向智能车联网的缺失数据估计新方法》一文中研究指出数据丢失是面对智能车联网中的一个常见问题。鉴于此,考虑了大型和多样化车联网中的缺失数据问题。通过在智能车联网中提取公共交通模式,比较了函数估计和张量分解等方法来估计这些缺失值的优劣后,提出了张量低秩近似估计新方法,该方法在缺失数据的情况下获得流量模式,得到大规模车联路网的低秩表示。通过不同的道路车联网实验测试,表明该新方法的估计精度、数据集的偏差达到了较好的效果。(本文来源于《计算机应用研究》期刊2019年11期)

孙晓丽,郭艳,李宁,宋晓祥[4](2019)在《基于改进RNN的多变量时间序列缺失数据填充算法》一文中研究指出随着大数据时代的来临,多变量时间序列的应用价值得到了越来越多的关注。然而,缺失数据的存在严重影响了对多变量时间序列的进一步开发利用。针对这个问题,提出了基于改进递归神经网络的多变量缺失数据填充算法,该算法通过衰减机制可以获得更多有用的隐藏信息,从而更好地完成对多变量缺失数据的填充。首先,对多变量数据进行预处理,得到网络的输入向量;其次,在长短时记忆(Long-Short-Term Memory,LSTM)单元的基础上引入衰减机制,提出了两种改进的缺失数据填充模型。改进后的模型能够更多更好地获取长时间间隔的隐藏信息,并对输入进行相应的衰减处理。为检验算法的性能,在上海空气质量数据集以及多传感器数据融合活动识别系统(Activity Recognition system based on Multisensor data fusion,ARe M)数据集上进行了仿真实验。结果表明,相比于其他算法,所提算法能够更好地实现多变量时间序列的缺失数据填充。(本文来源于《信息技术与网络安全》期刊2019年11期)

岳廷妍,张昱勤,李晓松,马越,张韬[5](2019)在《数据缺失机制识别及处理的标准化流程及集成系统》一文中研究指出目的提出数据缺失机制识别及处理的标准化操作流程,并开发相应集成系统,为非统计专业背景的医学工作者处理缺失数据提供恰当、专业且简便的实现工具。方法系统集成了完成者数据集法、K最近邻分类算法和链式方程多元插值法等缺失数据处理方法,并将其归纳到缺失机制识别及处理的统一框架下,为缺失数据处理提供了从缺失统计,缺失机制识别到缺失处理的标准化流程。结果将归纳的标准化流程分步骤开发为缺失统计、缺失识别、缺失处理等功能模块并进行了集成化,构建了缺失机制识别及处理集成系统。结论标准化操作流程及集成系统实现了缺失机制识别加缺失数据处理全过程,操作方式简单便捷,结果展示直观易懂,为缺失数据的处理提供了更为简便可行的选择,便于医学工作者实际应用。(本文来源于《现代预防医学》期刊2019年21期)

王国波,郭林青,徐连胜[6](2019)在《数据缺失下基于单位线的流量模拟应用》一文中研究指出针对降雨径流模拟过程中的数据缺失现状,基于不同雨型的数据缺失特征构建不同的数据缺失模式,采用不同的插值方法构建单位线,探讨不同缺失模式下的单位线推广应用。结果表明,采用不同插补方法构建得到单位线的末端拟合效果较好,对峰值的插补效果不佳。不同雨型插补后的峰值位置存在偏离现象,基于峰值偏离现象和单位线倍加原理得到单位线峰值后在进行插补得到单位线的拟合效果较好,为无资料地区的降雨径流模拟和农业非点源评估模拟提供了新的理论思考,具有较好的推广意义。(本文来源于《中国农学通报》期刊2019年30期)

李田英[7](2019)在《基于大数据分析的网络资源缺失信息碎片智能识别方法》一文中研究指出针对传统网络资源缺失信息碎片识别方法中识别准确度较低、完成时间较长、能量消耗较大等问题,提出一种基于大数据分析的网络资源缺失信息碎片识别方法。通过对网络资源信息分析,利用非线性时间序列对网络资源不完整信息进行相空间重建,引入关联维数对网络资源不完整信息特征提取;考虑到不完整信息特征中缺失信息碎片对信息类别的贡献度,利用信息熵来衡量缺失信息碎片之间的差异,利用以BP神经网络为基础的集成分类器对缺失信息碎片分类,完成缺失信息碎片识别。结果表明,所提方法识别准确度较高、完成时间较短、能量消耗较小。(本文来源于《山东农业大学学报(自然科学版)》期刊2019年05期)

苗旭,王忠宇,邹亚杰,吴兵[8](2019)在《改进的固定交通检测器缺失数据综合修复方法》一文中研究指出基于检测器数据的时空相关性,为缺失数据修复模型动态地选择解释变量,在综合考虑检测器数据的周期性趋势和实时变化特性的基础上,提出了一种改进的缺失数据修复方法.对上海市南北高架的线圈流量数据进行数据修复精度测试.结果表明,相较于传统的支持向量回归(SVR)模型,该方法在3个测试检测器上的数据修复平均绝对误差分别减小了3.80%、3.40%、25.23%,并且在数据连续缺失1~10个时平均绝对百分比误差均低于6%.(本文来源于《同济大学学报(自然科学版)》期刊2019年10期)

韩光中,杨银华,吴彬,李山泉[9](2019)在《基于传递函数的土壤数据库缺失数据的填补研究》一文中研究指出数据缺失在土壤调查研究中是一个非常普遍的现象,处理不当一定程度上会影响研究结果的可靠性。土壤转换函数(pedotransfer functions,PTFs)是简单、快速、大批量填补土壤数据库缺失信息的有效手段。但目前分析和厘定我国土壤数据库缺失数据特征的研究较少,针对土壤数据库缺失数据的填补方法也亟待规范。本文对我国第二次土壤普查数据库进行分析,探讨该数据库的数据缺失特征,并对数据缺失严重的土壤属性进行预测,以期为今后的土壤数据库缺失数据填补工作提供参考。总体来看,质地(砂粒、粉粒和黏粒含量)、pH、有机质、全氮、全磷、全钾是土壤普查中最基础的调查项目,这些土壤属性信息的完整性最好。有效磷、速效钾和阳离子交换量数据有一定的缺失。碱解氮、容重、砾石含量、各种类型氧化铁数据缺失严重。在填补缺失数据时,建议首先考虑模型的稳定性,尽量使用那些相对稳定且数据完整性好的土壤属性来预测缺失数据。我国第二次土壤普查数据库基本都缺少空间属性信息,在填补缺失数据时最好采用简单而相对稳定的回归模型。利用回归分析得到的土壤传递函数可以较好地实现容重、碱解氮和部分阳离子交换量缺失数据的填补工作。尽管如此,由于部分土壤属性信息有一定的时效性,应用传递函数时要注意数据源的历史背景。(本文来源于《土壤》期刊2019年05期)

陈小波,陈程,陈蕾,韦中杰,蔡英凤[10](2019)在《基于改进低秩矩阵补全的交通量数据缺失值插补方法》一文中研究指出提出了一种低秩矩阵补全的改进方法以研究道路交通量数据缺失值插补问题。应用基于核范数的低秩矩阵补全对交通量数据矩阵中的缺失值进行第1轮插补;通过层次聚类算法将交通量数据划分为不同类别,使得同类中的数据具有较强相关性,异类中的数据具有较弱的相关性;在每类样本上应用低秩矩阵补全得到缺失值的第2轮插补;为了减少聚类数的影响,提出最小二乘回归集成学习方法将不同聚类数下的插补结果进行融合,得到最终的交通量数据插补结果;用美国俄勒冈州波特兰市的交通量数据比较了5种方法的插补误差,并分析了不同聚类数和距离度量方法的影响。研究结果表明:在完全随机缺失模式下,缺失率为10%~60%时,其相对于传统的低秩矩阵补全模型的插补误差降低了5.93%~9.11%;在随机缺失和混合缺失模式下,插补误差也分别降低了8.32%~9.55%和8.14%~9.20%;集成不同聚类数下的多个插补结果比单一聚类数下的插补误差降低2.62%~4.76%。可见,在3种数据缺失模式下,改进低秩矩阵补全方法降低了交通量数据的插补误差,能有效提高插补后交通量数据的有效性。(本文来源于《交通运输工程学报》期刊2019年05期)

缺失数据论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基本风速预测及制定中,经常会碰到历史数据的缺失现象,从而带来有效数据量少、风速预测效率不高的问题。为了尽可能避免这一现象带来的影响,对缺失历史数据进行修订是一个十分重要的环节。提出了基本风速预测中缺失数据的修订方法。统计了各气象台站的最大风速数据缺失率,介绍了目前采用的数据修订方法。根据数据缺失的特点及关注的对象,选用多重填补法对缺失的数据进行修订,并详细介绍了该方法的填补步骤。选用两个具体填补算例对日最大风速值数据修订进行说明,并用极值Ⅰ型概率模型对比了填补前后数据预测百年一遇风速的效果。结果表明,利用经缺失数据填补后的风速数据文件得到的历年最大风速序列,可以有效改善由于数据记录缺失造成的年最大风速值的遗漏,更好地预测基本风速。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

缺失数据论文参考文献

[1].衡明莉,陈丽嫦,王骏.临床试验中缺失数据处理方法研究[J].中国临床药理学杂志.2019

[2].项程,陈艾荣,李其恒,马如进.基本风速预测中缺失历史数据的修订方法[J].南京工业大学学报(自然科学版).2019

[3].张婷,张德干,高瑾馨.面向智能车联网的缺失数据估计新方法[J].计算机应用研究.2019

[4].孙晓丽,郭艳,李宁,宋晓祥.基于改进RNN的多变量时间序列缺失数据填充算法[J].信息技术与网络安全.2019

[5].岳廷妍,张昱勤,李晓松,马越,张韬.数据缺失机制识别及处理的标准化流程及集成系统[J].现代预防医学.2019

[6].王国波,郭林青,徐连胜.数据缺失下基于单位线的流量模拟应用[J].中国农学通报.2019

[7].李田英.基于大数据分析的网络资源缺失信息碎片智能识别方法[J].山东农业大学学报(自然科学版).2019

[8].苗旭,王忠宇,邹亚杰,吴兵.改进的固定交通检测器缺失数据综合修复方法[J].同济大学学报(自然科学版).2019

[9].韩光中,杨银华,吴彬,李山泉.基于传递函数的土壤数据库缺失数据的填补研究[J].土壤.2019

[10].陈小波,陈程,陈蕾,韦中杰,蔡英凤.基于改进低秩矩阵补全的交通量数据缺失值插补方法[J].交通运输工程学报.2019

标签:;  ;  ;  

缺失数据论文-衡明莉,陈丽嫦,王骏
下载Doc文档

猜你喜欢