导读:本文包含了集成学习模型论文开题报告文献综述及选题提纲参考文献,主要关键词:数据相关长度,网络结构,田口方法,集成学习
集成学习模型论文文献综述
祁欣学,覃锡忠,贾振红,常春,樊树铭[1](2019)在《基于田口集成学习的最佳交通流量预测模型》一文中研究指出针对预测准确性对数据相关性和网络结构极为敏感的问题,采用田口方法选择集成学习的结构参数,在保证学习多样性的同时,提高选择过程的效率,保证预测的准确性。实验仿真计算结果表明,在多个路段的交通流量数据集上,该方法皆取得了满意的预测效果,模型具有较好的鲁棒性。将仿真结果与其它算法进行比较,比较结果表明,相比传统ARIMA、MLP模型,其预测精度分别提高了4.51%、11.23%。(本文来源于《计算机工程与设计》期刊2019年12期)
郜丽鹏,李勇[2](2019)在《一种基于集成学习的DBN模型分类方法》一文中研究指出雷达信号分类是雷达信号电子侦察的关键技术之一,针对利用深度学习模型进行雷达信号分类时其性能不稳定的缺点,提出了一种基于集成学习的深度信念网络模型进行分类的方法.通过深度信念网络模型不同层间的特征抽取,通过不同的分类器得到不同的分类结果,再将分类结果进行集成,得到最终的输出.待分类的雷达信号由12部雷达产生,包括常规、参差、频率捷变和抖动四种雷达.仿真结果表明,该模型的分类错误率较低,鲁棒性较好.(本文来源于《哈尔滨商业大学学报(自然科学版)》期刊2019年05期)
张碧怡,肖宇谷,曾宇哲[3](2019)在《车险定价中风险因子重要性测度的比较研究——基于集成学习方法和广义线性回归模型》一文中研究指出车险业务中影响车险损失的风险因子很多,如从人因子、从车因子、从属地因子和保单属性因子等,保险公司通常利用这些风险因子对个体风险进行分类,一方面作为车险定价的依据,另一方面也为部门沟通、业务选择和市场细分提供支持。因此,识别风险因子的重要性对提升整个车险业务质量有非常重要的意义。近年来机器学习算法在车险损失预测中的应用越来越多,但目前的研究主要考虑了损失预测的精度,对风险因子的重要性测度缺少系统深入的研究。为此,本文对8个车险数据集,利用两种集成学习方法(随机森林和XGBoost),比较了它们与广义线性回归模型在索赔频率风险因子重要性测度上的一致性。研究结果表明,这两种集成学习方法不仅能提高预测精度,还能提供较一致的风险因子重要性测度。(本文来源于《保险研究》期刊2019年10期)
荆灵玲,解超,王安琪[4](2019)在《基于集成学习的公交车辆到站时间预测模型研究》一文中研究指出公交车是城市交通系统的主要组成部分,准确预测公交车辆到站时间作为城市智能交通系统(ITS)的重要应用,可以有效提升公交车乘客的乘坐体验,增加公交出行的吸引力。为此,提出一种基于集成学习方法的公交车到站时间预测模型,利用联合多种弱模型的方法,确定优化目标,将公交车到站时间相关的影响因素进行特征化后,基于海量历史数据训练机器学习模型,进而预测公交到站时间。实例分析和验证结果表明,GBDT方法的预测性能明显优于其他方法,可显着提高公交到站时间预测的准确性。(本文来源于《重庆理工大学学报(自然科学)》期刊2019年10期)
任雪,郭艳[5](2019)在《基于主动集成学习的中医智能诊断模型及构建方法》一文中研究指出作为医学和人工智能的交叉学科,智能诊断技术无论在学术界还是产业界都得到广泛关注。与基于标准化西医的智能诊断有所不同,以辨证论治为原则的中医个性化诊疗理念不同于西医,使得中医智能诊断面临有效训练样本缺失和机器学习模型失真等问题。本文提出了一种基于主动集成学习的中医智能诊断模型及其构建方法,该模型既可通过主动学习机制得到具有因人而异的个性分析能力的诊断分类器,也将多个不同机器学习的模型进行集成训练,获得更为准确的中医知识学习模型。首先将不同来源的中医病历进行大规模数据提取和组织,形成统一视图下的结构化中医数据库。然后以儿科常见病肺炎喘嗽为例,验证了基于主动集成学习的中医智能诊断模型的准确率明显高于机器学习方法,是一种新型、有效的中医诊疗机器学习模型。(本文来源于《中国循证医学杂志》期刊2019年09期)
孙安,于英香,罗永刚,孙逊[6](2019)在《序列标注模型中不同输入特征组合的集成学习与直推学习方法研究——以CCKS-2018电子病历命名实体识别任务为例》一文中研究指出[目的/意义]研究机器学习中集成学习与直推学习方法对电子病历命名实体识别任务的性能影响,为基于机器学习方法的文本信息抽取提供一种性能优化方法。[方法/过程]首先对CCKS-2018提供的电子病历文本进行分析,提取中文分词、词性标注、临床实体类别特征;然后在条件随机场CRF算法下,采用不同输入特征组合的方法构造"基学习器"进行投票集成;最后用直推学习方法对集成学习结果进行优化。[结果/结论]实验中集成学习获得总体效果F_1值86.93%均优于"基学习器"结果值,直推学习获得了模型的最佳泛化性能87.06%,同时多特征组合比单独字特征可以获得更好的"基学习器"。实验证明采用不同输入特征组合的集成学习和直推学习可以有效提升模型的泛化性能,该方法可以在其他相关机器学习与文本信息抽取领域中推广。(本文来源于《情报杂志》期刊2019年10期)
王蕾,赵志强,余红梅,郑楚楚,黄雪倩[7](2019)在《基于重采样和集成学习的弥漫大B细胞淋巴瘤患者复发风险预测模型》一文中研究指出目的对某肿瘤医院血液科2011-2015年283名弥漫大B细胞淋巴瘤患者进行达到完全缓解后叁年内的复发风险预测,为患者叁年内的复发情况提供参考。方法用logistic回归进行复发影响因素分析。采用重采样(包括SMOTE等叁种方法)处理不平衡数据,同时基于boosting集成分别构建C5.0决策树、SVM和logistic回归复发风险预测模型。结果由logistic回归可知,Ki-67(P=0.006,OR=1.826)、LDH是否升高(P=0.012,OR=2.084)、原发纵膈肿物(P=0.033,OR=0.333)及疾病等级(P=0.001,OR=1.605)是弥漫性大B细胞淋巴瘤患者叁年复发的重要影响因素。通过将训练集与测试集回代对各种模型性能进行评价,并用五种评价指标的比较模型性能可知,集成模型均优于其对应的单个学习器;平衡后数据构建模型性能均优于未平衡数据构建模型,其中SMOTE最优;在测试集验证的模型中,经过SMOTE平衡数据构建SVMBOOST集成模型(准确率=0.93,F值=0.94,AUC=0.93,Rmse=0.26,G-mean=0.93,灵敏度=0.97)和C5.0BOOST模型(准确率=0.94,F值=0.95,AUC=0.94,RMSE=0.24,G-mean=0.94,灵敏度=0.94),均有较优的表现。结论基于重采样和集成学习构建的经过SMOTE平衡后SVMBOOST模型达到预期效果。(本文来源于《中国卫生统计》期刊2019年04期)
蒋正婷,袁章帅,闫瑞林[8](2019)在《基于IAFSA-BP并行集成学习算法的大学生就业预测模型》一文中研究指出随着我国高校毕业人数逐年增加,大学生"就业难"问题越发突出,其已然成为了社会广泛关注的热点之一。准确预测大学生的就业前景,提高当代大学生的就业率及就业质量引起了党中央和国家的高度重视。因此,本文通过将改进的人工鱼群算法优化BP神经网络的权值和阈值,提出了基于IAFSA-BP神经网络并行集成学习算法的大学生就业预测模型,并将整理的数据集在matlab中进行仿真实验时达到了极佳的预测效果,以期该模型能为推动大学生高质量就业提供参考意见。(本文来源于《价值工程》期刊2019年19期)
张晨阳[9](2019)在《基于ARMA模型与GRU模型集成学习在量化投资中的应用》一文中研究指出能够预测一件事情的发生,一直是人们想要探讨的问题,通过细致而又精确的预测,可以提前做一些准备,有较好的事情发生,则积极准备让它变得更好。如果预测到一些较为不好的事情即将发生,则提前做好准备,尽量减少损失。随着科学技术,人类社会等各个方面的不断进步,人们越发想要根据现在的状况预判未来事情的发展,为此,时间序列预测方法得到了飞跃的发展。目前主要有两种预测的方法。第一为传统经典的时间序列预测方法,例如GARCH、ARMA等。经过长时间的发展,时间序列在各个行业得到了非常广泛的应用,但是这种方法对数据要求很大,甚至很多时候需要很多假设,所以实际应用常会浪费很多时间,且有时并不能得到一个比较满意的结果,尤其是面对股票市场长时间走势不断地突变;第二为机器学习中的集中预测方法,最典型的为神经网络模型,神经网络由于其不拘泥于假设而且应用范围宽广,所以自从产生开始便得到了很高的重视,但是其很多模型过于复杂而导致运算时间过长甚至产生过拟合现象。在股市中,随着时间的推移,上市公司增多,国内经济跟国外联系更加紧密,数据越来越多,也越来越复杂,预测的难度也随之增大,出现了量化投资概念。为此现在有很多的学者想办法将二者结合起来,在保证二者优点的同时避免其缺点,然后在量化投资的使用中提高预测的精度。本文首先运用机器学习中集成学习的方法将时间序列中的自回归模型(AR模型)与门限回归模型(GRU模型)结合起来,得到AR-GRU模型。并将其运用于2005年1月至2018年7月上证指数日数据中进行学习,然后根据学习得到的结果对之后的数据进行预测,对比真实结果以及预测结果,分析其偏差情况。本文还提出了另一种集成学习模型,将时间序列中移动平均模型(MA模型)与门限回归模型(GRU模型)集成起来,得到GRU-MA模型。同样将其运用于2005年1月至2018年7月上证指数日数据中进行学习,然后根据学习得到的结果对之后的数据进行预测,对比真实结果以及预测结果,分析其偏差情况。最后将AR-GRU模型、GRU-MA模型、ARMA模型、GRU模型的预测结果进行对比,得出新模型在预测精度上比原模型均高。(本文来源于《广西大学》期刊2019-06-01)
于建宇[10](2019)在《基于集成学习算法的妊娠期糖尿病预测模型研究》一文中研究指出妊娠期糖尿病是导致胎儿发育不良和产妇妊娠困难的危险因素之一,因此在早期能够实现对妊娠期糖尿病的发病预测,可以辅助医生诊断。本文采用集成模型算法构建妊娠期糖尿病预测模型,并对级联分类原理在疾病预测模型中的不足进行完善和改进,以及对模型进行个性化解释,有助于建立个性化的疾病预防管理方案。为了构建性能更优的基于集成学习算法的妊娠期糖尿病预测模型,本文做了以下的研究工作:(1)将样本数据进行清洗和数据描述,并根据变量的IV值进行筛选,在筛选过程中进行离散值替换和连续变量等距分割,并依照IV值0.1~0.5作为阈值,筛选出代入模型的九个变量;(2)在提升模型准确性方面,将样本数据按照7:3的比例分割出训练集和测试集,并采用xgboost,lightgbm和catboost叁种集成算法构建妊娠期糖尿病预测模型,并选择F1分数作为模型评价指标,应用网格调参与交叉验证方法进行参数调优,并进行模型比较;进一步应用级联原理提升F1分数预测准确率,通过研究样本覆盖度和分位数准确率的关系,确定级联结构阈值为70%,并对叁种级联结构进行比较,最终根据准确率选取以catboost作为主模型的级联结构;(3)在模型解释方面,采用shap框架对catboost模型从样本的粒度进行解释,针对每一个样本给出特征的作用大小和特征的作用方向,并采用shapvalue作为评估值进行计算,shap框架的灵活性支持每个样本的特征分解,除此之外还对单个特征在全样本下的作用方向和作用大小进行分析,并根据全样本的shap-value得出特征重要性,以及该特征对模型结果的作用方向。(本文来源于《哈尔滨工业大学》期刊2019-06-01)
集成学习模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
雷达信号分类是雷达信号电子侦察的关键技术之一,针对利用深度学习模型进行雷达信号分类时其性能不稳定的缺点,提出了一种基于集成学习的深度信念网络模型进行分类的方法.通过深度信念网络模型不同层间的特征抽取,通过不同的分类器得到不同的分类结果,再将分类结果进行集成,得到最终的输出.待分类的雷达信号由12部雷达产生,包括常规、参差、频率捷变和抖动四种雷达.仿真结果表明,该模型的分类错误率较低,鲁棒性较好.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
集成学习模型论文参考文献
[1].祁欣学,覃锡忠,贾振红,常春,樊树铭.基于田口集成学习的最佳交通流量预测模型[J].计算机工程与设计.2019
[2].郜丽鹏,李勇.一种基于集成学习的DBN模型分类方法[J].哈尔滨商业大学学报(自然科学版).2019
[3].张碧怡,肖宇谷,曾宇哲.车险定价中风险因子重要性测度的比较研究——基于集成学习方法和广义线性回归模型[J].保险研究.2019
[4].荆灵玲,解超,王安琪.基于集成学习的公交车辆到站时间预测模型研究[J].重庆理工大学学报(自然科学).2019
[5].任雪,郭艳.基于主动集成学习的中医智能诊断模型及构建方法[J].中国循证医学杂志.2019
[6].孙安,于英香,罗永刚,孙逊.序列标注模型中不同输入特征组合的集成学习与直推学习方法研究——以CCKS-2018电子病历命名实体识别任务为例[J].情报杂志.2019
[7].王蕾,赵志强,余红梅,郑楚楚,黄雪倩.基于重采样和集成学习的弥漫大B细胞淋巴瘤患者复发风险预测模型[J].中国卫生统计.2019
[8].蒋正婷,袁章帅,闫瑞林.基于IAFSA-BP并行集成学习算法的大学生就业预测模型[J].价值工程.2019
[9].张晨阳.基于ARMA模型与GRU模型集成学习在量化投资中的应用[D].广西大学.2019
[10].于建宇.基于集成学习算法的妊娠期糖尿病预测模型研究[D].哈尔滨工业大学.2019