选择性集成学习论文-扈晓君,康宁

选择性集成学习论文-扈晓君,康宁

导读:本文包含了选择性集成学习论文开题报告文献综述及选题提纲参考文献,主要关键词:支持向量机,特征选择,选择性集成学习

选择性集成学习论文文献综述

扈晓君,康宁[1](2019)在《基于特征选择的SVM选择性集成学习方法》一文中研究指出本文提出了一种结合SVM的选择性集成学习方法。算法基于集成学习的基本框架,通过对输入的训练子集进行特征选择处理并对随后的基分类器进行泛化能力的排序和选择,形成了一个新的集成分类器,以提高性能。文中试验采用UCI数据集与传统的Bagging算法做对比,结果表明本文算法可以有效地改善分类效果。(本文来源于《电子技术与软件工程》期刊2019年18期)

金怀平,黄思,王莉,陈祥光,潘贝[2](2019)在《基于进化多目标优化的选择性集成学习软测量建模》一文中研究指出常规集成学习软测量方法忽略了输入变量选择的多样性,而且没有对基模型进行修剪,从而造成集成模型复杂度高、预测性能受限。为此,提出一种基于进化多目标优化(EMO)的选择性集成学习(SE)高斯过程回归(GPR)软测量建模方法,称为EMO-SEGPR。该方法融合输入特征扰动,通过结合bootstrapping随机重采样和偏互信息相关分析(PMI)构建多样性输入变量子集,并据此建立多样性GPR基模型。然后,基于EMO算法对GPR基模型进行集成修剪,从而获得一组集成规模较小、多样性和准确性较高的基模型。最后,引入集成学习策略实现GPR基模型的融合。将EMO-SEGPR方法应用于青霉素发酵过程和Tennessee Eastman化工过程,实验结果表明了该方法的有效性和优越性。(本文来源于《高校化学工程学报》期刊2019年03期)

汤健,乔俊飞[3](2019)在《基于选择性集成核学习算法的固废焚烧过程二恶英排放浓度软测量》一文中研究指出城市固废焚烧(MSWI)过程排放的二恶英(DXN)是被称为"世纪之毒"的持续性污染物。该过程的多阶段、多温度区间的物理化学特性导致DXN排放浓度的机理模型难以构建。工业实际中通常以月或季为周期耗时近1周时间在实验室以离线化验方式滞后检测。针对这些问题,提出了基于选择性集成(SEN)核学习算法的DXN排放浓度软测量方法。首先,基于先验知识给出候选核参数集和候选惩罚参数集,采用核学习算法构建基于这些超参数的候选子子模型;然后,耦合优化和加权算法对相同核参数的候选子子模型进行选择与合并,进而得到基于不同核参数的候选SEN子模型集合;最后,再次采用优化和加权算法获得结构与超参数自适应的多层SEN软测量模型。采用UCI平台水泥抗压强度和焚烧过程DXN数据验证了所提方法的有效性。(本文来源于《化工学报》期刊2019年02期)

饶川,苟先太,金炜东[4](2018)在《基于选择性集成学习的高速列车故障识别研究》一文中研究指出在SVM分类识别中,分类器模型一经训练得到,对所有测试样本进行无差别的识别。针对高速列车故障中样本的分类识别是存在区域分类精度的情况,提出了一种基于选择性集成学习的SVM多分类器融合算法。该方法选取测试样本最邻近的k个训练样本;然后选择对其分类效果好的SVM分类器进行融合,以提高分类准确率;最后使用高速列车故障数据进行了实验,并与Ada Boost、KNN、Bayes、SVM分类方法进行了比较。实验结果表明,该算法提高了分类识别准确率。(本文来源于《计算机应用研究》期刊2018年05期)

郑丽容[5](2017)在《基于聚类和动态更新的启发式选择性集成学习算法》一文中研究指出一直以来,机器学习在各大领域都发挥着强大的作用。我们在日常生活中收集到很多不同领域的数据集,机器学习针对这些数据集进行建模,在模型分析过程中我们可得到一些潜在隐含的有用信息。机器学习的最终目的是用于模型的预测。集成学习是机器学习界的一个重要研究领域。与以往使用的单一学习器不同,集成学习是通过使用多个学习器集成的系统来解决问题的。而且,它已被成功地应用于众多应用领域中(如语音识别、医学诊断病情、超市物品摆放设计等等)。但随着海量数据不断地增大,集成学习也遭遇了各种挑战与危机。而随着“选择性集成”的提出,使得选择性集成在多方面所展示的性能都得到了极大地提升。然而,如何从大量学习器中挑选学习器子集从而得到最佳的效果,目前对选择性集成的研究效果仍不理想。本文提出的基于聚类和动态更新的启发式选择性集成学习算法HCIU,预测能力和精度都得到了极大提高。本文起先分别讲述了集成学习和选择性集成学习的相关基础知识理论,接着开始深入研究了 HCIU算法。论文的主要研究工作包含下面六个方面:1、提出了基于特征的自动化最优选择策略。在预处理步骤将数据进行降维处理,根据信息增益、信息增益率以及皮尔森相关系数叁个指标的重要性度量,自动化的选择出最优的特征集合。2、提出了利用多线程技术并行优化基分类器的参数,从而可以快速获得效果最好的基分类器的最优参数。3、提出了对训练后的基分类器进行聚类选择,将相似基分类器剔除,不仅减少占用内存空间,且可以提高效率。4、提出了基于模拟退火Metropolis准则的分层动态更新筛选的集成模型,利用多层迭代更新筛选最优子集的策略,使得最终得到性能最佳的基分类器集合。5、提出了一种新的加权投票策略,利用二分法将大任务一分为二,重复迭代成多个子任务模式,并根据正确率来归一化分配每个子任务的权值大小,最后可通过多任务多线程的方法运行子任务得到最后的投票结果,提高了集成分类器的投票速度。(本文来源于《厦门大学》期刊2017-05-01)

李美岭[6](2017)在《基于选择性集成学习的迁移学习算法研究》一文中研究指出传统的机器学习是基于统计学的机器学习,其中一个基本的假设条件就是训练和测试数据来自相同的特征空间并且具有相同的概率分布。然而,在很多实际应用中,这种假设往往并不成立,导致传统的机器学习技术对这种问题的解决失去了效力。近年来,迁移学习(transfer learning)作为一种新的学习典范被用于处理这种挑战。迁移学习最大的特点就是利用从旧的源领域学习到的知识帮助一个新的目标领域完成学习任务,使得传统的从零开始的学习变为可以积累的学习。目前学者们已经提出很多方法用于解决迁移学习文本分类问题,比如利用支持向量机、人工神经网络等等。尽管研究表明这些方法取得了比较好的分类性能,但是单一模型用于解决迁移学习问题存在着一定的局限性,因此有学者提出使用集成学习解决该问题。然而,集成学习需要多个基模型,这就增加了时间和空间复杂性,同时泛化能力差的基模型也会影响最终的分类效果。在原始集成系统中选择一个子集用于构建集成系统可以很好的解决这个问题,该方法被称为集成剪枝,也可以称为选择性集成(selective ensemble)。选择性集成技术可以有效解决集成学习中存在的高计算复杂度的缺点。本文提出了一种新颖的基于知识杠杆的RankRE-TL算法用于解决迁移学习文本分类问题。该算法将基于知识杠杆的迁移学习机制同基于减小错误的排序准则RankRE(Rank-based Reduce Error evaluation measure)结合完成迁移任务。RankRE准则的设计原理是选择一个候选分类器,使得其并入到当前子集成系统后形成新的子集成系统的泛化误差最小。RankRE-TL算法针对源领域数据和目标领域已标注数据分布存在一定相似性,但两域之间已标注数据数量严重失衡的问题,提出了一种动态数据重组的方法来解决该问题。通过将大量源数据利用Bootstrap技术按不同比例选取多个训练子集分别与少量的目标域训练数据结合得到多个重构的训练集,然后分别训练分类器得到原始集成系统。另外,与传统的选择性集成技术构建验证集的方式不同,RankRE-TL设计了一种新的方法来构造剪枝集。然而基于RankRE评估准则的选择性集成算法是一种贪婪的算法,容易限于局部最优解。为解决该问题,同时为了更有效地迁移源域知识,本文提出了一种融合TrSVM与选择性集成方法GASEN的迁移算法TrGASVM。其中,TrSVM首先在基于动态数据集重组的基础上训练多个源域模型,得到多个支持向量集(SV)。对每个SV集,按照其与目标领域训练数据的相似度分配权重,并和目标域训练数据组合得到新的训练集,最后在各训练集上分别训练模型得到迁移SVM集成系统。GASEN算法是基于组合优化的启发式算法,利用遗传算法实现对集成中模型的选择,不仅具有遗传算法的优点,也可以避免贪婪集成剪枝所具有的局部最优问题。TrGASVM融合TrSVM和GASEN用于迁移学习,这样不仅具有TrSVM算法的优点,也结合了GASEN的优势,因此能够更有效的对源域知识进行迁移。(本文来源于《南京航空航天大学》期刊2017-03-01)

杨菊,袁玉龙,于化龙[7](2016)在《基于蚁群优化的极限学习机选择性集成学习算法》一文中研究指出针对现有极限学习机集成学习算法分类精度低、泛化能力差等缺点,提出了一种基于蚁群优化思想的极限学习机选择性集成学习算法。该算法首先通过随机分配隐层输入权重和偏置的方法生成大量差异的极限学习机分类器,然后利用一个二叉蚁群优化搜索算法迭代地搜寻最优分类器组合,最终使用该组合分类测试样本。通过12个标准数据集对该算法进行了测试,该算法在9个数据集上获得了最优结果,在另3个数据集上获得了次优结果。采用该算法可显着提高分类精度与泛化性能。(本文来源于《计算机科学》期刊2016年10期)

徐晓杨,纪志成[8](2016)在《选择性集成极限学习机分类器建模研究》一文中研究指出极限学习机ELM(Extreme Learning Machine)具有训练过程极为快速的优点,但在实际分类应用中ELM分类器的分类精度和稳定性有时并不能满足要求。针对这一问题,在ELM用于分类时引入一种训练结果信息量评价指标来改进输出权值矩阵的求解方法,并增加隐层输出矩阵竞争机制来提高ELM的稳定性。为了进一步提高ELM的分类正确率,借鉴神经网络集成的理论,提出一种选择性集成ELM分类器。在集成方法中采用改进Bagging法并提出一种基于网络参数向量的相似度评价方法和选择性集成策略。最后通过UCI数据测试表明,同Bagging法和传统的全集成法相比,该方法拥有更为优秀的分类性能。(本文来源于《计算机应用与软件》期刊2016年09期)

朱俊[9](2016)在《选择性集成学习及其应用研究》一文中研究指出集成学习是一种机器学习范式。相对传统的单个分类器,通过组合多个分类器,集成学习能显着地提高分类器的泛化能力。目前,集成学习在疾病诊断、生物特征识别、文本分类和信息处理等领域获得了广泛应用。作为集成学习的一个研究方向,选择性集成学习试图从已有的个体学习机中剔除一些性能不佳的,从而获得更好的集成性能。然而,在选择性集成系统中如何选取基分类器,确定最优分类器组合等,仍需进一步深入研究。论文研究对提高集成系统性能,促进集成学习在实际中应用,具有重要的理论与现实意义。论文从集成学习基础理论、集成方法、选择性集成及应用等方面进行研究,重点研究了集成学习中基分类器选取问题,主要研究内容和工作成果如下:1、对集成学习理论进行了深入分析,研究了集成学习理论基础,基分类器产生、基分类器融合方式及集成性能评价指标。考虑到实际应用数据复杂性,研究了数据预处理、归一化、降维及不平衡数据处理方法,为后续研究奠定基础。2、集成学习因其显着提高一个学习系统的泛化能力而得到机器学习界的广泛关注。以决策树分类方法为基础,运用Bagging算法,结合医疗疾病数据,构建基于Bagging的决策树集成诊断模型。对比集成学习模型与单一决策树模型的诊断性能,实验结果验证了集成学习诊断方法具有更好的泛化能力。3、基分类器的准确率与多样性在集成学习机的构建中起着至关重要的作用。针对基分类器选取问题,提出了一种兼顾准确率和多样性的BAD(Balancing Accuracy and Diversity)选取准则;在此基础上,建立了BAD的选择性集成模型,实验分析了BAD准则中,不同权值的准确率和多样性对集成模型准确率的影响,同时也验证了BAD准则的有效性。在基分类器选取方法上,以遗传算法为基础,结合前序和后序选择思想,提出了一种FBGA(Forward and Backward Genetic Algorithm)选取方法,实验结果表明,FBGA方法在搜索结果上表现出较好性能。(本文来源于《华东交通大学》期刊2016-06-30)

张友强[10](2016)在《基于选择性集成学习的离群点检测研究》一文中研究指出离群点检测是数据挖掘中一个非常重要的研究方向。离群点是指明显异常于其他对象,与当前的模型不一致或有偏差的数据。离群点检测主要是为了发现潜在的、有意义、有价值的知识,它在欺诈检测、入侵检测、医疗图像识别、天文观测和农业病虫害检测等诸多领域都有着广泛的应用。然而,现有的离群点检测方法还面临着很多问题。一方面,由于存在数据稀疏和高维度等问题,现有的方法难以从高维数据中有效地检测出离群点;另一方面,现有方法的泛化能力还比较差,对于新数据的检测性能和检测效率不高。集成学习将多个不同的单一模型组合成一个复合模型,利用这些单个模型之间的差异,可以有效改善集成模型的泛化性能。不同于传统的集成学习,选择性集成学习只选择一部分准确率高且差异性大的基学习器来构建集成学习器,在降低学习系统的计算与存储开销的同时,有望获得更好的泛化性能。针对当前的离群点检测方法所存在的问题,本文基于选择性集成学习来开展离群点检测的研究,重点研究了高维数据下的离群点检测问题,以及离群点检测算法的泛化性能的提升问题。首先,针对高维数据下的离群点检测所面临的问题,提出了近似约简的概念,并由此提出一种基于近似约简的集成学习算法。另外,还提出了一种基于近似约简和最佳抽样的选择性集成学习算法;其次,为了提升离群点检测算法的泛化性能,提出了一种基于多模态扰动的选择性集成学习算法。另外,还提出了一种基于随机贪心选择的选择性集成算法。本文将上述算法分别应用于离群点检测中。实验结果表明,相对于传统的算法,本文提出的算法具有更好的离群点检测性能。本文的工作主要包括以下几个方面:首先,对粗糙集中的约简概念进行了扩展,提出一种近似约简的概念,并由此提出一种基于近似约简的集成学习算法ELAR。ELAR算法在对高维数据进行有效降维的同时,可以获得较好的离群点检测性能。实验结果表明,ELAR算法的检测准确率和时间复杂度均好于现有的算法。其次,在上面所提出的近似约简的基础上,进一步提出了一种基于近似约简和最佳抽样的选择性集成学习算法SE_AROS。实验结果表明,SE_AROS算法的性能要好于传统的算法。然后,针对集成学习中单模态扰动所存在的问题,提出了一种基于多模态扰动的选择性集成学习算法ELSR。ELSR算法采用抽样技术以及粗糙集中的属性约简方法来进行多模态扰动,可以获得一组差异性大的基学习器。在多个数据集上的实验结果证实,与其他算法相比,ELSR算法具有更好的离群点检测性能。最后,针对基于贪心法的选择性集成学习算法易过早陷入局部最优的问题,提出了一种基于随机贪心选择的选择性集成算法NSERGS。NSERGS算法通过引入一种随机化策略来扩展贪心搜索的搜索空间,不仅降低了算法陷入局部最优的可能性,而且使得计算性能也得到了改善。(本文来源于《青岛科技大学》期刊2016-06-12)

选择性集成学习论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

常规集成学习软测量方法忽略了输入变量选择的多样性,而且没有对基模型进行修剪,从而造成集成模型复杂度高、预测性能受限。为此,提出一种基于进化多目标优化(EMO)的选择性集成学习(SE)高斯过程回归(GPR)软测量建模方法,称为EMO-SEGPR。该方法融合输入特征扰动,通过结合bootstrapping随机重采样和偏互信息相关分析(PMI)构建多样性输入变量子集,并据此建立多样性GPR基模型。然后,基于EMO算法对GPR基模型进行集成修剪,从而获得一组集成规模较小、多样性和准确性较高的基模型。最后,引入集成学习策略实现GPR基模型的融合。将EMO-SEGPR方法应用于青霉素发酵过程和Tennessee Eastman化工过程,实验结果表明了该方法的有效性和优越性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

选择性集成学习论文参考文献

[1].扈晓君,康宁.基于特征选择的SVM选择性集成学习方法[J].电子技术与软件工程.2019

[2].金怀平,黄思,王莉,陈祥光,潘贝.基于进化多目标优化的选择性集成学习软测量建模[J].高校化学工程学报.2019

[3].汤健,乔俊飞.基于选择性集成核学习算法的固废焚烧过程二恶英排放浓度软测量[J].化工学报.2019

[4].饶川,苟先太,金炜东.基于选择性集成学习的高速列车故障识别研究[J].计算机应用研究.2018

[5].郑丽容.基于聚类和动态更新的启发式选择性集成学习算法[D].厦门大学.2017

[6].李美岭.基于选择性集成学习的迁移学习算法研究[D].南京航空航天大学.2017

[7].杨菊,袁玉龙,于化龙.基于蚁群优化的极限学习机选择性集成学习算法[J].计算机科学.2016

[8].徐晓杨,纪志成.选择性集成极限学习机分类器建模研究[J].计算机应用与软件.2016

[9].朱俊.选择性集成学习及其应用研究[D].华东交通大学.2016

[10].张友强.基于选择性集成学习的离群点检测研究[D].青岛科技大学.2016

标签:;  ;  ;  

选择性集成学习论文-扈晓君,康宁
下载Doc文档

猜你喜欢