随机选择算法论文-李光华,李俊清,张亮,辛衍森,邓华伟

随机选择算法论文-李光华,李俊清,张亮,辛衍森,邓华伟

导读:本文包含了随机选择算法论文开题报告文献综述及选题提纲参考文献,主要关键词:特征选择,蚁群算法,随机森林

随机选择算法论文文献综述

李光华,李俊清,张亮,辛衍森,邓华伟[1](2019)在《一种融合蚁群算法和随机森林的特征选择方法》一文中研究指出面对海量的高维数据,剔除冗余特征来进行特征筛选,已成为当今信息与科学技术面临的重要问题之一。传统的特征选择方法不适合对整个特征空间进行搜索,其运行性能以及准确性低下。文中提出了一种融合蚁群算法和随机森林的特征选择方法,该方法将随机森林的重要度评分作为蚁群算法的启发式信息,然后采用蚁群算法进行智能搜索,并将特征选择结果作为评价指标实时反馈给蚁群的信息素。实验表明,该特征选择方法与传统特征选择方法相比,能够有效地减少数据集中的特征数量,同时提高了数据分类的准确率。(本文来源于《计算机科学》期刊2019年S2期)

周强,徐宏伟,陈逸,孙玉宝[2](2019)在《随机多选择残差网络集成的遥感图像分类算法》一文中研究指出深度卷积网络作为一种高效的特征表示学习算法,被广泛的应用于图像分类问题中.由于遥感图像存在目标尺度与方向变化大、类内场景差异形大等问题,单一的深度网络通常不能获得准确的分类结果.为此,本文提出一种随机多选择残差网络集成的遥感图像分类算法,该算法通过多选择学习策略,集成多个残差网络共同完成分类任务,算法设置有效的集成学习目标函数,并通过随机梯度下降算法最小化多个子网络对每个样本的最优分类误差,促使各个网络之间的差异性,能够自适应于特定类别的分类任务,进而形成有效的分类,同时其泛化性通常显着优于单个学习器.在两个公开的遥感数据集上验证了本文算法的有效性,多个残差网络能够对不同类别的遥感影像形成最优分类,有效提升了分类的准确性.(本文来源于《小型微型计算机系统》期刊2019年09期)

陈乾[3](2019)在《基于随机分布式贪心算法的变量选择》一文中研究指出近年来,随着大数据时代的来临,数据量级及其维数呈现出爆发式增长,因而变量选择作为大数据分析的重要研究内容之一受到越来越多关注。其中,贪心算法以其假设条件少、参数少、边界可给出等优点被广泛应用于变量选择。然而,随着数据量级和维数地不断提高,贪心算法的时间消耗也变得越来越大。为了解决大数据变量选择带来的问题,已有不同条件下的贪心算法及改进算法得到研究,尤其是,分别基于分布式和随机式的改进贪心算法基于次模函数的理论边界得到证明并被验证运行速度提升,随后基于弱次模性的算法研究也得到更多关注。受启发于此,结合数据量级和维数不断增长的现状,本文提出了基于弱次模性衡量函数的变量选择方法,称为随机分布式贪心算法,该算法具有运行速度更快,适用于更大量级、更多情形数据的特点。相对于基于次模函数研究的变量选择方法,随机分布式贪心算法具有更广泛适用范围;相对于已有贪心算法,随机分布式贪心算法具有更快运行速度。此外,本文证明了随机分布式贪心算法的理论边界,并将其与经典贪心算法、随机式贪心算法、分布式贪心算法在次模性和弱次模性衡量函数条件下的理论边界进行对比。进一步通过数值模拟实验,将随机分布式贪心算法和经典贪心算法、LASSO等算法进行对比,在不同情况下比较它们的效果和效率。理论证明和模拟实验结果表明,本文提出的随机分布式贪心算法兼顾变量选择的效果和效率,并适用于更广的范围,这些特点使得该算法更好地适应当前数据环境复杂的现状,具有理论意义和现实意义。(本文来源于《华东师范大学》期刊2019-05-01)

李鲜,王艳,罗勇,周激流[4](2019)在《基于随机森林特征选择算法的鼻咽肿瘤分割》一文中研究指出针对医学图像中存在的灰度对比度低、器官组织边界模糊等问题,提出一种新的随机森林(RF)特征选择算法用于鼻咽肿瘤MR图像的分割。首先,充分提取图像的灰度、纹理、几何等特征信息用于构建一个初始的随机森林分类器;随后,结合随机森林特征重要性度量,将改进的特征选择方法应用于原始手工特征集;最终,以得到的最优特征子集构建新的随机森林分类器对测试图像进行分割。实验结果表明,该算法对鼻咽肿瘤的分割精度为:Dice系数79.197%,Acc准确率97.702%,Sen敏感度72.191%,Sp特异性99.502%。通过与基于传统随机森林和基于深度卷积神经网络(DCNN)的分割算法对比可知,所提特征选择算法能有效提取鼻咽肿瘤MR图像中的有用信息,并较大程度地提升小样本情况下鼻咽肿瘤的分割精度。(本文来源于《计算机应用》期刊2019年05期)

徐少成,李东喜[5](2018)在《基于随机森林的加权特征选择算法》一文中研究指出文章提出了一种基于随机森林的加权特征选择算法WRFFS。算法以随机森林为基础,以分类精度作为筛选特征子集的标准,通过在数据集上构造多棵决策树,采用交叉验证的方式进行特征的重要性度量,各决策树的权重和特征重要性度量加权求和决定了最终的特征重要性排序,然后再采用序列后向选择法(Se-quential backward selection,SBS)进行特征的筛选,其中决策树的权重由该决策树与预测结果的相符程度来决定。最后,通过对比实验表明该方法WRFFS比已有文献中方法具有更好的分类性能。(本文来源于《统计与决策》期刊2018年18期)

刘凯[6](2018)在《随机森林自适应特征选择和参数优化算法研究》一文中研究指出随机森林算法(Random Forest)是机器学习领域中一种普适性良好的数据挖掘方法。它在决策树算法的理论之上结合bootstrap重采样方法,集合多个单树型分类器,最后结果通过投票的策略进行分类和预测。随机森林算法具有理论易理解、调整的参数较少、抗噪声能力强,最重要的是在实际的应用中分类性能非常高和不容易过拟合等特性。随机性能良好以及不需要样本背景知识的性能让其在很多领域得到了广泛的实际应用,为此许多研究学者对随机森林进行了广泛的研究和改进。本文在分析国内外相关研究发现,随机森林算法的特征选择具有随意性,会导致忽略特征对类别的重要性以及特征与特征之间的相关性,同时随机森林的参数选择很难学习出最优参数组合并且参数选择过程效率很低。本文针对以上问题,从不同的视角在随机森林的特征选择和参数选择上做了一系列的探索和研究工作。本文首先对随机森林算法的综述进行阐述,分析了随机森林算法的随机性机制、性能指标以及存在的问题。然后针对随机森林算法特征选择的随机性,提出了自适应特征选择分类算法SARFFS,该算法首先利用卡方检验样本间关联程度后自助采样,并设计出一种特征对类代表强弱程度的计算方法;然后引入自适应稀疏约束机制Group LASSO优化特征的选择,进而解决了随机森林选择特征时的局限性;,该方法首先从粒子群的学习因子和粒子的位置对粒子群进行改进。针对粒子运动轨迹不同阶段的不同需求,基于学习因子提出了一种基于反正弦调整因子的策略。针对传统的PSO算法在更新粒子位置时,没有考虑到每次迭代过程中上下文对粒子的影响,本文对PSO算法的递推方程进行迭代更新,提出了新的递推公式,从而提高了算法的寻优能力。(本文来源于《长春工业大学》期刊2018-06-01)

刘凯,郑山红,蒋权,赵天傲[7](2018)在《基于随机森林的自适应特征选择算法》一文中研究指出为了解决传统的随机森林算法在随机特征选择时,导致少数比较重要的特征变量被过滤掉的问题,以及没有考虑特征变量相关性对预测应变量准确性带来的影响,提出了一种基于随机森林的自适应特征选择算法SARFFS。该算法首先利用卡方检验样本间关联程度后自助采样,并设计出一种特征对类代表强弱程度的计算方法;然后引入自适应稀疏约束机制Group LASSO优化特征的选择;最后在Spark分布式计算平台利用UCI数据集进行实验,结果表明,相比传统的RF算法,SARFFS算法在特征子集选择上具有更好的性能,在F1上提升将近9%。从最终排名靠前的重要特征分析,该算法能够考虑特征间相关性,对预测结果确实有影响,并有效地提高了随机属性权值的可靠性和稳定性。(本文来源于《计算机技术与发展》期刊2018年09期)

郭俊含,李维国[8](2018)在《基于新的随机选择方式的随机Kaczmarz算法》一文中研究指出1引言Kaczmarz算法[8]是求解超定相容线性方程组的最受欢迎的方法之一,Ax=b,(1.1)其中矩阵A=(a_(ij))∈C~(m×n)(m≥n),b=(b_1,b_2,…,b_m)~T∈C~m,a_i~T(i=1,2,…,m)表示矩阵A的行.由于其简单且收敛速度快,Kaczmarz算法的应用范围非常广泛,最早是被(本文来源于《高等学校计算数学学报》期刊2018年01期)

张鑫,吴海涛,曹雪虹[9](2018)在《Hadoop环境下基于随机森林的特征选择算法》一文中研究指出针对传统随机森林算法不能有效、快速地处理海量高维数据,导致分类效果不理想的问题,以提高分类准确率和运行效率为目的,提出了一种基于Hadoop平台的分布式可扩展随机森林算法。该算法采用基于袋外数据集测试准确率变化的特征选择算法,在分布式平台上使用MapReduce构建随机森林,然后通过改变袋外数据的每一列特征获取每一棵决策树对应的特征重要性度量及权重,运用两者的加权求和求得特征重要性排序,其中决策树的权重取决于决策树与集体随机森林预测的一致性。最后,在特征重要性排序的基础上引入了一定的随机性,确保了每棵树的强度,又减少了树与树间的相关性。实验结果表明,相比于传统单机模式下的随机森林特征选择算法,该算法在分类的准确性和运行效率上效果良好。(本文来源于《计算机技术与发展》期刊2018年07期)

苏亚麟,吕开云[10](2018)在《基于随机森林算法的特征选择的水稻分类——以南昌市为例》一文中研究指出在南方水稻遥感分类中,耕地细碎化;干扰性其他植被多是造成分类效果差主要因素。针对此类因素可对多时相影像进行特征提取、迭加成多时相特征集合,利用随机森林并结合归一化特征重要性对多时相影像特征集合进行特征测试,分析每个特征对分类结果的影响。根据每个变量的影响程度(贡献程度)的不同进行一个排序,从而选出最优的分类的特征优选子集。再利用随机森林作为分类器,对特征优选子集进行水稻的分类提取的识别方法。与3组未进行特征选择的SVM(支持向量机)算法的分类结果进行对比。实验结果表明:1)多时相影像的特征集合的分类精度高于单时相影像的特征集合的分类精度;2)基于随机森林对原始特征集合进行特征选择后的总体精度92.09%和Kappa系数90.36%,特征选择能有效去除冗余信息,从而提高分类精度。综上所述,在耕地细碎化,多植被干扰的南方丘陵地带中,结合随机森林的归一化特征选择的方法为水稻的识别和提取研究提供了有效方法。(本文来源于《江西科学》期刊2018年01期)

随机选择算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

深度卷积网络作为一种高效的特征表示学习算法,被广泛的应用于图像分类问题中.由于遥感图像存在目标尺度与方向变化大、类内场景差异形大等问题,单一的深度网络通常不能获得准确的分类结果.为此,本文提出一种随机多选择残差网络集成的遥感图像分类算法,该算法通过多选择学习策略,集成多个残差网络共同完成分类任务,算法设置有效的集成学习目标函数,并通过随机梯度下降算法最小化多个子网络对每个样本的最优分类误差,促使各个网络之间的差异性,能够自适应于特定类别的分类任务,进而形成有效的分类,同时其泛化性通常显着优于单个学习器.在两个公开的遥感数据集上验证了本文算法的有效性,多个残差网络能够对不同类别的遥感影像形成最优分类,有效提升了分类的准确性.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

随机选择算法论文参考文献

[1].李光华,李俊清,张亮,辛衍森,邓华伟.一种融合蚁群算法和随机森林的特征选择方法[J].计算机科学.2019

[2].周强,徐宏伟,陈逸,孙玉宝.随机多选择残差网络集成的遥感图像分类算法[J].小型微型计算机系统.2019

[3].陈乾.基于随机分布式贪心算法的变量选择[D].华东师范大学.2019

[4].李鲜,王艳,罗勇,周激流.基于随机森林特征选择算法的鼻咽肿瘤分割[J].计算机应用.2019

[5].徐少成,李东喜.基于随机森林的加权特征选择算法[J].统计与决策.2018

[6].刘凯.随机森林自适应特征选择和参数优化算法研究[D].长春工业大学.2018

[7].刘凯,郑山红,蒋权,赵天傲.基于随机森林的自适应特征选择算法[J].计算机技术与发展.2018

[8].郭俊含,李维国.基于新的随机选择方式的随机Kaczmarz算法[J].高等学校计算数学学报.2018

[9].张鑫,吴海涛,曹雪虹.Hadoop环境下基于随机森林的特征选择算法[J].计算机技术与发展.2018

[10].苏亚麟,吕开云.基于随机森林算法的特征选择的水稻分类——以南昌市为例[J].江西科学.2018

标签:;  ;  ;  

随机选择算法论文-李光华,李俊清,张亮,辛衍森,邓华伟
下载Doc文档

猜你喜欢