导读:本文包含了动态特征选择论文开题报告文献综述及选题提纲参考文献,主要关键词:数据流,大数据,特征选择,粗糙集
动态特征选择论文文献综述
高薇,解辉[1](2019)在《基于粗糙集与人工蜂群算法的动态特征选择》一文中研究指出为提高动态数据流特征提取的计算效率与性能,设计一种基于粗糙集与人工蜂群算法的动态数据流特征选择算法。修改人工蜂群算法中雇佣蜂阶段与侦查蜂阶段的位置更新方程,降低人工蜂群算法早熟收敛的几率,增强人工蜂群算法的鲁棒性,使其满足动态特征选择算法的稳定性需要。使用粗糙集定义数据流增量数据的适应度函数,人工蜂群算法从旧特征子集与增量数据提取新的全局特征子集。基于10个公开的数据集分别进行特征提取与分类实验,实验结果表明,该算法在保持较高分类准确率的前提下,明显减少了特征数量,实现了较高的动态特征计算效率。(本文来源于《计算机工程与设计》期刊2019年09期)
肖利军,郭继昌,顾翔元[2](2019)在《一种采用冗余性动态权重的特征选择算法》一文中研究指出由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和叁维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能。针对该问题,提出一种采用冗余性动态权重的特征选择算法,将对称不确定性和叁路交互信息作为评价指标,采用一种动态更新特征权重的方法使目标函数在考虑相关性、交互性的基础上,同时考虑特征间的冗余性。在10种数据集上利用3种分类器与典型的基于互信息的特征选择算法做了对比实验,结果表明所提算法具有更好的特征选择性能。(本文来源于《西安电子科技大学学报》期刊2019年05期)
高万夫,张平,胡亮[3](2019)在《基于已选特征动态变化的非线性特征选择方法》一文中研究指出针对目前大多数基于信息论的线性累加特征选择算法的缺点和不足,并且考虑到已选特征的动态变化对特征选择的影响,本文提出了一种非线性的特征选择算法。实验结果证明,本文算法在平均准确率和最高准确率上都取得了很好的效果。为证明本文算法的优势,将本文算法与7个极具竞争性的特征选择算法在3个不同的分类器和8个真实数据集上进行了比较,实验结果表明,本文算法具有较强的分类优势。(本文来源于《吉林大学学报(工学版)》期刊2019年04期)
王锋,宋鹏[4](2018)在《面向缺失数据的动态特征选择》一文中研究指出随着数据获取工具的快速发展,实际获取到的数据通常是动态更新的,且更新的速度也越来越快.数据集的动态更新通常有叁中类型,即数据规模的更新、维数的更新和数据取值的更新.为此,本文针对含有缺失数据的数据集,通过讨论和分析信息熵随数据变化的更新机制,设计了一种基于信息熵的动态特征选择算法.算法中以信息熵的变化作为特征重要度的度量,进而给出了含有缺失数据的数据集中特征选择结果随数据取值变化的动态更新策略.实验结果进一步验证了新算法的可行性和高效性.(本文来源于《小型微型计算机系统》期刊2018年12期)
程玉胜,李雨,王一宾,陈飞[5](2018)在《动态滑动窗口加权互信息流特征选择》一文中研究指出特征选择是解决数据高维性的一种有效方法,传统的特征选择算法常用经典信息论知识去度量特征的重要度,却忽略了标记和未标记数据的互相影响;同时,这些方法主要基于静态数据的多标记特征选择,很难直接应用到动态流数据环境中.而现实世界中,由于动态环境之下特征到达的数目和顺序都是未知的,并且研究者往往可能只对最近到达的特征感兴趣,所以滑动窗口机制能很好地解决此类问题.基于此,首先引入一种具有补性质的模糊信息熵,并考虑标记和未标记数据的互相影响,提出一种加权的模糊互信息度量方法,然后结合滑动窗口机制,分别提出基于固定滑动窗口的加权模糊互信息特征选择(Feature Selection with Weighted Fuzzy Mutual Information based on Sliding Window,FS-FMI)和基于动态滑动窗口的加权模糊互信息流特征选择(Streaming Feature Selection with Weighted Fuzzy Mutual Information based on Dynamic Sliding Window,SFS-FMI-DSW)两种算法.实验结果表明,SFS-FMI-DSW算法更加有效,统计假设进一步说明了算法的有效性.(本文来源于《南京大学学报(自然科学)》期刊2018年05期)
马忱,姜高霞,王文剑[6](2019)在《面向函数型数据的动态互信息特征选择方法》一文中研究指出函数型数据将观测到的数据作为一个整体,关注数据自身的内在结构而不只是数据的呈现形式,相较于传统的数据包含了更多的信息,因此对函数型数据的分析和研究具有重要的价值。在函数型数据分析中,特征选择也是一个需要解决的问题。提出了一种面向函数型数据的动态互信息(dynamic mutual information,DMI)特征选择方法,充分考虑数据的内在特征,运用互信息将特征进行排序和动态选择,不仅可以获得稳定的特征子集,而且充分考虑了样本在特征选择中的作用,较好地避免了信息的冗余。进一步提出了一种动态条件互信息(dynamic conditional mutual information,DCMI)特征选择方法,在动态特征选择的过程中,考虑到已选特征会对后续的特征选择产生影响,引入条件互信息,将已选特征对待选特征的影响进行量化表示,更恰当地描述特征与特征集合之间的关系。在UCR数据集上的实验结果表明,DMI方法和DCMI方法进行特征选择得到的特征子集规模小且分类精度高。(本文来源于《计算机科学与探索》期刊2019年01期)
王玲,孟建瑶[7](2018)在《基于特征变权的动态模糊特征选择算法》一文中研究指出针对大多数动态特征选择算法不能实时地根据特征重要性的变化动态优化模糊特征的问题,提出了基于特征变权的动态模糊特征选择算法.该算法利用滑动窗口分割模糊化后的数据,在第1个窗口中进行离线模糊特征选择,根据输入模糊特征与输出特征的互信息量,计算各个模糊输入特征的权重,获取候选模糊特征子集,并采取后向特征选择的方式和模糊特征筛选指标得到优化模糊特征子集;在随后的窗口中进行在线模糊特征选择,结合当前窗口的候选模糊特征子集和已有模糊特征选择结果,计算模糊输入特征的重要度,获得当前窗口中的优化模糊特征子集.通过计算窗口之间模糊特征权重的变化,发现输入模糊特征的演化关系.不同数据集的仿真结果表明,所提出算法在自适应性和预测准确性方面均有显着提高.(本文来源于《计算机研究与发展》期刊2018年05期)
任永功,王玉玲,刘洋,张晶[8](2018)在《基于用户相关性的动态网络媒体数据无监督特征选择算法》一文中研究指出移动互联网、社交媒体的快速发展,极大推动了各个领域对文本、图像、视频等网络媒体数据处理的需求.该类数据具有高维度、动态更新、内容复杂的特性,增加了特征计算以及分类难度.同时,当前网络媒体数据的特征选择方法主要针对静态数据,并且对数据格式规范性要求较高.针对上述问题,为保证对动态网络媒体数据的实时特征提取,该文提出了一种基于用户相关性的动态网络媒体数据无监督特征选择算法(Unsupervised Feature Selection Algorithm for Dynamic Network Media Based on User Correlation,UFSDUC).首先,对社交网络中的交互用户进行关系分析,作为无监督特征选择的约束条件.然后,利用拉普拉斯算子构建用户相关性的特征选择模型,量化相关用户之间的关系强弱,通过拉格朗日乘子法给出特征模型中最优用户关系的数学方法.最后,基于梯度下降法设定动态网络媒体数据的阈值,用以计算非零特征权值来更新最优特征子集,达到对网络媒体数据进行有效分类的目的.该算法可在保证用户在相关性完整的基础上对动态网络媒体数据进行准确、实时的特征选择.该文采用3个标准网络媒体数据集,同时与5种目前较为流行的同类型算法进行对比以验证算法的有效性.(本文来源于《计算机学报》期刊2018年07期)
吕子敬,韩顺利,张志辉,刘磊[9](2016)在《一种动态赋权红外光谱特征选择算法研究》一文中研究指出大规模的红外光谱数据集中存在大量无关冗余的特征。针对这一问题,提出了一种动态赋权红外光谱特征选择算法(Dynamic Weight Infrared Spectrum Feature Selection Algorithm,MBDWFS)。该算法把对称不确定性度量标准与近似Markov Blanket相结合,以删除原始光谱数据集中无关冗余的特征,从而获取数据规模较小且最优的特征子集。通过与FCBF、ID_3和ReliefF叁种经典特征选择算法的性能仿真对比试验,证明所提出的MBDWFS算法在整体分类性能上优于其他叁种算法,用于红外光谱的物质分析领域时效果更好。(本文来源于《红外》期刊2016年01期)
唐立力[10](2015)在《基于信息熵与动态聚类的文本特征选择方法》一文中研究指出根据科技文献的结构特点,搭建了一个四层挖掘模式,提出了一种应用于科技文献分类的文本特征选择方法。该方法首先依据科技文献的结构将其分为四个层次,然后采用K-means聚类对前叁层逐层实现特征词提取,最后再使用Aprori算法找出第四层的最大频繁项集,并作为第四层的特征词集合。在该方法中,针对K-means算法受初始中心点的影响较大的问题,首先采用信息熵对聚类对象赋权的方式来修正对象间的距离函数,然后再利用初始聚类的赋权函数值选出较合适的初始聚类中心点。同时,通过为K-means算法的终止条件设定标准值,来减少算法迭代次数,以减少学习时间;通过删除由信息动态变化而产生的冗余信息,来减少动态聚类过程中的干扰,从而使算法达到更准确更高效的聚类效果。上述措施使得该文本特征选择方法能够在文献语料库中更加准确地找到特征词,较之以前的方法有很大提升,尤其是在科技文献方面更为适用。实验结果表明,当数据量较大时,该方法结合改进后的K-means算法在科技文献分类方面有较高的性能。(本文来源于《计算机工程与应用》期刊2015年19期)
动态特征选择论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
由于候选特征与类标签间的相关性,候选特征、已选特征与类标签间的交互性以及特征间的冗余性是特征选择算法应考虑的重要因素,而一些基于互信息和叁维互信息的特征选择算法没有同时考虑相关性、交互性和冗余性信息,这影响了它们的性能。针对该问题,提出一种采用冗余性动态权重的特征选择算法,将对称不确定性和叁路交互信息作为评价指标,采用一种动态更新特征权重的方法使目标函数在考虑相关性、交互性的基础上,同时考虑特征间的冗余性。在10种数据集上利用3种分类器与典型的基于互信息的特征选择算法做了对比实验,结果表明所提算法具有更好的特征选择性能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
动态特征选择论文参考文献
[1].高薇,解辉.基于粗糙集与人工蜂群算法的动态特征选择[J].计算机工程与设计.2019
[2].肖利军,郭继昌,顾翔元.一种采用冗余性动态权重的特征选择算法[J].西安电子科技大学学报.2019
[3].高万夫,张平,胡亮.基于已选特征动态变化的非线性特征选择方法[J].吉林大学学报(工学版).2019
[4].王锋,宋鹏.面向缺失数据的动态特征选择[J].小型微型计算机系统.2018
[5].程玉胜,李雨,王一宾,陈飞.动态滑动窗口加权互信息流特征选择[J].南京大学学报(自然科学).2018
[6].马忱,姜高霞,王文剑.面向函数型数据的动态互信息特征选择方法[J].计算机科学与探索.2019
[7].王玲,孟建瑶.基于特征变权的动态模糊特征选择算法[J].计算机研究与发展.2018
[8].任永功,王玉玲,刘洋,张晶.基于用户相关性的动态网络媒体数据无监督特征选择算法[J].计算机学报.2018
[9].吕子敬,韩顺利,张志辉,刘磊.一种动态赋权红外光谱特征选择算法研究[J].红外.2016
[10].唐立力.基于信息熵与动态聚类的文本特征选择方法[J].计算机工程与应用.2015