导读:本文包含了多类标分类论文开题报告文献综述及选题提纲参考文献,主要关键词:相关性,遗传算法,贝叶斯网络,分类器链
多类标分类论文文献综述
侯漫丽[1](2017)在《基于贝叶斯网络的多类标分类算法研究》一文中研究指出随着科技的迅速发展,数据的分析与利用已成为研究的热点。数据挖掘是从数据中获取有用知识的学科,其重要的任务之一就是分类,而现实生活中数据则常用多类标分类模型。在现阶段的研究中,针对多类标分类问题中类标之间依赖关系的研究,存在两个方面的问题:(1)大多数多类标学习算法在利用类标间的依赖关系时,缺乏一个统一明确的类标间依赖关系的描述模型和确定的利用方法,且构建其依赖关系的策略相对简单;(2)贝叶斯网络是一个典型的模型,然而构建完整的贝叶斯网络模型是及其复杂的,其被证实是一个NP-hard问题。因此如何通过现有的理论,构建合理的限制性贝叶斯网络是研究的重点。针对以上两个问题,本文在贝叶斯网络模型的基础上研究了如何合理地描述类标之间的依赖性来提高多类标分类模型的性能。本文主要包括以下研究工作:(1)研究如何用合理的策略构建类标之间的依赖关系,减少类标之间的错误和冗余信息,以提高分类模型的性能。本文的研究中结合了特征选择中常用的属性相关性的算法理论和遗传算法的启发式搜索理论,优化类标之间依赖关系。首先,根据属性相关性的理论综合考虑类标之间的相关性,类标和条件属性之间的相关性,给类标之间相关性大的类标子集赋予较高的评价值。然后,在传统遗传算法的全局搜索中,本文修改叁个方面以适应多类标分类模型:1)修改属性相关性算法的理论计算公式,用于遗传算法的个体适应度评价函数;2)使用分类器链中部分链,以减少完整链携带的冗余和错误信息;3)修改了遗传操作中具有不同长度编码的个体的交叉和变异。(2)研究通过构建类标的限制性贝叶斯网络结构以表示类标之间的依赖关系,并提出一种贝叶斯分类器链模型。该模型中贝叶斯网络给出一种类标之间依赖关系的度量,其主要是利用多种策略构建类标之间的有向树型贝叶斯结构。本文在构建多类标的贝叶斯分类器链模型的过程中采用了两个基本策略:1)通过考虑类标之间的条件独立性,减少模型中类标的数量;2)尽可能地减少模型中链序列的数量。通过以上基本策略构建贝叶斯分类器链模型,并在五个具体的方面使用不同的算法研究和比较各个算法特点和分类性能。这五个方面具体为:训练策略,链中类标顺序,每个基分类器中的类标数(链复杂度),不同的基分类器,算法的集成。综上所述,本文对多类标分类问题中类标之间依赖关系的问题进行了研究和实验,提出了基于属性相关性的多类标分类算法和基于贝叶斯分类器链的多类标分类算法。并用实验验证了合理构建类标之间的依赖关系能提高分类模型的性能。(本文来源于《北京交通大学》期刊2017-05-04)
袁慎溪[2](2017)在《基于随机森林和预测聚类树的多类标分类算法研究》一文中研究指出近年来,多类标分类问题在生活中变得越来越常见,在学术研究中也逐渐成为了一个热点。在多类标分类问题中,训练集中的每个样本都对应由一个或者多个类标组合而成,而在传统的分类问题中,每个样本只属于一个类,和多类标分类问题有着明显的不同。因此,用于单类标分类的算法不能直接用于多类标分类问题。目前关于解决多类标分类问题已经有了很多的算法,但是经过我们的调研和实验,我们发现它们在结果上并没有达到预期,仍然有不少的提升空间。本文通过对网络回归进行了一定研究的基础上,将网络回归中的方法应用到了预测聚类树算法中,然后又使用随机森林算法对之进行集成,提出了一种新的多类标分类算法。本文主要做了如下的工作:(1)从随机森林、预测聚类树以及多类标分类算法叁个方面对国内外文献进行了调研。全面总结了多类标研究领域内的分类算法及其验证准则;(2)通过把非网络数据的多类标数据转化成网络数据,将用于网络回归的算法运用到了多类标分类的场景;(3)将聚类之间距离和利用网络回归的方法计算出的聚类内部紧密度结合到一起作为预测聚类树分裂过程中选择最优分裂属性的依据;(4)基于以上的工作,将预测聚类树算法和随机森林算法集成到一起从而提出了一种新的多类标分类算法。最后本文将新提出的算法与目前业内比较常用的优秀算法在多个领域的多个数据集上进行实验,实验结果证明我们的算法具有良好的分类性能。(本文来源于《华南理工大学》期刊2017-03-15)
刘丰[3](2016)在《基于类标依赖性的多关系图多类标分类算法研究》一文中研究指出随着移动互联网的飞速发展,各种移动互联网应用已经成为人们最重要的信息交互平台,这些信息交互平台将人们串联成各种各样的虚拟社会网络。多个社会网络可以通过节点或关系的映射而形成一个多关系社会网络,通常可以用多关系图来表示。多关系图中节点的多类标分类在网络精准营销、社会网络分析、社会化搜索等领域都有重要的应用价值。在多类标分类问题中,如何有效利用类标依赖性信息对于提高分类算法的性能是至关重要的。在多关系图的多类标分类问题中,类标依赖性信息包括两个方面:隐含在节点内容属性中的类标依赖性和隐含于关系拓扑中的类标依赖性。本文的研究重点是如何有效挖掘这两种类标依赖性信息,并在此基础上设计出有针对性的多类标分类算法。基于内容属性类标依赖性的思想,本文利用类标共现信息来计算类标依赖性,并据此提出了一种基于内容属性类标依赖性的多关系图多类标分类算法(MRML-C)。该算法结合了类标空间聚类划分策略,有效地将多类标分类问题分解为多个规模缩小的子问题,降低了算法复杂度。对比实验结果表明利用类标依赖性进行类标空间划分的策略有效的解决了类标爆炸的问题,并且MRML-C在大多数的数据集上都表现出了较好的分类性能。基于关系拓扑类标依赖性的思想,本文利用类标共现信息和关系拓扑信息共同计算类标依赖性,并据此提出了一种基于关系拓扑类标依赖性的多关系图多类标分类算法(MRML-R),该算法首先会对类标空间进行聚类划分,然而采用问题转化算法将各个多类标分类子问题转化成单类标分类问题,在训练模型的过程中采用了基于随机游走样本抽样方法的随机森林算法,有机融合了关系拓扑信息。最后采用多数投票策略集成各个子空间的预测结果。对比实验结果表明MRML-R算法在二值验证指标上具有更好的分类表现。(本文来源于《哈尔滨工业大学》期刊2016-06-01)
张曼[4](2015)在《基于增量学习和深度稀疏滤波的复杂场景多类标分类》一文中研究指出随着图像数据的爆破增长之势,作为众多科学领域的公共研究课题,图像的场景分类技术在学术界越来越受到重视,在处理图像分析与挖掘的技术中被广泛地利用起来。在传统的图像分类问题当中,通常来说比较的是内容的相似性,而与此不同的是,在图像的场景分类问题中,关心的往往并不是内容的严格一致,而是通过图像某些表层反映的内容来挖掘其内部的语义信息。随着合成孔径雷达(SAR)技术的发展,SAR图像在分辨率、图像内容和数量上都达到了一定的高度,其应用也越来越广泛。但无论是场景分类方法还是图像检索领域,所针对的对象都很少涉及到SAR图像。因此,基于上述技术空缺。本文首先提出了基于联合双层锚图与哈希编码的SAR图像检索;随后又扩充了图库数据并进行多标签类标,提出一种基于增量SVM的SAR图像多类标场景分类方法;然而,由于增量SVM在处理高维、多类别的数据时表现出来的疲软问题,本文又进一步提出一种基于增量LDA和多类标KNN的多类标分类方法。最后,针对多类标特征学习的问题,我们引入了深度学习的知识,提出一种基于深度稀疏滤波的多类标分类方法。本文所取得的主要研究成果有:1.提出了基于增量SVM的SAR图像多类标场景分类方法,其中包括建立万级规模的SAR图像的数据库;对其中的每一幅图像以多类标的形式标记;对SAR图像进行Contourlet变换,求取各个尺度、各个方向上面的形状、纹理特征;使用多类标增量SVM对特征集进行分类,并通过七种多类标的评估标准来衡量算法的分类性能。2.提出了基于增量LDA的多类标分类方法,其中包括对特征使用增量LDA降维;再将降维后的特征作为训练样本输入到到多类标kNN中训练,以实现对测试样本的类别预测;最终通过七种多类标的评估标准来衡量算法的分类性能。3.提出了基于深度集成稀疏滤波的多类标分类方法,其中包括使用深度集成稀疏滤波算法进行特征学习;再将学习过的特征作为训练样本输入到增量SVM中训练,以实现对测试样本的类别预测;最通过七种多类标的评估标准来衡量算法的分类性能。4.提出了基于联合双层锚图与哈希编码的SAR图像检索方法,其中包括利用第一章中所述的基于Contourlet变换的特征和GIST特征制作双特征通道,使用双层锚图哈希模型对特征集进行分类并将其映射到汉明空间进行哈希编码;得到检索列表,并使用汉明精度对其结果进行评价。(本文来源于《西安电子科技大学》期刊2015-12-01)
赵亚红[5](2014)在《面向多类标分类的随机森林算法研究》一文中研究指出随着计算机和互联网技术的不断发展及在各行业中的广泛应用,人们积累的数据也呈爆炸式增长,这带领人们进入大数据时代。而随着大量文本数据与医学数据的出现,人们也开始注意到了多类标数据的产生。针对高维数据,随机森林算法有着良好的分类效果,但是目前随机森林算法仅仅用于单类标分类问题,还没有推广到多类标分类问题领域。如何将随机森林算法推广到多类标分类领域进而得到高精度预测是本课题的主要研究内容。本文的具体工作如下:(1)从多类标分类和随机森林算法两方面对国内外文献进行了调研。全面总结了多类标研究领域内的分类算法及其验证准则,介绍了随机森林的发展;(2)提出了类标子集划分的方法。本文采用卡方检验作为两个类标间相依性的衡量标准,随机产生大量的类标划分,每个划分集合中包含若干类标子集。通过计算每一个类标划分集合的权重,层层筛选,最终保留高权重且高互异性的类标划分集合;(3)提出了一种新的样本抽样方法。本文结合懒惰学习思想,在抽样过程中加入测试样本在训练集中的若干邻居作为构建决策树的影响因素,和传统随机抽样一起组成最终样本空间;(4)基于以上工作提出了多类标随机森林分类算法。根据多类标数据集类标之间存在相关性的特点,将多类标分类问题划分为若干相对独立的子问题,综合运用多类标问题转化算法和传统随机森林算法,分步解决子问题后再集成进而得到最优解。最后通过在多领域数据上的对比实验证明了该算法的优越性。(本文来源于《哈尔滨工业大学》期刊2014-12-01)
金圆[6](2012)在《结合主动学习的半监督贝叶斯网络多类标分类》一文中研究指出多类标问题在现实世界中普遍存在。在多类标分类问题中,训练集中的每个样本都对应由一个或者多个类标组合而成。多类标学习的任务就是在类标集大小未知的情况下,为未知的样本预测其类标集。传统的分类中每个样本只属于一个类,多类标分类问题与之明显不同。因此,单类标分类的算法不能直接用于处理这类多类标数据。传统的多类标分类算法大多是在常见的单类标算法基础上进行改进,这类算法均非常依赖于机器学习所需要的训练数据集。因此,如何在训练数据稀缺的现实环境下利用少量的标记样本和大量的未标记的样本进行学习,构建有效的分类器,成为当前该方向的重点和难点。针对传统的多类标分类算法需要大量已标记数据才能有效建模的问题,提出一种使用高斯域和贝叶斯网络来结合主动学习与半监督的多类标分类算法。(1)首先,针对多类标数据的特征属性维数高的特点,提出了一种采用LLE降维算法并建立多个贝叶斯网络的多类标分类算法;(2)然后,在高斯随机域模型的基础上提出了一种结合主动学习的半监督贝叶斯网络多类标算法:ML-ASGB,该算法能使贝叶斯网络多类标分类器选择少量高质量的样本人工标记并利用大量未标记样本来有效建模。实验结果表明:相比ML_KNN和Semi-Boost等其它算法,ML-ASGB算法具有较高的性能,且加入主动学习能比随机选择在获得相当性能的情况下有效的减少了标注样本的数目。(本文来源于《湘潭大学》期刊2012-04-15)
李宏,李博,吴敏,陈松乔[7](2009)在《一种基于关联规则的多类标分类算法》一文中研究指出提出了一种基于关联规则的多类标算法(MLAC),利用多类标FP-tree来分解组合生成多类标规则,并通过组合多重关联规则分类器进行分类预测,降低了由高维属性带来的高计算复杂度,有效地提高了算法的性能和效率.针对多类标数据集的实验结果表明,MLAC算法在性能和效率等方面均优于ML-KNN等多类标分类算法.(本文来源于《控制与决策》期刊2009年04期)
多类标分类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,多类标分类问题在生活中变得越来越常见,在学术研究中也逐渐成为了一个热点。在多类标分类问题中,训练集中的每个样本都对应由一个或者多个类标组合而成,而在传统的分类问题中,每个样本只属于一个类,和多类标分类问题有着明显的不同。因此,用于单类标分类的算法不能直接用于多类标分类问题。目前关于解决多类标分类问题已经有了很多的算法,但是经过我们的调研和实验,我们发现它们在结果上并没有达到预期,仍然有不少的提升空间。本文通过对网络回归进行了一定研究的基础上,将网络回归中的方法应用到了预测聚类树算法中,然后又使用随机森林算法对之进行集成,提出了一种新的多类标分类算法。本文主要做了如下的工作:(1)从随机森林、预测聚类树以及多类标分类算法叁个方面对国内外文献进行了调研。全面总结了多类标研究领域内的分类算法及其验证准则;(2)通过把非网络数据的多类标数据转化成网络数据,将用于网络回归的算法运用到了多类标分类的场景;(3)将聚类之间距离和利用网络回归的方法计算出的聚类内部紧密度结合到一起作为预测聚类树分裂过程中选择最优分裂属性的依据;(4)基于以上的工作,将预测聚类树算法和随机森林算法集成到一起从而提出了一种新的多类标分类算法。最后本文将新提出的算法与目前业内比较常用的优秀算法在多个领域的多个数据集上进行实验,实验结果证明我们的算法具有良好的分类性能。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
多类标分类论文参考文献
[1].侯漫丽.基于贝叶斯网络的多类标分类算法研究[D].北京交通大学.2017
[2].袁慎溪.基于随机森林和预测聚类树的多类标分类算法研究[D].华南理工大学.2017
[3].刘丰.基于类标依赖性的多关系图多类标分类算法研究[D].哈尔滨工业大学.2016
[4].张曼.基于增量学习和深度稀疏滤波的复杂场景多类标分类[D].西安电子科技大学.2015
[5].赵亚红.面向多类标分类的随机森林算法研究[D].哈尔滨工业大学.2014
[6].金圆.结合主动学习的半监督贝叶斯网络多类标分类[D].湘潭大学.2012
[7].李宏,李博,吴敏,陈松乔.一种基于关联规则的多类标分类算法[J].控制与决策.2009