多关系分类论文-张晶,毕佳佳,刘炉

多关系分类论文-张晶,毕佳佳,刘炉

导读:本文包含了多关系分类论文开题报告文献综述及选题提纲参考文献,主要关键词:多关系,分类,特征选择

多关系分类论文文献综述

张晶,毕佳佳,刘炉[1](2016)在《基于mRMR的多关系朴素贝叶斯分类》一文中研究指出在分类任务中,特征选择是一种提高分类效果的重要方法。现实生活中的数据都是存储在多关系数据库中的。多关系数据库的数据中有许多不相关的且冗余的特征,这些特征对分类任务的贡献很小,甚至没有贡献。如何有效地将特征选择应用到多关系分类中是比较重要的。因此,将最大相关最小冗余的特征选择方法应用到多关系分类中,对关系数据库中的每个关系表进行特征选择,选择出对分类影响较好的特征集,再用多关系朴素贝叶斯分类算法对进行特征选择后的多关系数据库进行分类测试。实验结果表明了该算法的性能有了一定的提高。(本文来源于《计算机应用与软件》期刊2016年08期)

刘丰[2](2016)在《基于类标依赖性的多关系图多类标分类算法研究》一文中研究指出随着移动互联网的飞速发展,各种移动互联网应用已经成为人们最重要的信息交互平台,这些信息交互平台将人们串联成各种各样的虚拟社会网络。多个社会网络可以通过节点或关系的映射而形成一个多关系社会网络,通常可以用多关系图来表示。多关系图中节点的多类标分类在网络精准营销、社会网络分析、社会化搜索等领域都有重要的应用价值。在多类标分类问题中,如何有效利用类标依赖性信息对于提高分类算法的性能是至关重要的。在多关系图的多类标分类问题中,类标依赖性信息包括两个方面:隐含在节点内容属性中的类标依赖性和隐含于关系拓扑中的类标依赖性。本文的研究重点是如何有效挖掘这两种类标依赖性信息,并在此基础上设计出有针对性的多类标分类算法。基于内容属性类标依赖性的思想,本文利用类标共现信息来计算类标依赖性,并据此提出了一种基于内容属性类标依赖性的多关系图多类标分类算法(MRML-C)。该算法结合了类标空间聚类划分策略,有效地将多类标分类问题分解为多个规模缩小的子问题,降低了算法复杂度。对比实验结果表明利用类标依赖性进行类标空间划分的策略有效的解决了类标爆炸的问题,并且MRML-C在大多数的数据集上都表现出了较好的分类性能。基于关系拓扑类标依赖性的思想,本文利用类标共现信息和关系拓扑信息共同计算类标依赖性,并据此提出了一种基于关系拓扑类标依赖性的多关系图多类标分类算法(MRML-R),该算法首先会对类标空间进行聚类划分,然而采用问题转化算法将各个多类标分类子问题转化成单类标分类问题,在训练模型的过程中采用了基于随机游走样本抽样方法的随机森林算法,有机融合了关系拓扑信息。最后采用多数投票策略集成各个子空间的预测结果。对比实验结果表明MRML-R算法在二值验证指标上具有更好的分类表现。(本文来源于《哈尔滨工业大学》期刊2016-06-01)

毕佳佳,张晶[3](2016)在《基于关系选择的多关系朴素贝叶斯分类》一文中研究指出依据多关系数据库中的背景表对分类任务具有的不同大小贡献度,提出一种基于关系选择的多关系朴素贝叶斯分类算法。对关系表进行两轮删减,根据最大信息增益率删掉部分对分类影响较小的关系表,把平均信息增益率作为衡量表对分类的贡献度,根据贡献度选定余下的表用于最终的分类。实验结果表明,该算法能有效提高分类准确率,相比Graph-NB算法、Classify_tables算法及MRNBC-W算法分别提高2.2%,1.1%,0.86%。(本文来源于《计算机工程》期刊2016年05期)

徐光美,刘宏哲,张敬尊[4](2014)在《基于特征加权的多关系朴素贝叶斯分类模型》一文中研究指出为进一步提高多关系朴素贝叶斯方法的分类准确率,分析了已有的特征加权方法,并在将特征加权方法扩展到多关系的情况下结合元组ID传播方法和面向元组的统计计数方法,建立了基于特征加权的多关系朴素贝叶斯分类模型(MRNBC-W)。标准数据集上的实验结果显示,新方法可以在不增加算法时间复杂度的前提下,有效提高金融数据集的分类准确率。文中也给出了结合扩展互信息标准对属性进行过滤后,加权方法和不加权方法的分类比较。(本文来源于《计算机科学》期刊2014年10期)

石亚冰,黄予,彭昱忠[5](2013)在《SCrossMine——一种基于多关系数据挖掘的空间分类方法研究》一文中研究指出空间数据分类算法大部分基于单表,将多关系数据挖掘的分类技术用于构建空间数据对象的分类模型,特别是元组ID传播技术使得空间数据对象可以高效表征包括领域属性和空间位置的完整特征,从而使得分类依据更客观。实验表明SCrossMine算法可以获取较高的分类精度,同时分类结果也能较好不同类别对象的空间分布格局。(本文来源于《广西师范学院学报(自然科学版)》期刊2013年04期)

张斌[6](2012)在《基于多关系转化的分类方法研究》一文中研究指出随着信息技术的快速发展和广泛应用,每天都在产生大量的数据。如何在“数据丰富,但信息贫乏”的环境中发现有价值的、有趣的、具有指导意义知识,是数据挖掘的重要任务。同时,数据挖掘也受到了越来越多研究者的关注。而分类研究作为数据挖掘的重要课题,被广泛地应用于商业决策、医疗诊断等方面。结构化的关系数据作为分类研究的主要对象,通常来源于真实的关系数据。然而,直接从关系数据库中获得的多关系数据,相比较于单一的关系数据而言,更具有天然性。但传统分类方法仅适用于单一关系的数据。因此,为了将传统的分类方法应用于多关系数据中,并做出有效的分类预测,需要建立一个从多关系到单关系的桥梁,将多关系数据有效地转换为传统分类方法能处理的单关系数据。所以,本文基于多关系转化这一主要思想,构造了多关系转化模型,并在此基础上提出了IWT以及MRT两种算法。它们分别利用不同策略,有效地提高了多关系转化的效率,解决了转化过程中的统计偏差及衍生问题,并获得了较好的预测效果。本文的研究工作从以下几个方面展开:(1)建立高效的连接路径。通过分析关系间连接属性的对应关系,利用广度优先遍历方法,重新对连接树进行构造。提高了传递的效率。(2)构建关系选择模型。从多关系全局来看:在多关系数据中,目标关系仅仅有一个,而关系数据库中包含了海量的背景关系。在这些背景关系中,并不是每一个关系都包含了对用户或者分类具有重要意义的属性。因此,为了提高挖掘效率,构建关系选择模型,消除冗余关系是转化过程的重要基础。(3)提出基于多关系数据的特征选择方法。从关系内部看:并不是所有属性都是用户关心的或者对类别有较大区分性的。因此,在多关系的数据中进行特征选择,有利于预测性能和效率提高。(4)转化过程中统计偏差问题的分析和处理。关系间元组的一对多映射和多对一映射,以及转化过程中的空值问题,是引起属性重要性在转化前后不一致的根本原因。因此,本文提出了基于元组转化和实例加权转化两种解决策略,保持转化前后属性的重要性一致。实验证明,转化策略在保持了统计一致性的前提下,利用传统分类方法获得了较好的预测效果。(本文来源于《合肥工业大学》期刊2012-03-01)

李小平[7](2011)在《多关系决策树分类算法的研究》一文中研究指出多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一,高效性一直是该领域的研究重点。对于多关系数据挖掘算法而言,挖掘任务的复杂性对算法性能提出了更高的要求,搜索空间比单一关系模式下变得更大更复杂,提高算法效率的主要瓶颈在于假设空间。针对多关系数据挖掘算法存在的这些问题,本文提出了改进的多关系决策树算法MRDTL-2。本文对数据挖掘理论、多关系数据挖掘理论进行了深入的研究,尤其是多关系决策树分类算法及多关系数据挖掘的最新技术-元组传播技术。本文提出了改进的多关系数据挖掘算法MRDTL-2,提高了算法的效率和用户的满意程度。改进算法的实现过程是在用户指导下完成的,主要是在以下两方面进行改进:第一,在用户指导情况,当数据项小于属性传递阀值时,将元组传播技术应用到多关系决策树算法中。第二,在用户指导情况,当数据项大于传递阀值时,设置空关系Ra,将背景关系中的主关键字、背景属性及目标关系中的类标号传递到中Ra,然后,Ra代替背景关系参与其它多关系决策树。最后,本文对改进的多关系决策树算法MRDTL-2进行了理论证明和实验验证。本文使用PKDD'99中的Financial数据集对改进的多关系决策树算法MRDTL-2进行实验。通过十次交叉迭代验证法,对改进的多关系决策树算法MRDTL-2与MRDTL进行效率对比验证。实验结果表明,本文提出的算法优于现有的同类算法,实现了预期的研究目标。(本文来源于《内蒙古大学》期刊2011-06-11)

杨鹤标,王健[8](2010)在《适用于非平衡数据的多关系多分类模型》一文中研究指出针对多关系多分类的非平衡数据,提出一种分类模型。在预处理阶段,建立目标类纠错输出编码(ECOC)、目标关系与背景关系间的虚拟连接并完成属性聚集处理,进而划分训练集和验证集。在训练阶段,依据一对多划分思想,结合CrossMine算法构造多个子分类器,采用AUC法评估验证各子分类器。在验证阶段,比较目标类ECOC与各子分类器分类结果连接字的海明距离,选择最小海明距离的目标类为最终分类。经合成和真实数据的实验,验证了模型有效性及分类效果。(本文来源于《计算机工程》期刊2010年20期)

郑利雄,陈琼,沈勇明[9](2010)在《基于多视图树的多关系分类》一文中研究指出提出一种新型的利用多视图树的方法解决多关系分类的问题。在多视图分类方法中,不同视图对分类任务贡献不同,视图间存在互补性。对视图互补性进行研究,提出视图互补性的度量方法。根据视图互补性选择视图进行集成,构造多视图树,用于多关系分类。实验结果表明,多视图树无论在分类效果还是效率上,都优于现有的多关系分类方法。(本文来源于《计算机工程》期刊2010年19期)

黄昆[10](2010)在《基于决策树算法的多关系数据分类研究》一文中研究指出多关系数据挖掘是近年来快速发展的重要的数据挖掘领域之一。传统的数据挖掘方法只能从单一关系中进行模式发现,而很难在复杂的结构化数据中发现复杂的关系模式。但是在实际应用中,数据的组织形式多以关系数据库中的多关系模式表示,传统的数据挖掘方法并不适合。而多关系数据挖掘算法则能够良好的适应关系数据库中多关系的数据组织,很好的完成挖掘任务。因此本文以多关系数据挖掘算法作为研究对象。对于多关系数据挖掘算法而言,高效性和可扩展性一直是该领域的研究重点。因为多关系数据挖掘任务的复杂性对算法性能提出了更高的要求,同时,由于在多关系模式下,算法的搜索空间比单一关系模式下变得更大,更复杂。对于每个优化假设的评价也更为复杂。针对多关系数据挖掘算法存在的这些问题,本文的研究重点放在了提高多关系数据挖掘算法的效率上。制约多关系数据挖掘算法的瓶颈在于搜索空间的大小,因此提高效率的关键在于减少搜索空间的大小。本文以多关系数据分类算法为切入点,用决策树算法建立多关系分类模型实现多关系数据分类的目标。在提高算法效率上面,本文主要做了以下的工作:在多关系决策树算法中加入充分表,减少了对每个假设模式评价过程中,所需连接数据表的数量。同时,引入目标元组ID传播技术,使得每个假设模式评价过程的连接都不浪费,即使该模式不是最优的,也会进行目标元组ID的传播,从而保留该连接信息。使得算法模式评价的效率有所提高。使用PKDD'99中的Financial数据集对改进的多关系决策树算法进行了实验,通过十次交叉迭代验证法证实了充分表结构和目标元组ID传播技术对提高多关系决策树分类算法运行效率是有帮助的。本文的最后,提出继续对多关系决策树算法效率的改进的一些展望,可以在状态空间的搜索算法以及利用数据集背景知识等方面继续做出改进。(本文来源于《北京交通大学》期刊2010-06-01)

多关系分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着移动互联网的飞速发展,各种移动互联网应用已经成为人们最重要的信息交互平台,这些信息交互平台将人们串联成各种各样的虚拟社会网络。多个社会网络可以通过节点或关系的映射而形成一个多关系社会网络,通常可以用多关系图来表示。多关系图中节点的多类标分类在网络精准营销、社会网络分析、社会化搜索等领域都有重要的应用价值。在多类标分类问题中,如何有效利用类标依赖性信息对于提高分类算法的性能是至关重要的。在多关系图的多类标分类问题中,类标依赖性信息包括两个方面:隐含在节点内容属性中的类标依赖性和隐含于关系拓扑中的类标依赖性。本文的研究重点是如何有效挖掘这两种类标依赖性信息,并在此基础上设计出有针对性的多类标分类算法。基于内容属性类标依赖性的思想,本文利用类标共现信息来计算类标依赖性,并据此提出了一种基于内容属性类标依赖性的多关系图多类标分类算法(MRML-C)。该算法结合了类标空间聚类划分策略,有效地将多类标分类问题分解为多个规模缩小的子问题,降低了算法复杂度。对比实验结果表明利用类标依赖性进行类标空间划分的策略有效的解决了类标爆炸的问题,并且MRML-C在大多数的数据集上都表现出了较好的分类性能。基于关系拓扑类标依赖性的思想,本文利用类标共现信息和关系拓扑信息共同计算类标依赖性,并据此提出了一种基于关系拓扑类标依赖性的多关系图多类标分类算法(MRML-R),该算法首先会对类标空间进行聚类划分,然而采用问题转化算法将各个多类标分类子问题转化成单类标分类问题,在训练模型的过程中采用了基于随机游走样本抽样方法的随机森林算法,有机融合了关系拓扑信息。最后采用多数投票策略集成各个子空间的预测结果。对比实验结果表明MRML-R算法在二值验证指标上具有更好的分类表现。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多关系分类论文参考文献

[1].张晶,毕佳佳,刘炉.基于mRMR的多关系朴素贝叶斯分类[J].计算机应用与软件.2016

[2].刘丰.基于类标依赖性的多关系图多类标分类算法研究[D].哈尔滨工业大学.2016

[3].毕佳佳,张晶.基于关系选择的多关系朴素贝叶斯分类[J].计算机工程.2016

[4].徐光美,刘宏哲,张敬尊.基于特征加权的多关系朴素贝叶斯分类模型[J].计算机科学.2014

[5].石亚冰,黄予,彭昱忠.SCrossMine——一种基于多关系数据挖掘的空间分类方法研究[J].广西师范学院学报(自然科学版).2013

[6].张斌.基于多关系转化的分类方法研究[D].合肥工业大学.2012

[7].李小平.多关系决策树分类算法的研究[D].内蒙古大学.2011

[8].杨鹤标,王健.适用于非平衡数据的多关系多分类模型[J].计算机工程.2010

[9].郑利雄,陈琼,沈勇明.基于多视图树的多关系分类[J].计算机工程.2010

[10].黄昆.基于决策树算法的多关系数据分类研究[D].北京交通大学.2010

标签:;  ;  ;  

多关系分类论文-张晶,毕佳佳,刘炉
下载Doc文档

猜你喜欢