导读:本文包含了类关联规则论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘,类关联规则,自适应算法,并行策略
类关联规则论文文献综述
张晓东[1](2016)在《基于自适应算法和并行计算的类关联规则挖掘研究》一文中研究指出随着科技的进步和人类社会文明程度的不断提高,人们需要处理的数据量越来越大。在数据量如此丰富的信息时代,如何从如此浩瀚的数据中挖掘出我们所需要的知识和信息成为一个十分现实和重要的问题。关联规则的挖掘是数据挖掘中的一个重要分支。而在现实生活中,我们更需要考虑关联规则和分类之间是否存在某种对应关系,这就是一种特殊的关联规则——类关联规则。一方面在现实生活中,描述数据元素的属性可能是随时变化的,变化的属性会增加很多有用的信息,但是也会增加挖掘的难度和复杂度。另一方面,现有的类关联规则挖掘算法大多都是顺序算法,即使用一个处理器从头到尾按部就班的执行,这种算法在当今计算机普遍采用多处理机系统的条件下显得格格不入,效率低下,不利于实际的应用。本文针对以上两点问题,把自适应挖掘算法和并行思想融入到类关联规则的挖掘之中,改进了传统的CAR-Miner算法。主要研究内容如下:⒈简单介绍了数据挖掘、关联规则和类关联规则的相关概念和定义,以及类关联规则挖掘问题的国内外研究现状。⒉传统的类关联规则挖掘算法只保证了挖掘结果的完备性,前提是描述数据元素的属性集固定不变。而在实际情况中,用于描述数据集中数据元素的属性数量可能会动态增加,这时如果重新运行一遍传统算法需要花费太多的时间。因此,针对属性增加的情况,我们提出了一种自适应类关联规则挖掘算法,这种算法能够对变化的属性做出较快的反应,只挖掘那些之前没有产生的新规则,这样就充分利用了第一次的挖掘结果,提高挖掘效率的同时,保证了挖掘结果的完备性。⒊针对传统的顺序算法效率低下的缺点,本文用并行思想对其进行改进。我们采用了独立类和共享类两种并行策略,对算法做并行化处理,并通过实验验证了两种策略的有效性。之后,我们又对共享类进行了改进,使其能够在更小的粒度上进行操作,我们又通过仿真实验对传统算法、共享类和新算法的效率进行了对比。通过分析仿真实验的结果可以得出,改进的算法具有现实的可行性和有效性,大大提高了类关联规则的挖掘效率。但是我们的研究也并不完善,仍然有很多不足和需要改进的地方,比如我们提出的改进算法只适用于旧有属性及其取值保持不变而新属性及对应的取值加入数据集的时候,这就使我们提出的自适应算法的适用范围受到了极大的限制;我们也没有考虑到对挖掘结果施加限制条件,筛选出用户所需要的规则等等。这些都是我们以后需要进一步研究的方向。(本文来源于《青岛理工大学》期刊2016-10-01)
杨征,宋宁,吴文斌[2](2015)在《基于GNP类关联规则挖掘的外汇投资相似性匹配交易模型研究》一文中研究指出提出了一种基于外汇市场的价格上升下降序列的新的GNP-SMT方法。基于遗传网络编程(GNP)与类关联规则,通过算法迭代,抽取大量的类关联规则,并存储在规则库中(上升池和下降池)。然后,将产生的规则进入池中来计算价格向上和向下价的概率。在训练期间,提取大量的向上和向下的规则后,使用相似度的匹配计算,以处理各个步骤的执行情况。在测试期间,连续交易的投资金额由GNP的SMT的预测概率计算确定。使用两种不同的情况下呈现的结果,模型都显示很好的盈利。(本文来源于《管理现代化》期刊2015年06期)
曾安平[3](2012)在《多类关联规则生成算法》一文中研究指出针对传统关联规则算法产生的规则关联性弱、种类少的缺点,结合Spearman秩相关系数,提出了一种多类关联算法。该算法在传统算法产生的强规则基础上,利用Spearman秩相关方法计算出规则中产品间的同步异步等相关性。将其作为兴趣度阈值,算法可同时产生同步正规则、异步正规则、同步负规则和异步负规则四类关联规则,且规则间联系紧密。实验结果表明了算法的有效性和优越性。(本文来源于《计算机应用》期刊2012年08期)
赵东垒[4](2008)在《基于类关联规则的分类算法研究》一文中研究指出分类问题是通过分析给定的一个带有类别标识的训练数据集,建立一个分类器,然后预测那些未知类别的数据对象。基于类关联规则的分类算法,简称关联分类算法是集成了关联规则挖掘技术和分类技术的一种新的分类算法。它首先挖掘训练集,得到满足最小支持度和最小置信度的类关联规则,然后通过剪枝得到最终分类规则集。与传统分类算法相比,关联分类算法具有分类精度高和适应性强的特点。然而,作为一种新的分类方法,关联分类算法在执行效率,剪枝的质量,分类器的可理解性等方面还存在很多问题。本文针对以上问题对关联分类算法进行改进。扩展了TD-FP-growth算法,用于挖掘类关联规则以提高挖掘效率;综合考虑规则的置信度和支持度来评价类关联规则的质量,从而克服了传统规则评价方法过分强调规则置信度而导致的过度拟合问题,使挖掘出的规则具有更高的可理解性;分析了规则交迭现象对分类精度和规则数目的影响。实验结果表明本文方法在分类精度上优于SEE5, CBA和CMAR.在应用于医疗图像分类和汉字识别时,得到很好的分类效果。(本文来源于《河北大学》期刊2008-05-01)
类关联规则论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
提出了一种基于外汇市场的价格上升下降序列的新的GNP-SMT方法。基于遗传网络编程(GNP)与类关联规则,通过算法迭代,抽取大量的类关联规则,并存储在规则库中(上升池和下降池)。然后,将产生的规则进入池中来计算价格向上和向下价的概率。在训练期间,提取大量的向上和向下的规则后,使用相似度的匹配计算,以处理各个步骤的执行情况。在测试期间,连续交易的投资金额由GNP的SMT的预测概率计算确定。使用两种不同的情况下呈现的结果,模型都显示很好的盈利。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
类关联规则论文参考文献
[1].张晓东.基于自适应算法和并行计算的类关联规则挖掘研究[D].青岛理工大学.2016
[2].杨征,宋宁,吴文斌.基于GNP类关联规则挖掘的外汇投资相似性匹配交易模型研究[J].管理现代化.2015
[3].曾安平.多类关联规则生成算法[J].计算机应用.2012
[4].赵东垒.基于类关联规则的分类算法研究[D].河北大学.2008