频繁闭项目集论文-曾俊义

频繁闭项目集论文-曾俊义

导读:本文包含了频繁闭项目集论文开题报告文献综述及选题提纲参考文献,主要关键词:二分搜索算法,全局求解,频繁项目集,求解准确率

频繁闭项目集论文文献综述

曾俊义[1](2019)在《二分搜索算法在全局频繁项目集求解中的应用》一文中研究指出为了解决常规算法在全局频繁项目求解中,存在求解准确率与求解速率较低的不足,提出二分搜索算法在全局频繁项目集求解中的应用。依托全局频繁项目集的确定,利用频繁项目k和全局隶属度函数x的计算,实现候选项目集的生成,优化全局频繁项目集求解体系;根据数据的动态求解,实现全局频繁项目集的更新计算,完成二分搜索算法在全局频繁项目集求解中的应用,实验数据表明,提出的全局频繁项目集求解方法,较传统求解方法具有较高的求解准确率和求解速率,适合于全局频繁项目集的求解。(本文来源于《现代计算机》期刊2019年19期)

赵群礼,郭玉堂,史君华[2](2018)在《基于改进频繁模式树的最大频繁项目集更新挖掘算法》一文中研究指出在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集。(本文来源于《井冈山大学学报(自然科学版)》期刊2018年04期)

黄黎明[3](2018)在《基于Apriori和FP-TREE的频繁项目集挖掘算法》一文中研究指出随着信息技术的日益进步,积累的数据量也在飞速增加。这导致了海量的数据存储在数据库,数据仓库和其他存储库中。因此,数据挖掘开始越来越引起人们的重视,而分析数据库以提取有用或以前未知的模式和规则,称之为关联规则挖掘。在数据挖掘中,关联规则挖掘成为描述性技术的重要任务之一,可以将其定义为从大量数据集中发现有意义的模式。而挖掘频繁项目集是关联规则挖掘的基础。因此,本文研究问题就是研究如何快速挖掘频繁项目集。本文首先介绍了过去几十年来已提出的许多经典频繁项目集挖掘算法,包括基于水平布局的技术,基于垂直布局的技术和基于矩阵布局的技术,为提出性能和功能更优的频繁项目集挖掘算法作好理论准备。但是为了挖掘频繁模式,目前大多数技术都需要遭受多次重复数据库扫描,候选集生成(Apriori算法),内存消耗问题(FP-tree算法)以及更多问题的困扰。正如在零售行业中,许多事务数据库包含多次相同的事务集合,为了应用这个想法,针对Apriori算法和FP-tree算法的缺陷,本文中我们提出了一种新技术,它结合了当前的Apriori(改进的Apriori)和FP-tree技术以保证比经典的apriori算法更好的性能,新方法首先利用改进的Apriori算法寻找最大频繁项目集,然后仅考虑数据库中的包含1项集但不包括在最大频繁项目集中的频繁元素的那些事务来修剪数据库,并基于修剪的数据库构造FP-tree,并通过实践证明,在购物篮数据集中新方法无论是在时间和内存消耗方面都要优于Apriori算法和FP-tree算法。(本文来源于《南华大学》期刊2018-05-01)

李文,徐慧[4](2016)在《基于频繁项目集的震前遥感异常信息挖掘》一文中研究指出已有研究表明地震活动区域红外遥感数据存在异常。本文针对遥感数据提出一种数据挖掘方法,运用频繁项集挖掘地震区域数据的异常特征,然后进行地震预测,同时选取非震数据进行反向验证。使用大气红外探测器(AIRS)2006~2013年的数据进行分析,根据大量实验,初步得出大气红外探测器数据可用于地震预测,地震预测最佳前兆时间为30天,前兆区域为边长2°正方形,预测的准确率最高可达81.8%,误报率为5.6%。(本文来源于《计算机与现代化》期刊2016年08期)

尹治华[5](2016)在《基于频繁模式树的最大频繁项目集挖掘算法研究》一文中研究指出随着互联网技术的快速发展,数据挖掘领域受到了越来越多的关注。关联规则一直是该领域的研究热点,主要是为了发现数据之间的关联以及有趣的模式。挖掘最大频繁项目集作为关联规则的一个重要的研究内容,它不仅已经涵盖了所有的频繁项目集,而且某些数据挖掘应用仅需挖掘最大频繁项目集,因此挖掘最大频繁项目集意义重大。本文从叁方面对最大频繁项目集挖掘算法进行研究,分别是对候选项目集降维的研究,超集检测方法的研究以及增量式更新算法的研究。首先,为了解决算法DMFIA(Discover Maximum Frequent Itemsets Algorithm)中初始候选项目集维数较高且挖掘较短最大频繁项目集效率低下的问题,提出了一种改进的基于频繁模式树FP-Tree(Frequent Pattern Tree)的最大频繁项目集挖掘算法FP-EMFIA(Algorithm for Efficiently Mining Maximum Frequent Itemsets Based on FP-Tree)。该算法采用自上而下和自下而上的双向搜索策略,并对条件模式基中项目的计数特点进行了分析,将一定包含或一定不包含在最大频繁项目集中的项目进行过滤,从而降低候选项目集的初始值维数。并利用挖掘出的较短的非频繁项目集对候选项目集进行剪枝,从而提高算法的效率。其次,为了解决最大频繁项目集挖掘算法中超集检测次数过多的问题,提出了一种基于索引链表的超集检测算法IL-SC(Superset Checking Algorithm Based on Index List)。该算法采用索引链表的存储结构,使得最大频繁项目集的存储变得有序化,减少不必要的超集检测操作,从而提高超集检测的效率。最后,在FP-EMFIA的基础上,提出了一种增量式更新算法FP-EUMFIA(Update Maximum Frequent Itemsets Algorithm Based on FP-EMFIA),以便高效利用之前挖掘出的结果。这样,能够大幅度降低初始候选项目集的维数,整体上提高算法的执行效率。(本文来源于《燕山大学》期刊2016-05-01)

陈向华,刘可昂[6](2015)在《基于FP-Tree的最大频繁项目集挖掘算法》一文中研究指出挖掘最大频繁项目集是关联规则挖掘中的关键问题,基于Apriori产生候选项目集需要付出很高的代价,尤其是在存在大量强模式或长模式的时候.提出一种基于频繁模式树(FP-Tree)的最大频繁项目集挖掘算MFIP-Miner(maximum frequent itemsets pattern miner),其挖掘过程无需产生候选项集,从而提高挖掘效率。(本文来源于《软件》期刊2015年12期)

张志宏,兰静[7](2015)在《海量加密军用数据下的频繁项目集挖掘仿真》一文中研究指出军用加密数据为了达到保密的目的,人为设定了较多的加密规则,打破了数据之间常规的关联性。在进行军用数据挖掘建立关联规则时,由于数据关联规则被人为隐藏,递归生成关联条件模式树的过程中,传统的FP-tree算法挖掘算法,由于加密数据的关联复杂性,会递归生成大量条件模式树,导致后期挖掘过程占用了大量的挖掘算法资源,挖掘效率较低。提出基于改进FP-tree的海量加密军用数据下频繁项目集挖掘算法,依据海量加密军用数据下频繁项目集挖掘原理,在FP-tree算法的基础上,依据预剪枝策略减少挖掘节点,通过单向有序FP-tree防止每次存储当前挖掘出的频繁项目集之前都需要超集检验,建立项目表格,避免递归生成条件模式树浪费资源。将提出的改进FP-tree算法应用到海量加密军用数据下频繁项目集的挖掘中,获取的实验结果说明,改进FP-tree算法在提高加密军用数据频繁项目集挖掘速度及准确率方面具有较高的优越性。(本文来源于《计算机仿真》期刊2015年05期)

方刚,王佳乐,应宏,汤小斌[8](2014)在《基于粒度计算的频繁闭项目集挖掘》一文中研究指出针对现有频繁闭项目集挖掘算法存在的不足,提出了一种基于粒度计算的频繁闭项目集挖掘算法。通过混合进制数的变化来生成候选项目集,避免使用了复杂的数据结构,减少了内存和CPU的开销;利用粒度计算的分而治之思想来计算频繁闭项目集的支持度,避免了多次重复扫描数据库,减少了计算复杂度和I/O开销。实验结果表明该算法比经典的频繁闭项目集挖掘算法快速而有效。(本文来源于《计算机工程与应用》期刊2014年20期)

章志刚,吉根林,唐梦梦[9](2014)在《并行挖掘频繁项目集新算法——MREclat》一文中研究指出针对Eclat算法在挖掘海量数据中的频繁项目集时存在的内存和计算资源不足等问题,提出了基于Map/Reduce计算模型的并行挖掘算法——MREclat。首先,将水平型数据库转换成垂直型数据库;然后,将转换后的数据按2-项集的前缀分发到各个计算节点上,且在分发数据时引入了均衡策略;接着,在各个计算节点上求出以某一前缀开头的所有频繁项目集;最后,合并各个节点的结果得到所有频繁项目集。介绍了MREclat的设计思想,研究了算法的运行性能。实验结果表明,MREclat算法效率大约是PEclat算法的2倍,加速比性能比PEclat算法提高了64%。(本文来源于《计算机应用》期刊2014年08期)

章志刚[10](2014)在《云计算环境下频繁项目集挖掘算法研究》一文中研究指出频繁项目集挖掘是数据挖掘研究中的基础研究内容。它在电子商务、网页查询分析、网络入侵检测和疾病诊断等领域有着广泛的应用。随着信息社会的不断发展,尤其是互联网领域的蓬勃发展,人类社会产生的数据呈爆炸式的增长,“大数据”研究应运而生。如何有效地存储和处理日益增长的数据成为目前亟待解决的问题。云计算的提出为“大数据”的存储、挖掘等问题提供了解决方案。本文对云计算环境下频繁项目集挖掘算法并行化作了较深入的研究,取得了如下成果:1.提出了两种基于Apriori的迭代式Map/Reduce频繁项目集并行挖掘算法MRApriori和TR_MRApriori。MRApriori算法在每次迭代中,先在各计算节点使用Apriori算法计算出候选的k-项集,然后对各个节点的候选结果进行合并,以得到频繁的k-项集。为了提高MRApriori的算法效率,提出了基于事务约减的改进算法TR_MRApriori。TR_MRApriori算法通过记录每次迭代中对下一次迭代中有影响的事务号,大大减少了事务的访问量。实验结果表明TR_MRApriori算法比相关文献提出的方法具有更高的效率。2.提出了一种基于FP-Growth的频繁项目集并行挖掘算法FPPM。FPPM算法先在每个计算节点上构造局部频繁模式树,并对之进行挖掘得到局部频繁项目集,接着合并局部频繁项目集以得到全局频繁项集,由于此时得到的结果并不完备,所以对合并后未达到最小支持度阈值的项目集,重新计算其支持度。实验结果表明FPPM算法具有较好的可扩展性,且能较好的解决相关文献算法网络通信量过大的问题。3.提出了一种基于FP-Growth的频繁项目集并行挖掘算法SBPFP。该算法对样本数据计算出每个项目对应的子频繁模式树的挖掘时间,并以该时间为权重的度量因子。接着按权重将项目进行分组,然后将数据均衡划分到其所对应的计算节点上。最后在计算节点上获得该组项目所对应的频繁项目集。实验结果表明SBPFP算法具有较好的运行效率和可扩展性,同时该算法的运行负载性能比相关文献提出的算法更加均衡。4.提出了一种基于Eclat的频繁项目集并行挖掘算法MREclat。MREclat首先将水平型数据库转换成垂直型数据库,然后将转换后的数据分发到各个计算节点上进行求解,在分发数据时引入了均衡策略使得负载达到平衡。实验结果表明MREclat具有较高的可扩展性和较好的加速比,且比相关文献提出的算法效率更高。(本文来源于《南京师范大学》期刊2014-04-01)

频繁闭项目集论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在挖掘最大频繁项目集的过程中,通过改变最小支持度阈值可以挖掘更有用的最大频繁项目集,为此提出了一种最大频繁项目集更新挖掘算法UAMMFI(Updating Algorithm for Mining Maximal Frequent Itemsets)。算法基于改进后的频繁模式树结构,在更新挖掘过程中,不需产生候选项目集和条件模式树,并且充分利用先前已挖掘的最大频繁项目集中包含的信息,快速更新挖掘出最小支持度阈值变化后的最大频繁项目集。实验结果表明,算法能够高效更新挖掘最大频繁项目集。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

频繁闭项目集论文参考文献

[1].曾俊义.二分搜索算法在全局频繁项目集求解中的应用[J].现代计算机.2019

[2].赵群礼,郭玉堂,史君华.基于改进频繁模式树的最大频繁项目集更新挖掘算法[J].井冈山大学学报(自然科学版).2018

[3].黄黎明.基于Apriori和FP-TREE的频繁项目集挖掘算法[D].南华大学.2018

[4].李文,徐慧.基于频繁项目集的震前遥感异常信息挖掘[J].计算机与现代化.2016

[5].尹治华.基于频繁模式树的最大频繁项目集挖掘算法研究[D].燕山大学.2016

[6].陈向华,刘可昂.基于FP-Tree的最大频繁项目集挖掘算法[J].软件.2015

[7].张志宏,兰静.海量加密军用数据下的频繁项目集挖掘仿真[J].计算机仿真.2015

[8].方刚,王佳乐,应宏,汤小斌.基于粒度计算的频繁闭项目集挖掘[J].计算机工程与应用.2014

[9].章志刚,吉根林,唐梦梦.并行挖掘频繁项目集新算法——MREclat[J].计算机应用.2014

[10].章志刚.云计算环境下频繁项目集挖掘算法研究[D].南京师范大学.2014

标签:;  ;  ;  ;  

频繁闭项目集论文-曾俊义
下载Doc文档

猜你喜欢