频繁最小项集论文-王立俊

频繁最小项集论文-王立俊

导读:本文包含了频繁最小项集论文开题报告文献综述及选题提纲参考文献,主要关键词:数据流,多重最小支持度,高效用频繁项集,top-k

频繁最小项集论文文献综述

王立俊[1](2015)在《基于多重最小支持度的髙效用频繁项集挖掘算法研究》一文中研究指出频繁项集挖掘是数据挖掘领域的重要研究方向之一,但是传统的频繁项集挖掘算法只考虑项集的支持度,这使得在挖掘过程中丢失一些用户感兴趣的项集。此外,由于数据流具有实时性、无限性和连续性的特性,这就要求在数据流环境中的频繁项集挖掘算法具有较高的时间和空间效率。本文对多重最小支持度和高效用项集挖掘算法问题进行描述,在数据结构和处理方法上,对目前已有的频繁项集和高效用项集挖掘算法的优缺点进行分析和总结,在此基础上做了以下研究工作:(1)在静态数据集中,针对现有的多重最小支持度挖掘算法会产生大量的中间候选集,增加了时间和内存的开销,且没有考虑项集的效用值等问题。本文利用多重最小支持度和效用值,构造了数据结构MHU-Tree,并提出用于修剪构造过程中全局MHU-Tree的PG策略和用于修剪挖掘过程中局部MHU-Tree的PL策略。在此基础上,提出了基于多重最小支持度的高效用频繁项集挖掘算法MHU-Growth,较大地减少中间候选项集的数量,快速地挖掘高效用频繁项集。通过与经典算法CFP-Growth++进行对比,验证了MHU-Growth算法在运行时间、候选项集产生的数量以及内存开销等性能上优于CFP-Growth++算法。(2)在数据流环境中,现有的高效用项集挖掘算法需要多次扫描数据库,而对用户来说,效用阂值难设置,过高或过低都会影响挖掘效果。针对这些问题,本文结合多重最小支持度和效用值,构造适用于数据流挖掘的数据结构TKHUF-Tree和构建存储效用信息的矩阵PMD和RMD,并提出PEU、RTS等阈值调整策略来自动调整效用阈值的大小,减少中间候选项集的产生数量以及数据库扫描次数。(3)在TKHUF-Tree的基础上,提出了top-k高效用频繁项集数据流挖掘算法TKHFDS,它利用滑动窗口模型来处理数据流数据,并提出minTKUtil策略来调整下一个窗口的效用阂值,快速、有效地挖掘出高效用频繁项集。最后,将算法TKHFDS与传统算法TKU及T-HUDS进行对比,实验验证了TKHFDS算法在时间和内存开销等性能上的有效性。(本文来源于《广西大学》期刊2015-06-01)

陈超,刘才铭[2](2012)在《基于最小支持度阈值动态调整策略的最频繁项集挖掘算法》一文中研究指出最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足,改进传统的倒排表,并结合最小支持度阈值动态调整策略,提出一个新的基于改进的倒排表和集合理论的最频繁项集挖掘算法.另外,给出几个命题和推论,并把它们用于本文算法以提高性能,最后对所提算法进行实验验证.实验结果表明,该算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法(NApriori算法,IntvMatrix算法)都好.(本文来源于《兰州理工大学学报》期刊2012年04期)

张慧哲,王坚[3](2007)在《多重最小支持度频繁项集挖掘算法研究》一文中研究指出某些情况下提取关联规则挖掘时需要根据项目的特点设置不同的最小支持度,针对此问题进行了多重最小支持度的频繁项集挖掘算法研究。在FP-growth的基础上提出了多重最小支持度树(MS-tree)的新方法,并设计了MS-growth算法对MS-tree进行频繁模式集的挖掘。该算法只需扫描一次数据库,克服了MSapriori算法在生成关联规则时需要重新扫描数据库的缺点。实验表明,新算法的性能可以和FP-growth算法相比,而且可以处理多重最小支持度的问题。(本文来源于《计算机应用》期刊2007年09期)

频繁最小项集论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

最频繁项集挖掘是文本关联规则挖掘中研究的重点和难点,它决定了文本关联规则挖掘算法的性能.针对当前在最频繁项集挖掘方面的不足,改进传统的倒排表,并结合最小支持度阈值动态调整策略,提出一个新的基于改进的倒排表和集合理论的最频繁项集挖掘算法.另外,给出几个命题和推论,并把它们用于本文算法以提高性能,最后对所提算法进行实验验证.实验结果表明,该算法的规则有效率和时间性能比常用的两个最频繁项集挖掘算法(NApriori算法,IntvMatrix算法)都好.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

频繁最小项集论文参考文献

[1].王立俊.基于多重最小支持度的髙效用频繁项集挖掘算法研究[D].广西大学.2015

[2].陈超,刘才铭.基于最小支持度阈值动态调整策略的最频繁项集挖掘算法[J].兰州理工大学学报.2012

[3].张慧哲,王坚.多重最小支持度频繁项集挖掘算法研究[J].计算机应用.2007

标签:;  ;  ;  ;  

频繁最小项集论文-王立俊
下载Doc文档

猜你喜欢