完全频繁项集论文-王少鹏,闻英友,赵宏

完全频繁项集论文-王少鹏,闻英友,赵宏

导读:本文包含了完全频繁项集论文开题报告文献综述及选题提纲参考文献,主要关键词:数据流,滑动窗口,编辑距离比率,加权最大频繁项集

完全频繁项集论文文献综述

王少鹏,闻英友,赵宏[1](2016)在《滑动窗口下数据流完全加权最大频繁项集挖掘》一文中研究指出针对当前关于数据流加权最大频繁项集WMFI(weighted maximal frequent itemsets)的研究无法有效地处理频繁阈值和加权频繁阈值不一致情况下WMFI的挖掘问题,提出了完全加权最大频繁项集FWM FI(full w eighted maximal frequent itemsets)的概念.为了减少naive算法在处理滑动窗口下完全加权最大频繁项集挖掘时存在的冗余运算,提出了FWMFI-SW(FWMFI mining based on sliding window over data stream)算法.所提出的算法通过基于频繁约束条件的优化策略减少了naive算法中M ax W优化策略的无效调用次数;采用编辑距离比率作为WMFP-SW-tree的重构判别函数,可以有效减少该树的重构次数.实验结果表明FWMFI-SW算法是有效的,且比naive算法更有时间优势.(本文来源于《东北大学学报(自然科学版)》期刊2016年07期)

黄红星[2](2014)在《挖掘完全频繁项集的蚁群算法》一文中研究指出关联规则是数据挖掘发现的重要知识,完全频繁项集的发现是挖掘关联规则的关键步骤.蚁群算法是一种元启发式算法,已经有效应用于许多组合优化问题.因此,提出一种新的应用蚁群算法挖掘完全频繁项集的方法.对比实验表明,该算法是智能高效的.(本文来源于《微电子学与计算机》期刊2014年12期)

张勇[3](2009)在《完全频繁项集挖掘算法及其在分类中应用研究》一文中研究指出随着社会科技的进步,信息量呈几何级增长,如何从大量信息中提取出潜在相互关联的知识集合体,成为当前数据挖掘领域中迫切需要解决的一个问题。频繁项集的提出,为解决该问题提供了一个有效的方法。频繁项集是指从数据中提取出满足支持度阈值的的信息集合体,它包含着大量潜在有用信息,能够有效地为人类提供决策支持。目前基于Apriori算法思想的完全频繁项集挖掘算法能够有效地实现稀疏型数据集和短模式下的挖掘工作,但在密集型数据集和长模式下,挖掘效率不高,因此应用受到很大限制。针对当前完全频繁项集挖掘算法在密集数据集和长模式挖掘上存在的效率问题,本文提出了一种Apriori改进算法,该算法引入垂直比特数据表示方法以及交叉计数方式,利用索引向量表生成候选二项集,同时将非频繁二项集用于候选项集的剪枝,并在计数阶段,采用前缀数组数据结构优化计数方式。实验结果表明,经改进后的Apriori算法能够有效地挖掘密集数据集和长模式下的频繁项集。为了进一步提高计数的效率,在前文研究的基础上,引入差集思想,计数由之前的完全标识集交叉计数转化为差集标识集计数,从而进一步地提高了Apriori算法的运行效率。最后,本文将频繁项集研究成果应用于分类中。传统的分类算法存在分类过程黑箱操作,分类结果无法解释的缺点,而基于频繁项集的关联规则分类算法能够有效解决上述问题,但由于缺乏有效的规则评价指标,分类精度普遍不高。鉴于此,本文提出一种新的关联规则分类算法。它引入了兴趣度规则评价指标,有效地删除分类信息少的冗余规则,并利用权重准则对规则重要性进行排序,进而达到提高分类精度的目的。(本文来源于《大连理工大学》期刊2009-11-01)

杨仕博,贺彦琨,马志新[4](2007)在《一种基于极大完全子图的最大频繁项集并行挖掘算法》一文中研究指出提出一种基于极大完全子图的最大频繁项集并行挖掘算法PMFIM,通过遍历由频繁2-项集构成的用邻接矩阵表示的图,寻找图的极大完全子图,从而由极大完全子图顶点序列实现对项集的划分,即挖掘子任务的划分。在同类算法中,将找到的最大频繁项划分为局部最大频繁项集LMFI、可能最大频繁项集PMFI和邻接项集的最大频繁项集的超集SMFI,减少了该类算法合并最大频繁项集的开销,并对算法进行了实现和优化。(本文来源于《2007年全国开放式分布与并行计算机学术会议论文集(下册)》期刊2007-10-12)

杨仕博,贺彦琨,马志新[5](2007)在《一种基于极大完全子图的最大频繁项集并行挖掘算法》一文中研究指出提出一种基于极大完全子图的最大频繁项集并行挖掘算法PMFIM,通过遍历由频繁2-项集构成的用邻接矩阵表示的图,寻找图的极大完全子图,从而由极大完全子图顶点序列实现对项集的划分,即挖掘子任务的划分。在同类算法中,将找到的最大频繁项划分为局部最大频繁项集LMFI、可能最大频繁项集PMFI和邻接项集的最大频繁项集的超集SMFI,减少了该类算法合并最大频繁项集的开销,并对算法进行了实现和优化。(本文来源于《微电子学与计算机》期刊2007年10期)

完全频繁项集论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

关联规则是数据挖掘发现的重要知识,完全频繁项集的发现是挖掘关联规则的关键步骤.蚁群算法是一种元启发式算法,已经有效应用于许多组合优化问题.因此,提出一种新的应用蚁群算法挖掘完全频繁项集的方法.对比实验表明,该算法是智能高效的.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

完全频繁项集论文参考文献

[1].王少鹏,闻英友,赵宏.滑动窗口下数据流完全加权最大频繁项集挖掘[J].东北大学学报(自然科学版).2016

[2].黄红星.挖掘完全频繁项集的蚁群算法[J].微电子学与计算机.2014

[3].张勇.完全频繁项集挖掘算法及其在分类中应用研究[D].大连理工大学.2009

[4].杨仕博,贺彦琨,马志新.一种基于极大完全子图的最大频繁项集并行挖掘算法[C].2007年全国开放式分布与并行计算机学术会议论文集(下册).2007

[5].杨仕博,贺彦琨,马志新.一种基于极大完全子图的最大频繁项集并行挖掘算法[J].微电子学与计算机.2007

标签:;  ;  ;  ;  

完全频繁项集论文-王少鹏,闻英友,赵宏
下载Doc文档

猜你喜欢