多值属性关联论文-汪峰坤,张婷婷

多值属性关联论文-汪峰坤,张婷婷

导读:本文包含了多值属性关联论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘,关联规则,频繁项集,多值属性

多值属性关联论文文献综述

汪峰坤,张婷婷[1](2016)在《一种基于矩阵直接生成二阶频繁项集的多值属性关联规则算法》一文中研究指出使用经典的Apriori、FP_Growth等算法进行多值属性关联规则挖掘,一般是先生成频繁项集,然后根据频繁项集生成关联规则。但当一阶频繁项集通过自连接生成二阶频繁候选项集时,会出现组合爆炸现象,这严重影响了挖掘的性能。改进算法在扫描数据集的过程中,直接在内存中生成以矩阵方式表示的二阶频繁项候选集,高阶频繁项集只需扫描二阶频繁项集矩阵即可生成。实验结果表明,改进算法相比经典FP_Growth算法执行效率至少提高了50%。(本文来源于《新乡学院学报》期刊2016年06期)

汪峰坤,张婷婷[2](2015)在《一种基于压缩矩阵的多值属性关联规则改进算法》一文中研究指出针对经典的Apriori算法对多值属性数据进行关联规则挖掘时效率低下的问题,提出了改进算法。算法通过对属性值进行二进制编码、增加行和属性值计数器等方式,对数据进行了压缩,并针对压缩的存储矩阵使用了新的频繁集生成算法。实验结果表明,改进算法相比经典Apriori算法执行效率更高,所需资源更少。(本文来源于《新乡学院学报》期刊2015年12期)

汪峰坤,张婷婷[3](2015)在《一种基于有向图的多维多值属性关联规则挖掘算法》一文中研究指出针对多维多值数据特点,提出了基于FP_Growth的改进算法FP_G。FP_G算法存储结构使用有向图,增加了头结点,方便对图剪枝和遍历。针对图结构使用了新的剪枝策略,对于小于最小支持度的边直接删除,无须修改结点指针。关联规则生成时通过头结点进行深度遍历生成最大频繁模式集。实验结果表明,FP_G算法相比FP_Growth算法,在百万数量级的高维数据集上,执行时间平均节约30%左右。(本文来源于《宿州学院学报》期刊2015年12期)

郭晓波,赵书良,王长宾,陈敏[4](2015)在《一种新的面向普通用户的多值属性关联规则可视化挖掘方法》一文中研究指出针对传统关联规则可视化挖掘方法不利于处理多值属性数据、缺乏展现数据间的频繁模式和关联模式以及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法进行多值属性关联规则挖掘,实现了一种新的基于概念格的多值属性关联规则可视化方法.运用概念格理论对多值属性数据进行了重新定义和分类,建立了较为完整的挖掘过程参数调整策略,方便用户选择关键属性值进行规则挖掘分析,提高了算法运行速度和挖掘效率.以概念格结构将多值数据组织起来,实现了对频繁项集的可视化展示,以及关联规则的多模式可视化展示.实验结果表明,改进后的挖掘算法具有更好的性能,所提出的可视化形式和已有成果相比具有良好的展现效果.(本文来源于《电子学报》期刊2015年02期)

郭晓波,赵书良,王长宾,赵娇娇,刘军丹[5](2014)在《基于概念格的多值属性关联规则挖掘》一文中研究指出针对传统关联规则挖掘算法不利于用户选择关键数据进行分析、无法处理多值属性数据及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法来进行多值属性关联规则挖掘,运用概念格理论对多值属性数据进行了重新定义和分类;建立了数据挖掘参数调整机制,以提高算法挖掘效率,方便用户选择关键属性值进行规则挖掘分析。结合某省全员人口数据对算法进行了具体实现和分析。实验结果表明,算法性能具有较大提高。(本文来源于《计算机科学》期刊2014年03期)

郭晓波,赵书良,赵娇娇,刘军丹[6](2013)在《基于概念格的多值属性关联规则可视化》一文中研究指出针对传统关联规则可视化方法无法展现数据间的频繁模式和关联关系,表示形式比较单一,缺乏多模式展现形式等问题,提出了一种新的多值属性关联规则可视化表示算法。该算法运用概念格理论对多值属性数据进行了重新定义和分类,将频繁项集和关联规则中的多值数据项分别以概念格结构进行表示,实现了频繁项集可视化展示和一对一、一对多、多对一、多对多及概念分层的多模式关联规则可视化展示。最后,以某省全员人口数据为基础对算法进行了具体实现和分析,同时实现了对人口数据的源数据、频繁模式以及关联关系的可视化展示。实验结果表明,所提出的可视化形式和已有成果相比具有良好的频繁项集与多模式关联规则展现效果。(本文来源于《计算机应用》期刊2013年08期)

郭晓波[7](2013)在《基于概念格的多值属性关联规则可视化挖掘》一文中研究指出多值关联规则可视化挖掘是借助可视化技术来描述数据库中多值数据项(属性、变量)之间存在的潜在频繁模式和相关关系。可视化技术能够无缝的集成到关联规则发现过程中,将挖掘结果直观清晰地展现出来,用户能够更快、更容易地识别出隐藏在数据内部的有用信息,提高决策效率。作为知识的一种可视化表现形式,概念格已经被人们应用到数据挖掘领域。文章利用概念格理论提出了多值属性关联规则可视化挖掘解决方案,通过数据源可视化、交互式参数调整与可视化挖掘过程、多值属性关联规则挖掘算法、频繁项集与关联规则的可视化以及关联规则的知识表示等机制,使用户可不依赖领域专家直接进行关联规则可视化挖掘。该方案在提高挖掘效率的同时,提高了挖掘结果的可用性。论文以研究和实现基于概念格的多值属性关联规则可视化挖掘为核心,主要做了以下几方面工作:1.运用概念格理论给出了适合关联规则可视化挖掘的多值属性数据分类,并建立了较为完善的挖掘过程参数调整机制。根据某省全员人口数据的特点,结合概念格理论给出了适合多值属性关联规则可视化挖掘的多值背景定义,将其分为数值型多值属性、区间型多值属性和类别型多值属性叁类;建立了以支持度、置信度、关键属性因子和概念层因子为基础的参数调整机制,在整个挖掘过程中通过调整相关参数的大小来挖掘相应的频繁项集和关联规则,方便用户选择关键属性值进行规则挖掘分析,提高算法运行速度和挖掘效率。2.提出了基于关键属性因子和概念层因子的Apriori改进算法。针对传统关联规则挖掘算法用户无法选择关键数据进行分析、不利于处理多值属性数据及效率低下等问题,提出了基于关键属性因子KAF因子和概念层因子CHF因子的Apriori改进算法进行多值属性关联规则挖掘。同Apriori算法相比,改进后的挖掘算法在执行速度和挖掘效率上具有更好的性能表现。3.给出了基于概念格的多值属性关联规则可视化方法。由于传统关联规则可视化方法无法展现数据间的频繁模式和关系、缺乏多模式展现形式等,提出了一种新的多值属性关联规则可视化算法。通过引入概念格把多值属性数据项有机地组织起来,使数据之间的关系通过概念格节点的泛化与特化关系直观地体现出来,不仅便于用户对频繁项集进行可视化展示和动态分析,而且实现了一对一、一对多、多对一、多对多以及概念分层的多模式关联规则可视化展示。4.给出了基于概念图的关联规则知识表示方法。鉴于传统关联规则表示方式无法展现领域知识、数据项间的关系及规则中所隐含的信息等问题,提出了一种基于概念图的关联规则知识表示方法,包括模式定义和模式解析,结合概念图理论将关联规则转换成概念图的知识表示形式,使数据项之间的关系利用概念节点和关系节点表现出来。展示结果接近自然语言形式,具有较强的可读性,有助于用户对关联规则进行深入分析和研究。(本文来源于《河北师范大学》期刊2013-03-05)

姜丽莉,孟凡荣,周勇[8](2011)在《多值属性关联规则挖掘的Q-Apriori算法》一文中研究指出针对Apriori算法进行多值属性关联规则挖掘时效率低下的问题,提出量化Apriori算法。利用多值属性数据特点改变项集存储格式,采用类似矩阵的数据结构存储项集,提高遍历数据库时统计计数的速度,使用类似矩阵的加法运算改进连接操作,减少无效候选项集的产生。实验结果表明,相比Apriori算法,该算法执行效率有较大提高。(本文来源于《计算机工程》期刊2011年09期)

杜韬,曲守宁,崔广强[9](2009)在《多值属性的数据处理与关联规则挖掘方法研究》一文中研究指出讨论了在多值属性关系中进行关联规则挖掘的应用特点,提出利用数据整理和数值编码的方式对关联规则挖掘算法进行优化。将目标数据属性按其在算法中的作用划分,并分别进行转换和编码;然后对数据先进行聚类,再在聚类结果中发掘频繁项目集;最后利用聚类后关联规则快速更新算法获取关联规则。算法分析和实验结果表明,该算法比传统的关联规则挖掘算法更有效率。(本文来源于《计算机应用研究》期刊2009年08期)

王二锋,崔杜武,陈皓,崔颖安,费蓉[10](2008)在《一种新的多值属性关联规则挖掘算法》一文中研究指出为解决多值属性的关联规则挖掘问题给出相似属性集合矩阵的概念,提出一种新的多值关联规则挖掘算法——Qarmasm算法。该算法无须扩展事务属性,约简效率高,能够直接生成候选频繁项集,求出其支持度,有效地发现频繁项。给出算法的描述及其复杂性分析。与经典算法的对比表明,该算法具有明显的优势。(本文来源于《计算机工程》期刊2008年22期)

多值属性关联论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对经典的Apriori算法对多值属性数据进行关联规则挖掘时效率低下的问题,提出了改进算法。算法通过对属性值进行二进制编码、增加行和属性值计数器等方式,对数据进行了压缩,并针对压缩的存储矩阵使用了新的频繁集生成算法。实验结果表明,改进算法相比经典Apriori算法执行效率更高,所需资源更少。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多值属性关联论文参考文献

[1].汪峰坤,张婷婷.一种基于矩阵直接生成二阶频繁项集的多值属性关联规则算法[J].新乡学院学报.2016

[2].汪峰坤,张婷婷.一种基于压缩矩阵的多值属性关联规则改进算法[J].新乡学院学报.2015

[3].汪峰坤,张婷婷.一种基于有向图的多维多值属性关联规则挖掘算法[J].宿州学院学报.2015

[4].郭晓波,赵书良,王长宾,陈敏.一种新的面向普通用户的多值属性关联规则可视化挖掘方法[J].电子学报.2015

[5].郭晓波,赵书良,王长宾,赵娇娇,刘军丹.基于概念格的多值属性关联规则挖掘[J].计算机科学.2014

[6].郭晓波,赵书良,赵娇娇,刘军丹.基于概念格的多值属性关联规则可视化[J].计算机应用.2013

[7].郭晓波.基于概念格的多值属性关联规则可视化挖掘[D].河北师范大学.2013

[8].姜丽莉,孟凡荣,周勇.多值属性关联规则挖掘的Q-Apriori算法[J].计算机工程.2011

[9].杜韬,曲守宁,崔广强.多值属性的数据处理与关联规则挖掘方法研究[J].计算机应用研究.2009

[10].王二锋,崔杜武,陈皓,崔颖安,费蓉.一种新的多值属性关联规则挖掘算法[J].计算机工程.2008

标签:;  ;  ;  ;  

多值属性关联论文-汪峰坤,张婷婷
下载Doc文档

猜你喜欢