置信度阈值论文-陈柳

置信度阈值论文-陈柳

导读:本文包含了置信度阈值论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘,正负关联规则,多级置信度阈值,项集相关性

置信度阈值论文文献综述

陈柳[1](2018)在《基于多级置信度阈值的正负关联规则挖掘研究》一文中研究指出关联规则挖掘是数据挖掘领域中一个重要的研究方向。它揭示了数据集中项集之间的有趣关联关系,具有重要的理论价值和广泛的应用前景。然而,大多数的关联规则挖掘仅研究了数据项集之间的正向关联关系,对于隐藏在数据集中的项集间的负向关联关系,没有引起足够的重视。但是,在实际应用中,项集间的负向关联关系能为决策者提供更多有价值的决策信息。因此,正负关联规则挖掘的研究具有重要的现实意义。本文对正负关联规则挖掘的基本理论进行了讨论,深入地分析了有效正负关联规则挖掘算法设计的关键要素,总结了现有挖掘算法的不足。现有的基于多级置信度阈值的正负关联规则挖掘算法难以有效地设置多个置信度阈值来控制无趣规则的数量,提取出可信度高的规则。并且它们在挖掘过程中还容易遗漏一些有趣的关联规则。对此,本文对基于多级置信度阈值的正负关联规则挖掘算法进行了深入的分析和研究,取得如下研究成果:(1)结合项集相关性,系统地分析了正负关联规则置信度随规则的项集支持度大小变化的特点。据此特点提出了一种新的正负关联规则两级置信度阈值设置方法TCTPN。理论分析和实验对比结果表明,新方法不仅可以更好地确保提取出的关联规则有效和有趣,还可以显着降低可信度低的关联规则数量。(2)提出了一个基于相关性度量Kulc和TCTPN的正负关联规则挖掘算法PNARKT。算法基于有趣正负关联规则前件和后件的正项集频繁的理论,通过对事务数据库中不相交的两个频繁项集进行相关性分析来产生强正负关联规则,从而减少了有趣规则的遗漏。同时,相关性度量Kulc和新置信度阈值设置方法TCTPN的结合可以保证PNARKT算法提取出的规则有趣、可信。理论证明和实验对比结果都表明,PNARKT算法不仅可以更好地避免有趣正负关联规则的遗漏,而且在零事务居多以及两个项集蕴含关系具有不平衡特点的事务数据库中,也能有效地提取出有趣的正负关联规则。(本文来源于《四川师范大学》期刊2018-03-25)

陈柳,冯山[2](2018)在《正负关联规则两级置信度阈值设置方法》一文中研究指出针对传统正负关联规则置信度阈值设置方法难以控制低可信度规则数量和易遗漏有趣规则的问题,提出了一个结合项集相关性的两级置信度阈值设置方法(PNMC-TWO)。首先,基于规则的无矛盾性、有效性和有趣性考虑,以相关度-支持度-置信度为框架,从规则置信度与项集支持度的计算关系出发,系统地分析了正负关联规则置信度取值随规则的项集支持度大小变化的规律;然后,与实际挖掘中用户对高可信度且有趣的规则需求相结合,提出了一个新的设置模型,避免了传统方法设置阈值时的盲目性和随意性;最后,从规则数量和规则质量两方面对所提方法与原双阈值法进行了实验对比。实验结果表明,所提方法不仅可以更好地确保提取出的关联规则有效和有趣,还可以显着地降低可信度低的关联规则数量。(本文来源于《计算机应用》期刊2018年05期)

张健,王蔚[3](2007)在《基于支持度与置信度阈值优化技术的关联分类算法》一文中研究指出基于关联规则的分类算法中,支持度和置信度阈值的设置会影响分类器的准确率。以往的关联分类算法都根据经验人为地设置支持度和置信度的阈值,很难保证分类器总能达到较好的分类效果。为了解决该问题,可以将优化求解策略引入到关联分类过程中。通过利用爬山法搜索技术来获得使分类准确率最高的支持度与置信度阈值,对Apriori_TFP_CMAR关联分类算法进行改进,避免了阈值设置不合理影响最终分类效果的问题,提高了关联分类算法的分类准确率。(本文来源于《计算机应用》期刊2007年12期)

置信度阈值论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对传统正负关联规则置信度阈值设置方法难以控制低可信度规则数量和易遗漏有趣规则的问题,提出了一个结合项集相关性的两级置信度阈值设置方法(PNMC-TWO)。首先,基于规则的无矛盾性、有效性和有趣性考虑,以相关度-支持度-置信度为框架,从规则置信度与项集支持度的计算关系出发,系统地分析了正负关联规则置信度取值随规则的项集支持度大小变化的规律;然后,与实际挖掘中用户对高可信度且有趣的规则需求相结合,提出了一个新的设置模型,避免了传统方法设置阈值时的盲目性和随意性;最后,从规则数量和规则质量两方面对所提方法与原双阈值法进行了实验对比。实验结果表明,所提方法不仅可以更好地确保提取出的关联规则有效和有趣,还可以显着地降低可信度低的关联规则数量。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

置信度阈值论文参考文献

[1].陈柳.基于多级置信度阈值的正负关联规则挖掘研究[D].四川师范大学.2018

[2].陈柳,冯山.正负关联规则两级置信度阈值设置方法[J].计算机应用.2018

[3].张健,王蔚.基于支持度与置信度阈值优化技术的关联分类算法[J].计算机应用.2007

标签:;  ;  ;  ;  

置信度阈值论文-陈柳
下载Doc文档

猜你喜欢