导读:本文包含了任意形状聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:层次聚类算法,密度聚类算法,任意形状聚类,动态模型
任意形状聚类论文文献综述
许合利,牛丽君[1](2016)在《基于层次与密度的任意形状聚类算法》一文中研究指出结合层次聚类算法和密度聚类算法,提出一种新的任意形状聚类算法,以密度峰值点为初始聚类中心将数据集划分为大量子簇。根据聚类合并准则,对簇间边界区域密度大于等于其中任何一个簇平均密度的相邻子簇进行合并。通过动态建模方法进行子簇合并,无需人工输入终止参数即可自动确定聚类终止点。在测试数据集和真实数据集上的实验结果表明,该算法对输入参数的选择具有鲁棒性,能有效识别任意形状、大小和密度的聚类,并且适用于密度分布不均匀的数据集。(本文来源于《计算机工程》期刊2016年07期)
牛丽君[2](2016)在《基于层次和密度的任意形状聚类算法研究》一文中研究指出聚类技术作为数据挖掘领域的一个重要研究方向,可以有效地帮助人们了解数据的分布和特征,以便作进一步研究分析。虽然已有的聚类算法很多,但聚类技术依然存在很多问题和挑战。结合层次聚类算法和密度聚类算法,本文提出一种新的任意形状聚类算法。该算法在层次聚类技术的框架下,使用基于密度聚类的思想来定义子簇和子簇合并方法,论文的主要工作如下:(1)针对目前层次聚类算法的计算时间复杂度较高,并且需要人为输入聚类个数或者阈值参数作为聚类终止条件的问题,本文提出了一种新颖的基于密度的子簇合并方法,将簇间边界区域密度大于等于其中任何一个簇平均密度的相邻子簇进行合并。该子簇合并准则使用动态模型的方法,能够自动适应被合并簇之间的内部特征属性,可自动确定聚类个数和聚类终止点,从而发现任意形状的聚类。(2)针对密度聚类算法容易忽略密度稀疏区域中的密度峰值点的问题,本文找出距离其他高密度点距离较远的点作为密度峰值点,放宽了对密度峰值点的选择范围。然后,根据这些密度峰值点将数据集切分为大量初始子簇,而且得到的子簇比较正确。(3)针对密度聚类方法使用全局统一的距离参数,不利于密度差异较大数据集的问题,本文通过将低密度数据集与高密度数据集分层,将低密度子簇筛选出来,设置合适的距离参数进行聚类来解决上述问题。在测试数据集以及真实数据集上的对比实验表明,本文算法具有能自动确定聚类个数,能够有效地发现任意形状、大小的聚类,对输入参数的选择具有鲁棒性,并且适用于密度分布不均匀的数据集等优点。(本文来源于《河南理工大学》期刊2016-04-20)
王博[3](2016)在《挖掘任意形状簇的聚类算法研究》一文中研究指出数据挖掘是一个能从大规模数据中发现知识的强大技术。聚类分析作为数据挖掘中的一个基础工具,已经被广泛应用于模式识别、图像处理、空间数据分析、文本分类和信息检索、市场分析等众多领域。随着计算机的普及和互联网的不断发展,数据量越来越大,数据的空间分布中大多包含多种不规则形状的簇,比如地理信息数据、医学图像数据、农业科学数据等,这对聚类分析提出了挑战。传统的聚类算法通常不能很好地挖掘任意形状的簇,近年来,挖掘任意形状簇的研究成为聚类分析领域的一个研究热点。为了更有效地对包含有任意形状簇的数据进行聚类,本文对现有的聚类算法进行分析和研究,提出了两个能挖掘任意形状簇的聚类算法CMSPC、CFDPm。本文提出的CMSPC算法是为了提高在包含任意形状簇的数据集上的聚类质量。CMSPC算法基于点与簇内多点的相似性,对于距离在截断距离之内的两个对象,考虑其中一个对象关于另外一个对象所在簇的归属度,对满足一定归属度的临时簇进行合并。CMSPC算法基于点与簇内多点相似的特点使得聚类结果与簇形状无关,同时能够提取出异常点。本文提出的另外一个聚类算法CFDPm是新型聚类算法CFDP算法的一种改进算法。在多峰簇数据集中,CFDP算法会因簇中心点的选取不准确而导致聚类质量的下降。本文通过综合考虑聚类结果中簇之间的距离、簇内距离、合并两簇后对于整体内部评价指标DBI的影响来有条件地对簇进行合并,从而改善因选择簇中心点失效而带来的聚类质量下降的问题。为了验证本文提出的两种聚类算法的有效性,我们在多个基准数据集上进行了聚类实验。实验结果表明两点:一、CMSPC算法可以对包含任意形状簇的数据进行较好的聚类,同时识别出异常点,具有较高的聚类质量。二、CFDPm算法能够克服CFDP算法因簇中心选取不准确而导致的聚类质量下降的问题。(本文来源于《兰州大学》期刊2016-04-01)
陈沛帅,琚春华[4](2012)在《基于密度与动态阈值的任意形状聚类挖掘算法研究》一文中研究指出本文分析了数据聚类算法BIRCH的不足之处,提出了一种基于密度与动态阈值的任意形状聚类挖掘算法——DVTD算法,它结合密度和阈值双重参数,并根据数据集内在特征,动态改变阈值T,既可以控制CF树的大小,也能利用不同球形聚类逼近任意形状的数据聚类。实验结果表明,它的算法复杂度与BIRCH相当,并大大降低了CF的大小,对任意形状的聚类效果可以达到与DBSCAN相近的效果。(本文来源于《电信科学》期刊2012年01期)
苏晓珂,兰洋,程耀东,万仁霞[5](2010)在《可处理混合属性的任意形状聚类》一文中研究指出聚类是数据挖掘中一个非常活跃的研究分支,任意形状的聚类则是一个有待研究的开放问题。提出一种包含分类属性取值频率信息的类间差异性度量和一种对象与类的相似度定义,在此基础上提出一种能处理任意形状的聚类算法,可处理混合属性数据集。在人造数据集和真实数据集上检验了提出的算法,并与相关算法进行了对比,实验结果表明,提出的算法是有效可行的。(本文来源于《计算机工程与应用》期刊2010年34期)
吴枫,仲妍,金鑫,吴泉源,贾焰[6](2009)在《滑动窗口内进化数据流任意形状聚类算法》一文中研究指出任意形状聚类是数据流挖掘中的重要研究课题.提出一种滑动窗口内进化数据流任意形状聚类算法SWASCStream.提出了改良的微簇特征结构,能够全面地描述滑动窗口内任意形状的簇;提出新的稀疏微簇、临界微簇和非疏微簇的概念,有助于从本质上提高滑动窗口内的聚类质量;提出了合理的微簇周期删除策略,能够有效降低算法的维护代价,并且保证误差可控.通过一系列真实和人工数据集上的试验,验证了本文算法的高效性.(本文来源于《小型微型计算机系统》期刊2009年05期)
朱蔚恒,印鉴,谢益煌[7](2006)在《基于数据流的任意形状聚类算法》一文中研究指出详细分析了数据流聚类算法CluStream的不足之处,如对非球形的聚类效果不好、对周期性数据的聚类变化反映不完整等,并针对这些不足之处提出了一种采用空间分割、组合以及按密度聚类的算法ACluStream.实验结果表明,ACluStream在准确度和速度上都比CluStream有较大的提高.(本文来源于《软件学报》期刊2006年03期)
刘必红,符红光[8](2002)在《快速发现任意形状的聚类》一文中研究指出提出FFCAS(FastFindingtheClustersofArbitraryShape)聚类算法 ,用于快速发现任意形状的聚类。先将每个对象分配到很小的ε -邻域 ,即原子聚类 ,然后找出高浓度的核心原子聚类 ,再消除所有的冗余原子聚类 ,仅用边界来表示聚类 ,大大减小了存储空间。因为ε是一个很小的值 ,原子聚类能自然地描述聚类。该算法最坏时间复杂度为O(nlogn) (n为数据库中的对象个数 ) ,只需访问一次数据库。实验表明 ,FFCAS运行时间与数据库中的对象数目成线性关系 ,能发现任意形状的聚类 ,对异类的敏感性低 ,对大型、高维数据库也有效(本文来源于《计算机应用》期刊2002年04期)
任意形状聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
聚类技术作为数据挖掘领域的一个重要研究方向,可以有效地帮助人们了解数据的分布和特征,以便作进一步研究分析。虽然已有的聚类算法很多,但聚类技术依然存在很多问题和挑战。结合层次聚类算法和密度聚类算法,本文提出一种新的任意形状聚类算法。该算法在层次聚类技术的框架下,使用基于密度聚类的思想来定义子簇和子簇合并方法,论文的主要工作如下:(1)针对目前层次聚类算法的计算时间复杂度较高,并且需要人为输入聚类个数或者阈值参数作为聚类终止条件的问题,本文提出了一种新颖的基于密度的子簇合并方法,将簇间边界区域密度大于等于其中任何一个簇平均密度的相邻子簇进行合并。该子簇合并准则使用动态模型的方法,能够自动适应被合并簇之间的内部特征属性,可自动确定聚类个数和聚类终止点,从而发现任意形状的聚类。(2)针对密度聚类算法容易忽略密度稀疏区域中的密度峰值点的问题,本文找出距离其他高密度点距离较远的点作为密度峰值点,放宽了对密度峰值点的选择范围。然后,根据这些密度峰值点将数据集切分为大量初始子簇,而且得到的子簇比较正确。(3)针对密度聚类方法使用全局统一的距离参数,不利于密度差异较大数据集的问题,本文通过将低密度数据集与高密度数据集分层,将低密度子簇筛选出来,设置合适的距离参数进行聚类来解决上述问题。在测试数据集以及真实数据集上的对比实验表明,本文算法具有能自动确定聚类个数,能够有效地发现任意形状、大小的聚类,对输入参数的选择具有鲁棒性,并且适用于密度分布不均匀的数据集等优点。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
任意形状聚类论文参考文献
[1].许合利,牛丽君.基于层次与密度的任意形状聚类算法[J].计算机工程.2016
[2].牛丽君.基于层次和密度的任意形状聚类算法研究[D].河南理工大学.2016
[3].王博.挖掘任意形状簇的聚类算法研究[D].兰州大学.2016
[4].陈沛帅,琚春华.基于密度与动态阈值的任意形状聚类挖掘算法研究[J].电信科学.2012
[5].苏晓珂,兰洋,程耀东,万仁霞.可处理混合属性的任意形状聚类[J].计算机工程与应用.2010
[6].吴枫,仲妍,金鑫,吴泉源,贾焰.滑动窗口内进化数据流任意形状聚类算法[J].小型微型计算机系统.2009
[7].朱蔚恒,印鉴,谢益煌.基于数据流的任意形状聚类算法[J].软件学报.2006
[8].刘必红,符红光.快速发现任意形状的聚类[J].计算机应用.2002