初始化聚类论文-任云,黎洪松

初始化聚类论文-任云,黎洪松

导读:本文包含了初始化聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:自组织映射,图像压缩,k-means聚类,均值排序

初始化聚类论文文献综述

任云,黎洪松[1](2018)在《基于k-means聚类的叁维SOM初始化模式库算法》一文中研究指出针对传统模式库初始化算法的叁维SOM重建效果对于模式矢量的输入顺序比较敏感的问题,提出基于k-means聚类的叁维SOM初始化模式库算法。计算训练矢量集中各矢量的方差,将所得到的方差利用k-means算法聚成叁类,分别再按均值各自排序;设置模式库大小,并以相同间隔在训练矢量集中抽取一定的模式构成初始模式库。实验结果表明,基于k-means聚类的叁维SOM初始化模式库算法减少了搜索时间,增加了信源的匹配度,提高了叁维SOM算法的整体性能。(本文来源于《桂林电子科技大学学报》期刊2018年05期)

洪敏,贾彩燕,王晓阳[2](2019)在《K-means型多视图聚类中的初始化问题研究》一文中研究指出在K-means型多视图聚类算法中,最终的聚类结果会受到初始类中心的影响。因此研究了不同的初始中心选择方法对K-means型多视图聚类算法的影响,并提出一种基于采样的主动式初始中心选择方法(sampledclustering by fast search and find of density peaks,SDPC)。该方法通过对数据集进行均匀采样,利用密度峰值快速搜索聚类算法(clustering by fast search and find of density peaks,DPC),以及K-means再迭代策略,进一步改善多视图聚类中的初始中心选择效率和类个数问题。实验验证了不同初始化方法对K-means型多视图聚类算法的影响。多视图基准数据集上的实验结果表明:全局(核)K-means初始化方法存在时间复杂度过高的问题,AFKMC~2(assumption-free K-Markov chain Monte Carlo)初始化适用于大规模数据,DPC可以主动选择类个数和初始类中心,SDPC较DPC而言,不仅能主动式获得类个数,还在聚类精度和效率上取得了较好的折衷。(本文来源于《计算机科学与探索》期刊2019年04期)

王思杰,唐雁[3](2018)在《改进的分类数据聚类中心初始化方法》一文中研究指出模糊K-modes算法是一种有效的针对分类数据的聚类方法,但算法性能非常依赖于初始中心的选择。针对模糊聚类算法对初始中心敏感这一问题,提出一种改进的基于距离和离群点检测的初始中心选择的方法。首先,通过增大初始中心选择过程中距离所占的比重,使所选择的初始中心点更具有分布性;然后,运用基于距离的离群点检测技术对初始中心点进行进一步筛选,避免离群点成为初始中心。对比实验结果表明,改进方法提高了分类数据初始中心选择的成功率,并具有较高的准确率。(本文来源于《计算机应用》期刊2018年S1期)

郭荣传[4](2016)在《基于密度函数的FCM聚类中心初始化研究综述》一文中研究指出模糊C均值(FCM)聚类算法能很好地解决不确定问题的分类,但该算法聚类结果却过于依赖初始聚类中心和易陷入局部最优解。本文重点针对基于密度函数的初始聚类中心初始化算法进行分类总结,将密度函数的度量方式归纳为4大类。通过实验对比分析了各种度量方式的优缺点,旨在为研究人员选择适合的密度函数度量方法提供一定的参考。(本文来源于《科技广场》期刊2016年06期)

张鲁营,赵晓凡[5](2016)在《一种有效的均值聚类初始化方法》一文中研究指出聚类算法是用来提取有用信息的重要技术,k均值聚类算法是其中应用最为普遍的聚类分析算法。然而,这种聚类算法的主要问题是,最终的聚类结果高度依赖于初始聚类中心。标准的k均值聚类算法使用随机初始中心会得到很差的聚类结果。因此,为了克服标准k-均值聚类算法的不足,本文提出一种基于贡献率的方法来优化初始中心的选择,以便得到一个好的聚类结果。将新提出的初始化方法应用到一些知名的数据集,将其与几种传统的初始化算法相比较,证明新提出的初始化方法具有良好的性能。本文所提出的方法不仅容易理解,而且聚类的迭代次数和执行时间也明显下降。本文的初始化方法可以保证得到一个比较好的聚类结果。(本文来源于《智能计算机与应用》期刊2016年03期)

胡庆辉,阮晓霞[6](2016)在《基于MCD初始化的高斯混合模型聚类》一文中研究指出高斯混合模型聚类是一种基于概率模型的有效聚类方法,传统算法对模型的初始化(包含成分数、每个成分的均值和方差)的设置非常敏感,容易导致EM算法陷入局部最优解或收敛到解空间的边界,为了解决这个问题,可利用最小化协方差矩阵行列式(MCD),结合传统成熟的高斯混合模型算法,来实现对高斯混合模型的初始化,而MCD初始化的算法对初始值的设定没有特殊的要求,通过实验证明其具有很好的聚类性能和鲁棒性。(本文来源于《桂林航天工业学院学报》期刊2016年01期)

吴成茂,何晶[7](2016)在《图形模糊聚类算法初始化方式改进》一文中研究指出为了降低初始化参数对图形模糊聚类算法收敛性的影响,对图形模糊聚类算法的初始化方法加以改进。将隶属度、中立度和拒绝度3个参量的随机值先求平方,再按其平方和进行归一化处理,以代替原来的初始化方法。将改进前后的算法用于Iris文本数据分类,以及基于1维或2维直方图的人物、医学和遥感的图像分割,结果显示,改进算法用时短,收敛快。将改进算法作用于含噪标准灰度图像,分割结果的峰值信噪比更高。(本文来源于《西安邮电大学学报》期刊2016年02期)

王艳娥[8](2014)在《划分式聚类算法的初始化方法研究》一文中研究指出随着计算机软硬件的发展,计算机存储设备能够存储的信息越来越多,人们要从海量的数据中寻找有用的信息却越来越难,数据挖掘作为处理海量数据的一种技术应运而生,它能够从杂乱的海量数据中,发现隐藏的潜在有用的模式与规律。聚类分析作为数据挖掘的重要组成部分,成为国内外学者的重要研究领域,聚类分析是非监督学习的一种数据挖掘技术,它基于“物以类聚”的思想,使得同类的数据对象具有较高的相似度,而不同类簇的数据对象具有较高的分离度。聚类分析根据聚类的具体方式可分为六种聚类方法:即为基于划分的聚类算法、基于密度的聚类算法、基于网格的聚类算法、基于层次的聚类算法和基于模型的聚类算法。本文主要研究的是基于划分的聚类算法,通过研究国内外有关划分聚类算法的文献,根据其存在的一些问题,提出改进的算法。本文主要工作如下:1.基于最小方差优化的K-means算法。传统K-means算法随机选择初始聚类中心,聚类结果受数据输入顺序影响,即使数据输入顺序一定,其随机选择的初始聚类中心也会导致聚类结果不稳定。现有的一些改进K-means算法能够选出符合原始分布的较优初始聚类中心,但在选取中心点时需要一定的参数值,这些参数值没有规律可循,往往需要一定的经验值。本文算法根据数据对象的最小方差和所有数据对象的距离均值选取初始聚类中心,在选取初始聚类中心时不需要参数输入。改进算法很好解决了K-means随机选择初始聚类中心的问题,能够客观地选择出符合数据集原始分布的初始聚类中心。2.基于最小方差优化的K-medoid算法。传统K-medoid算法能够克服K-means算法对噪声点敏感的缺点,但仍然存在初始聚类中随机选择带来的缺陷,并增加了更新聚类中心时采用对所有非中心点进行评估的原则,致使K-medoids算法时间复杂度很大,无法处理大数据集的问题。本文提出最小方差优化的K-medoids算法,选取方差最小的数据对象同时结合所有数据对象的距离均值来选择初始聚类中心,使得选择的初始聚类中心尽可能的符合数据集的原始分布状态,尽可能位于不同的簇,并尽可能接近簇中心。为了降低K-medoids的时间复杂度,更新聚类中心时,选择同类簇中方差最小的数据对象进行更替,并运用聚类误差平方和进行判断是否更新类簇中心,从而加快算法的收敛速度,增强了原始K-medoids算法的伸缩性,使之能够处理大规模的数据集,提高了算法的执行效率。3.聚类有效性评价准则。聚类算法作为一种数据分析工具,聚类结果能否揭示数据集的原始分布或者能够达到人们的期望,是评价聚类算法性能的重要依据。构造一定的标准去评价聚类算法的结果,判定聚类算法是否揭示了数据集的原始分布或达到预期的期望,是聚类有效性评价研究的重点。正确合理的标准能有效分辨聚类算法的优劣,能对整个聚类过程进行客观分析。聚类有效性评价指标研究可以分为内部评价指标和外部评价指标两大类。本文总结了常用的几种内部有效性评价准则和外部有效性评价准则,对内部有效性准则进行了对比,分析这几种内部有效性评价准则的特点。同时介绍了几种常用的外部有效性评价准则,在对现有外部评价准则优缺点进行分析的基础上,提出新的外部有效性评价指标。新指标更能揭示聚类算法的结果是否反映了数据集的原始分布,并避免了现有外部评价指标对于类偏斜问题无法正确判断的缺陷。(本文来源于《陕西师范大学》期刊2014-05-01)

张焱,汤宝平,邓蕾[9](2013)在《基于谱聚类初始化非负矩阵分解的机械故障诊断》一文中研究指出针对非负矩阵分解(NMF)收敛性问题,提出使用谱聚类方法为NMF产生结构化初始值,研究基于谱聚类初始化NMF的机械故障诊断模型。首先利用NJW谱聚类算法求取振动信号聚类中心,再以聚类中心初始化信号特征空间基向量并以NMF算法迭代求取基向量,最后将各模式数据在特征空间映射所得投影系数作为特征矢量输入到最近邻分类器(KNNC)中进行故障识别。基于谱聚类初始化NMF的机械故障诊断模型实现了机械故障特征提取到故障识别的全程自动化,谱聚类初始化方法提升了NMF收敛效果与分解性能,并提高了诊断精度,滚动轴承诊断实例验证了模型的有效性。(本文来源于《仪器仪表学报》期刊2013年12期)

殷君伟,陈建明,薛百里,张健[10](2013)在《一种基于排序划分的聚类初始化方法》一文中研究指出k-means聚类算法,是在d维空间Rd里把n个数据对象划分为K个类,其划分原则是计算每个数据对象与K个聚类中心的距离并将其分配到最近的一个类.传统直接k-means算法是随机选取初始中心的,不同的初始中心会产生不同的聚类结果,针对这个不足,提出了一种基于排序划分的聚类初始化方法,该方法简单易于实现,将其应用在真实数据集和模拟数据集上,实验表明在处理非高维数据上这是一种简单而有效的方法,在很大程度上提高了聚类精度和效率.(本文来源于《微电子学与计算机》期刊2013年06期)

初始化聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在K-means型多视图聚类算法中,最终的聚类结果会受到初始类中心的影响。因此研究了不同的初始中心选择方法对K-means型多视图聚类算法的影响,并提出一种基于采样的主动式初始中心选择方法(sampledclustering by fast search and find of density peaks,SDPC)。该方法通过对数据集进行均匀采样,利用密度峰值快速搜索聚类算法(clustering by fast search and find of density peaks,DPC),以及K-means再迭代策略,进一步改善多视图聚类中的初始中心选择效率和类个数问题。实验验证了不同初始化方法对K-means型多视图聚类算法的影响。多视图基准数据集上的实验结果表明:全局(核)K-means初始化方法存在时间复杂度过高的问题,AFKMC~2(assumption-free K-Markov chain Monte Carlo)初始化适用于大规模数据,DPC可以主动选择类个数和初始类中心,SDPC较DPC而言,不仅能主动式获得类个数,还在聚类精度和效率上取得了较好的折衷。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

初始化聚类论文参考文献

[1].任云,黎洪松.基于k-means聚类的叁维SOM初始化模式库算法[J].桂林电子科技大学学报.2018

[2].洪敏,贾彩燕,王晓阳.K-means型多视图聚类中的初始化问题研究[J].计算机科学与探索.2019

[3].王思杰,唐雁.改进的分类数据聚类中心初始化方法[J].计算机应用.2018

[4].郭荣传.基于密度函数的FCM聚类中心初始化研究综述[J].科技广场.2016

[5].张鲁营,赵晓凡.一种有效的均值聚类初始化方法[J].智能计算机与应用.2016

[6].胡庆辉,阮晓霞.基于MCD初始化的高斯混合模型聚类[J].桂林航天工业学院学报.2016

[7].吴成茂,何晶.图形模糊聚类算法初始化方式改进[J].西安邮电大学学报.2016

[8].王艳娥.划分式聚类算法的初始化方法研究[D].陕西师范大学.2014

[9].张焱,汤宝平,邓蕾.基于谱聚类初始化非负矩阵分解的机械故障诊断[J].仪器仪表学报.2013

[10].殷君伟,陈建明,薛百里,张健.一种基于排序划分的聚类初始化方法[J].微电子学与计算机.2013

标签:;  ;  ;  ;  

初始化聚类论文-任云,黎洪松
下载Doc文档

猜你喜欢