调和均值聚类论文-武斌,王大智,武小红,贾红雯

调和均值聚类论文-武斌,王大智,武小红,贾红雯

导读:本文包含了调和均值聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:茶叶,红外光谱,主成分分析,K调和均值聚类

调和均值聚类论文文献综述

武斌,王大智,武小红,贾红雯[1](2018)在《茶叶傅里叶红外光谱的可能模糊K调和均值聚类分析》一文中研究指出茶叶的品种不同,其有机化学成分含量往往不同,其功效也是不尽相同的,因此,研究出一种简单、高效、识别率高的茶叶品种鉴别技术方法是十分有必要的。中红外光谱技术是一种快速检测技术,在用中红外光谱仪采集得到的茶叶中红外光谱中含有噪声信号。为了对含噪声茶叶中红外光谱的准确分类以实现茶叶品种分类,将可能模糊C-均值聚类(PFCM)思想应用到K调和均值(KHM)聚类,设计出一种可能模糊K调和均值(PFKHM)聚类算法,计算出PFKHM的模糊隶属度、典型值和聚类中心。可能模糊K调和均值聚类能有效解决K调和均值聚类的噪声敏感性问题。用傅里叶红外光谱分析仪(FTIR-7600型)分别对叁种茶叶(优质乐山竹叶青、劣质乐山竹叶青和峨眉山毛峰)进行扫描以获取它们的傅里叶中红外光谱。光谱波数区间是4 001.569~401.121 1cm~(-1)。先采用主成分分析法(PCA)将光谱数据压缩到20维,再采用线性判别分析(LDA)将光谱数据压缩到两维并提取鉴别特征信息。最后分别用K调和均值聚类和可能模糊K调和均值聚类实现茶叶品种分类。实验结果:当权重指数m=2,q=2和p=2时,KHM具有91.67%的聚类准确率,PFKHM聚类准确率达到94.44%;KHM迭代12次达到收敛,而PFKHM迭代11次就可以达到收敛。采用傅里叶红外光谱技术检测茶叶,用主成分分析和线性判别分析压缩光谱数据,再用可能模糊K调和均值聚类进行品种分类可快速、准确地实现茶叶品种的鉴别。(本文来源于《光谱学与光谱分析》期刊2018年03期)

余亮[2](2017)在《PSO和K-调和均值的优化与混合聚类》一文中研究指出随着大数据时代的到来,人们对处理海量、异构的高维数据提出了更高的要求,研究人员希望能够更加智能地快速地挖掘出有用的知识。其中聚类分析是一种重要的数据挖掘手段,研究并优化聚类分析算法,提高聚类算法的聚类效果,具有较高的实用价值。本文主要研究智能算法和聚类算法的混合聚类,提出了改进粒子群优化算法(Improved Particle Swarm Optimization,IPSO),并对K-调和均值聚类算法(K-harmonic means,KHM)进行参数优化,在此基础上研究算法的混合方式并提出了混合聚类算法IPSO-KHM。具体研究工作可以分为下面几个部分:第一,详细分析了聚类算法KHM的原理和参数设置,为解决高维数据场景下聚类效果较差的问题,对其参数设置进行了探讨和优化。第二,深入分析智能算法,重点分析PSO算法的局部收敛的粒子形态,得到陷入局部最优的粒子呈高斯分布,引入GA算法的变异概念提高粒子跳出局部最优的能力,结合粒子空间密度判断方法,提出与粒子的搜索效率相关的变异策略,生成IPSO算法,以优化其全局搜索能力。第叁,为提高聚类效果、收敛速度、分类精度等性能,提出混合算法IPSO-KHM并设计了算法流程。第四,使用标准UCI数据集,对IPSO-KHM进行实证分析,验证了算法的可行性与有效性。本文成果具有较好的综合性能,在聚类效果、收敛速度、分类精度等性能优于其它算法。(本文来源于《南昌大学》期刊2017-05-20)

武小红,潘明辉,武斌,嵇港,孙俊[3](2016)在《广义模糊K调和均值聚类的近红外光谱生菜储藏时间鉴别》一文中研究指出生菜的储藏时间是影响生菜新鲜程度的重要因素。为了快速、无损和有效地鉴别生菜的储藏时间,以欧式距离的p次方代替模糊K调和均值聚类(FKHM)中欧式距离的平方提出了一种广义模糊K调和均值聚类(GFKHM)算法并将该算法应用于鉴别生菜的储藏时间。以60个新鲜生菜样本为研究对象,采用AntarisⅡ近红外光谱分析仪每隔12h检测生菜的近红外漫反射光谱,共检测叁次,光谱扫描的波数范围为10 000~4 000cm~(-1)。首先用主成分分析(PCA)对1 557维的生菜近红外光谱进行降维处理以减少冗余信息,取前20个主成分,经过PCA处理后得到20维的数据。然后用线性判别分析(LDA)提取光谱数据的鉴别信息以提高聚类的准确率,取鉴别向量数为2,则LDA将20维的数据转换为2维数据。最后以模糊C-均值聚类(FCM)的类中心作为FKHM和GFKHM的初始聚类中心,分别运行FKHM和GFKHM计算模糊隶属度以实现生菜储藏时间的鉴别。结果表明,GFKHM的鉴别准确率能达到92.5%,FKHM的鉴别准确率为90.0%,GFKHM具有比FKHM更高的鉴别准确率。GFKHM的聚类中心比FKHM更逼近真实类中心。GFKHM的收敛速度明显快于FKHM。采用近红外光谱技术同时结合GFKHM,PCA和LDA为快速和无损地鉴别生菜储藏时间提供了一种新的方法。(本文来源于《光谱学与光谱分析》期刊2016年06期)

陈改霞,王建平[4](2016)在《基于候选聚类的K调和均值算法(KHM-CC)》一文中研究指出聚类分析是常见的数据分析技术。基于KHM的聚类分析是当前研究的热点。提出了基于候选聚类的KHM算法(KHM-CC),详细阐述了算法的设计过程。采用UCI的小样本(iris)数据集和大样本(Bag of Words)数据集对比了KHM-CC算法和禁忌搜索KHM算法(KHM-TS)和变邻域搜索KHM算法(KHM-VNS)的性能。实验结果表明,KHM-CC算法在处理iris数据集小样本数据集时,其性能和KHM-VNS算法基本接近,而优于KHM-TS算法。但是在处理Bag of Words大样本数据集时,性能优于KHM-VNS和KHM-TS算法,其聚类计算耗时明显缩短,证实KHM-CC算法在高维度数据集的处理上更具优势。(本文来源于《火力与指挥控制》期刊2016年01期)

朱书伟,周治平,张道文[5](2015)在《融合并行混沌萤火虫算法的K-调和均值聚类》一文中研究指出针对K-调和均值算法易陷于局部最优的缺点,提出一种基于改进萤火虫算法(firefly algorithm,FA)的K-调和均值聚类算法。将基于FA的粗搜索与基于并行混沌优化FA的精细搜索相结合,其中精细搜索部分首先通过FA搜索到当前最优解及次优解,然后通过改进的logistic映射与并行混沌优化策略产生混沌序列在其附近直接搜索,以增强算法的寻优性能。最终,将这种改进的FA用于K-调和均值算法聚类中心的优化。实验结果表明:该算法不但对几种测试函数具有更高的搜索精度,而且对6种数据集的聚类结果均有一定的改善,有效地抑制了K-调和均值算法陷于局部最优的问题,提高了聚类准确性和稳定性。(本文来源于《智能系统学报》期刊2015年06期)

王彩霞[6](2016)在《基于改进引力搜索的混合K-调和均值聚类算法研究》一文中研究指出为了解决聚类算法容易陷入局部最优的问题,以及增强聚类算法的全局搜索能力,基于KHM算法以及改进的引力搜索算法,提出一种混合K-调和均值聚类算法(G-KHM)。G-KHM算法具有KHM算法收敛速度快的优点,但同时针对KHM算法容易陷入局部最优解的问题,在初始化后数据开始搜索聚类中心时采用了一种基于对象多样性及收敛性增强的引力搜索算法,该方法改进了引力搜索算法容易失去种群多样性的缺点,并同时具有引力搜索算法较强的全局搜索能力,可以使算法收敛到全局最优解。仿真结果表明,G-KHM算法能有效地避免陷入局部极值,具有较强的全局搜索能力以及稳定性,并且相比KHM算法、K-means聚类算法、C均值聚类算法以及粒子群算法,在分类精度和运行时间上表现出了更好的效果。(本文来源于《计算机应用研究》期刊2016年01期)

刘伟[7](2014)在《K调和均值聚类分析原理及应用》一文中研究指出在现代社会中,随着计算机技术的不断发展,收集数据变得越来越方便。数据储存技术也在不断的提高,并且容量也愈来愈大。这样,数据的搜集与储存有了很大的发展,可是如何有效的对这些明显含有重要信息的数据进行处理,将其中有用的信息提取出来成为了现代课题研究的一大热点。在研究过程中,人们将统计、计算机技术和数据库技术结合在一起,发明一种称为数据挖据的技术。数据挖据技术涉及到许多领域的集合,如:人工智能、统计学、信息检索、数据库管理等。聚类分析是数据挖掘中重要的技术之一,被用来对未知的分类数据进行分析。其重要性愈来愈被人们肯定。现在社会在金融、医学、基因学这些学科内产生了大量维度很大的数据。许多在低维时有很好效能的聚类方法,在碰到维度非常高的数据时,往往得到的结果不是太好。在高维数据的聚类研究中,有一类聚类算法由于其具有快速性和简单性的特点已经被广泛的应用在许多领域,包括K均值聚类算法(K-means,KM)、模糊聚类算法(FCM)和K调和均值聚类算法(KHM)。其中,K调和均值聚类算法对初始值不敏感。本课题首先对聚类分析的算法、原理、准则函数以及聚类分析现在所面临的问题进行了介绍。针对聚类算法对初始值敏感的问题,本文对K-均值算法,FCM算法,KHM算法进行分析。从数理角度得出KHM算法对初始值不敏感。然后进行实例分析。以在遗传学调控开关研究中的一个经典例子酵母半乳糖通路(GAL)数据集为研究对象,分别取每一类别中每一属性的最大值,1/3大值,真实聚类中心,1/3小值,最小值为聚类中心,总共五组聚类中心用R软件进行K-means聚类分析。计算出其聚类结果,结果显示:最大值、最小值为聚类中心的组无法进行聚类,表明其对初始值敏感。本文采用Fortron语言实现K调和均值(KHM)的聚类分析,在聚类的结果显示,这种方法对初始值的选择是不敏感。对叁种聚类方法在不同数据集中的聚类效果进行评价,采用癌症基因的十个数据集,分别进行K-means、FCM、KHM聚类分析,结果显示:在十个癌症基因的数据集中,其中第一号、五号、六号、七号、九号和十号,KHM算法获得了最小的错误率和最大的F度量,获得最好的综合评价,而仅有二号和叁号,K-均值算法获得最好的综合评价,四号和八号位FCM算法获得最好的综合评价。对鸢尾花的数据进行分析,发现KHM是叁种方法中,错误最少的方法。综上所述,KHM算法在这叁种方法的对比中获得了较好的准确度,在不同类型的数据集中有较好的稳健性。(本文来源于《山西医科大学》期刊2014-05-01)

李家成[8](2013)在《基于量子遗传算法的K调和均值聚类算法的研究》一文中研究指出数据挖掘是近年来在信息决策领域较为活跃的热点课题。在数据挖掘的众多技术中,聚类分析尤为重要,它把数据对象分为若干类,让同一类中对象的相似性尽可能大,不同类间对象的相似性尽可能小,K调和均值聚类算法(KHM)是一种类似于k-means的聚类算法,属于划分聚类,该算法用数据点与所有聚类中心的距离的调和平均值替代了K-means算法中数据点与聚类中心的最小距离,成功地解决了K-means算法对初值敏感的问题。KHM实现简单,对初值不敏感,收敛速度快,但容易陷入局部最优值。遗传算法是一种高效的全局搜索方法,具有较强的鲁棒性和全局寻优能力。本文先将遗传算法跟K调和均值聚类算法相结合,互相取长补短,提出了一种新的算法:基于遗传算法的K调和均值聚类算法(GAKHM)。并通过实验验证了GAKHM具有较好的聚类效果。然后,针对GAKHM具有执行效率低,时间复杂度大等缺点,本文在GAKHM的基础上,引入量子算法,从而提出了基于量子遗传算法的K调和均值聚类算法(QGAKHM)。实验结果表明QGAKHM是一种执行效率高,聚类效果好的算法。本文的主要工作如下:首先,介绍了本文所需要的基础知识,主要有聚类分析,遗传算法和量子遗传算法相关知识。对它们的基本原理,优缺点进行了详细的分析。其次,针对遗传算法和K调和均值聚类算法的优缺点,提出了一种新算法:GAKHM。并从适应度函数的构造,染色体编码,选择算子,交叉算子,变异算子和K调和均值聚类算法的操作等方面对GAKHM进行详细的描述。实验结果表明GAKHM算法能够优化聚类中心,具有较好的聚类效果。最后,在GAKHM算法的基础上,引进量子算法,提出了QGAKHM。并详细介绍了K调和均值聚类算法,量子染色体编码,量子旋转门,适应度函数构造,量子变异,量子交叉等操作。最后通过实验验证了(QGAKHM算法的有效性及可行性。(本文来源于《广西大学》期刊2013-06-01)

李家成,苏一丹,覃华,吴丹[9](2013)在《基于遗传算法的K调和均值聚类算法》一文中研究指出K调和均值算法(KHM)用数据点与所有聚类中心的距离的调和平均值替代了数据点与聚类中心的最小距离,是一种对初始值不敏感、收敛速度快的有效聚类算法,但它容易陷入局部最小值。而遗传算法具有良好的全局优化能力。文中结合了KHM和遗传算法各自的优点,采用KHM计算每一代种群的聚类中心,并构造适应度函数,通过遗传算法进行一系列择优操作,成功地解决了KHM容易陷入局部最小值的问题。实验结果表明,所提出的算法不仅优化了聚类中心,而且还改善了聚类质量。(本文来源于《计算机技术与发展》期刊2013年09期)

都兴朔[10](2012)在《结合人工蜂群算法的调和K均值聚类算法的研究》一文中研究指出数据挖掘是从随机的,大量不完整的,有干扰信息的数据存储中挖掘潜在的有价值信息的过程。聚类分析是一种不需要先验知识的无监督学习过程,作为数据挖掘一项比较常用的技术手段,它被广泛的应用于模式识别、图像处理、数据压缩等领域。根据事物之间存在的内在联系,把一组事物按照相似性归成若干类,使得不同类别之间的对象存在高度相异,而同一类中的对象则具有很高的相似度。随着信息技术的日益发达,数据挖掘所面临着越来越多的难题。K-means算法是一个典型的聚类方法,由于其简单,高效,因而被广泛使用。但该算法对于初始中心点的选择十分依赖,很容易陷入局部最优的结果和并产生其他问题。1999年有学者提出调和K均值聚类(KHM)算法,虽然它减少了K-means算法对初始中心点选择的依赖,不过此算法还是会陷入局部极小解,并且聚类的个数需要预先给定。人工蜂群算法(ABC)是一种基于群智能的全局优化算法,具有全局寻优的能力,经修改可应用于聚类问题。本文提出一种结合ABC聚类算法与KHM聚类算法的新的聚类算法ABCKHM。利用ABC算法的全局寻优能力,克服KHM可能陷入局部最优的问题。新算法利用人工蜂群聚类算法的结果作为KHM的初始中心点,以此优化聚类结果。在ABC聚类算法中,为每个食物源(中心点)新定义了目标函数以引导搜索过程。实验表明,新算法有效的解决了KHM算法容易陷入局部最优的问题,获得了比原算法更好的聚类结果。(本文来源于《东北师范大学》期刊2012-05-01)

调和均值聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着大数据时代的到来,人们对处理海量、异构的高维数据提出了更高的要求,研究人员希望能够更加智能地快速地挖掘出有用的知识。其中聚类分析是一种重要的数据挖掘手段,研究并优化聚类分析算法,提高聚类算法的聚类效果,具有较高的实用价值。本文主要研究智能算法和聚类算法的混合聚类,提出了改进粒子群优化算法(Improved Particle Swarm Optimization,IPSO),并对K-调和均值聚类算法(K-harmonic means,KHM)进行参数优化,在此基础上研究算法的混合方式并提出了混合聚类算法IPSO-KHM。具体研究工作可以分为下面几个部分:第一,详细分析了聚类算法KHM的原理和参数设置,为解决高维数据场景下聚类效果较差的问题,对其参数设置进行了探讨和优化。第二,深入分析智能算法,重点分析PSO算法的局部收敛的粒子形态,得到陷入局部最优的粒子呈高斯分布,引入GA算法的变异概念提高粒子跳出局部最优的能力,结合粒子空间密度判断方法,提出与粒子的搜索效率相关的变异策略,生成IPSO算法,以优化其全局搜索能力。第叁,为提高聚类效果、收敛速度、分类精度等性能,提出混合算法IPSO-KHM并设计了算法流程。第四,使用标准UCI数据集,对IPSO-KHM进行实证分析,验证了算法的可行性与有效性。本文成果具有较好的综合性能,在聚类效果、收敛速度、分类精度等性能优于其它算法。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

调和均值聚类论文参考文献

[1].武斌,王大智,武小红,贾红雯.茶叶傅里叶红外光谱的可能模糊K调和均值聚类分析[J].光谱学与光谱分析.2018

[2].余亮.PSO和K-调和均值的优化与混合聚类[D].南昌大学.2017

[3].武小红,潘明辉,武斌,嵇港,孙俊.广义模糊K调和均值聚类的近红外光谱生菜储藏时间鉴别[J].光谱学与光谱分析.2016

[4].陈改霞,王建平.基于候选聚类的K调和均值算法(KHM-CC)[J].火力与指挥控制.2016

[5].朱书伟,周治平,张道文.融合并行混沌萤火虫算法的K-调和均值聚类[J].智能系统学报.2015

[6].王彩霞.基于改进引力搜索的混合K-调和均值聚类算法研究[J].计算机应用研究.2016

[7].刘伟.K调和均值聚类分析原理及应用[D].山西医科大学.2014

[8].李家成.基于量子遗传算法的K调和均值聚类算法的研究[D].广西大学.2013

[9].李家成,苏一丹,覃华,吴丹.基于遗传算法的K调和均值聚类算法[J].计算机技术与发展.2013

[10].都兴朔.结合人工蜂群算法的调和K均值聚类算法的研究[D].东北师范大学.2012

标签:;  ;  ;  ;  

调和均值聚类论文-武斌,王大智,武小红,贾红雯
下载Doc文档

猜你喜欢