导读:本文包含了聚类中心初始化论文开题报告文献综述及选题提纲参考文献,主要关键词:模糊K-modes算法,距离,密度,初始聚类中心
聚类中心初始化论文文献综述
王思杰,唐雁[1](2018)在《改进的分类数据聚类中心初始化方法》一文中研究指出模糊K-modes算法是一种有效的针对分类数据的聚类方法,但算法性能非常依赖于初始中心的选择。针对模糊聚类算法对初始中心敏感这一问题,提出一种改进的基于距离和离群点检测的初始中心选择的方法。首先,通过增大初始中心选择过程中距离所占的比重,使所选择的初始中心点更具有分布性;然后,运用基于距离的离群点检测技术对初始中心点进行进一步筛选,避免离群点成为初始中心。对比实验结果表明,改进方法提高了分类数据初始中心选择的成功率,并具有较高的准确率。(本文来源于《计算机应用》期刊2018年S1期)
郭荣传[2](2016)在《基于密度函数的FCM聚类中心初始化研究综述》一文中研究指出模糊C均值(FCM)聚类算法能很好地解决不确定问题的分类,但该算法聚类结果却过于依赖初始聚类中心和易陷入局部最优解。本文重点针对基于密度函数的初始聚类中心初始化算法进行分类总结,将密度函数的度量方式归纳为4大类。通过实验对比分析了各种度量方式的优缺点,旨在为研究人员选择适合的密度函数度量方法提供一定的参考。(本文来源于《科技广场》期刊2016年06期)
张世博,周义明[3](2011)在《一种优化初始化中心的k均值web信息聚类算法》一文中研究指出k-means算法是一种重要的聚类算法,在网络信息处理领域有着广泛的应用。由于k-means算法终止于一个局部最优状态,所以初始类中心点的选择会在很大程度上影响其聚类效果。针对k-means算法所存在的问题,构造了文本集合的相似度矩阵,基于平均相似度集合通过排序迭代优选出了初始中心点。实验表明此算法可以有效减少迭代次数并提高聚类精度,最终获得较好的聚类效果。(本文来源于《北京石油化工学院学报》期刊2011年04期)
刘金岭,冯万利,张亚红[4](2011)在《初始化簇类中心和重构标度函数的文本聚类》一文中研究指出根据文本集的中心和初始簇的中心,选择一组具有良好区分度的方向构建IMIC坐标系,在该坐标系下构造出各坐标轴的重新标度函数用于提高聚类决策的有效性。算法IMIC经过多次迭代,收敛到最终解。IMIC算法的时间复杂度与K-means保持在同一量级上。实验结果表明,IMIC算法有较好的聚类质量。(本文来源于《计算机应用研究》期刊2011年11期)
熊忠阳,陈若田,张玉芳[5](2011)在《一种有效的K-means聚类中心初始化方法》一文中研究指出传统K-means算法由于随机选取初始聚类中心,使得聚类结果波动性大;已有的最大最小距离法选取初始聚类中心过于稠密,容易造成聚类冲突现象。针对以上问题,对最大最小距离法进行了改进,提出了最大距离积法。该方法在基于密度概念的基础上,选取到所有已初始化聚类中心距离乘积最大的高密度点作为当前聚类中心。理论分析与对比实验结果表明,此方法相对于传统K-means算法和最大最小距离法有更快的收敛速度、更高的准确率和更强的稳定性。(本文来源于《计算机应用研究》期刊2011年11期)
禹贵辉,潘志斌,乔瑞萍,邹彬[6](2011)在《基于数据分布特性的聚类中心初始化方法》一文中研究指出文中提出了一种新的基于数据局部和全局分布特性的K-Means初始化方法.算法通过对数据空间进行网格化后统计每个网格中数据点数目,选取具有数目局部最大值的网格,再利用距离优化方法全局的估算出K个初始聚类中心.在人工和真实数据集上,进行了与传统的聚类中心初始化算法的比较.实验结果表明,该算法利用局部最大值网格和距离优化的方法估算的聚类中心能够在保持及改善聚类效果的同时,明显减少迭代次数,提高收敛速度.(本文来源于《微电子学与计算机》期刊2011年11期)
李春生,王耀南[7](2010)在《聚类中心初始化的新方法》一文中研究指出k-均值聚类算法易受初始聚类中心的影响而陷入局部最优解.现有聚类中心初始化方法尚未得到广泛认可.本文依据每个类内至少有一个数据稠密区,且处于不同类的数据稠密区比处于同一类的数据稠密区相距更远的假设,在数据集合上构造一棵最小支撑树,应用根树原理在其上搜索数据稠密区并估计其密度,从中选出密度大且足够分离的数据稠密区,以其内的点作为初始聚类中心,得到了一个聚类中心初始化的新方法.将此方法与现有的方法进行比较,仿真实验表明,本文方法性能更优越.(本文来源于《控制理论与应用》期刊2010年10期)
刘金岭,王朝,谢少峰[8](2010)在《基于聚类中心初始化的文本分类高效算法》一文中研究指出将前期工作进行了改进并将训练集各簇中语义相似度大的文档进行合并,减少了训练集容量,实验表明该算法大大提高了KNN算法的效率。(本文来源于《软件导刊》期刊2010年04期)
吴继兵,李心科[9](2009)在《基于K-最近邻居图划分的聚类中心初始化算法》一文中研究指出传统的k-means算法随机选择初始聚类中心,而初始聚类中心的选择对最终的聚类结果有着直接的影响,因此算法不能保证得到一个唯一的聚类结果。为消除这种影响,提出了一种基于K-最近邻居图的划分来选择初始聚类中心算法。实验表明,本文算法能够有效减少K—means算法的迭代次数,提升聚类精度。(本文来源于《全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)》期刊2009-07-17)
牛琨,张舒博,陈俊亮[10](2007)在《融合网格密度的聚类中心初始化方案》一文中研究指出提出了一种采用密度指针的聚类中心初始化方法——density pointer(DP)算法.DP算法以网格单元的几何中心为对称中心,连接该中心与网格单元各顶点,以此对称分割传统的类矩形网格单元,形成超叁角形子空间;进而根据各个超叁角形子空间与邻居单元相邻的超叁角形子空间的密度差异确定密度指针的方向,并根据密度指针计算出每个密集网格单元的聚集因子;最后将具有较大局部聚集因子的网格单元族的重心作为初始聚类中心.在公开数据集和人工数据集上的实验结果表明,DP算法能快速高效地找到接近于真实聚类中心的数据点作为初始聚类中心.针对算法的效率实验表明,DP算法的时间开销与数据集实例数、维度以及网格单元数量均呈一阶线性关系.(本文来源于《北京邮电大学学报》期刊2007年02期)
聚类中心初始化论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
模糊C均值(FCM)聚类算法能很好地解决不确定问题的分类,但该算法聚类结果却过于依赖初始聚类中心和易陷入局部最优解。本文重点针对基于密度函数的初始聚类中心初始化算法进行分类总结,将密度函数的度量方式归纳为4大类。通过实验对比分析了各种度量方式的优缺点,旨在为研究人员选择适合的密度函数度量方法提供一定的参考。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
聚类中心初始化论文参考文献
[1].王思杰,唐雁.改进的分类数据聚类中心初始化方法[J].计算机应用.2018
[2].郭荣传.基于密度函数的FCM聚类中心初始化研究综述[J].科技广场.2016
[3].张世博,周义明.一种优化初始化中心的k均值web信息聚类算法[J].北京石油化工学院学报.2011
[4].刘金岭,冯万利,张亚红.初始化簇类中心和重构标度函数的文本聚类[J].计算机应用研究.2011
[5].熊忠阳,陈若田,张玉芳.一种有效的K-means聚类中心初始化方法[J].计算机应用研究.2011
[6].禹贵辉,潘志斌,乔瑞萍,邹彬.基于数据分布特性的聚类中心初始化方法[J].微电子学与计算机.2011
[7].李春生,王耀南.聚类中心初始化的新方法[J].控制理论与应用.2010
[8].刘金岭,王朝,谢少峰.基于聚类中心初始化的文本分类高效算法[J].软件导刊.2010
[9].吴继兵,李心科.基于K-最近邻居图划分的聚类中心初始化算法[C].全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册).2009
[10].牛琨,张舒博,陈俊亮.融合网格密度的聚类中心初始化方案[J].北京邮电大学学报.2007
标签:模糊K-modes算法; 距离; 密度; 初始聚类中心;