导读:本文包含了改进的最近邻聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:海量数据,聚类,MapReduce框架,最近邻优先吸收聚类算法
改进的最近邻聚类论文文献综述
宁可,孙同晶,徐洁洁[1](2018)在《面向海量数据的改进最近邻优先吸收聚类算法》一文中研究指出针对最近邻优先吸收聚类算法难以应用在海量数据聚类处理上的不足,基于MapReduce提出改进算法。通过引入MapReduce并行框架,利用Canopy粗聚类优化计算过程,并对聚簇交叉部分的处理进行改进。采用3组大小不同的数据集进行实验,结果表明,与K-means算法和最近邻优先吸收聚类算法相比,改进算法在保证聚类质量的基础上具有较快的运行速度,并适用于海量数据的聚类分析。(本文来源于《计算机工程》期刊2018年04期)
朱颖祥[2](2016)在《基于改进自然最近邻聚类的道路网事故热点识别与评估》一文中研究指出驾驶员能从准确的道路网事故热点分析结果中获取事故发生地点、事故发生原因、事故发生时间等道路安全信息,这对于为驾驶员创建一个安全的行车环境是至关重要的。因此,事故热点分析是解决道路安全策略的关键问题,其中包括热点发现,热点评价,热点分析及热点动态预测四个方面。本文提出了一种热点发现算法DTH3N,并提出了基于PCA的热点内特性分析方法。具体内容如下:(1)简述了道路网事故热点识别和评估的基本方式,并详细介绍了作为所提出热点识别算法基础的自然最近邻(3N)概念以及相应的自然最近邻聚类算法(CB3N),同时分析了经典的复合安全性能指数(CSPI)事故热点评估模型的优势和不足,进而详细介绍了应用于事故热点事故成因分析的主成分分析(PCA)。(2)提出了DTH3N的热点识别算法,对其算法思想,聚类过程进行详细描述,并给出算法相应参数的筛选标准。基于数据库STATs19的事故数据在MATLAB上进行一系列实验。实验结果显示,与现有聚类算法相比,本文所提出的DTH3N在对空间簇的分离上表现出很好的性能。(3)基于CSPI值,定义两个事故热点成因因子,并基于PCA构建相应的事故热点成因因子综合权重模型。实验结果表明,本文所提出的事故热点成因分析模型所获取的输出参数可以作为热点评估的补充。(本文来源于《重庆大学》期刊2016-04-01)
刘怡然[3](2014)在《基于改进最近邻聚类的阶段性网损计算与分析》一文中研究指出网损是考核供电企业生产经营与管理水平的一项重要指标。目前,利用潮流方法计算得到的单一时间断面或者典型日下的网损值过于片面,不足以刻画电网长期的运行状况,而对每个断面均进行潮流计算求取阶段性网损又受到采集数据完整度及时间的限制。因此,利用聚类技术分析计算具有长时间多断面大数据特点的阶段性网损,可以有效避免上述问题,是一种行之有效的方法。本文基于聚类技术对阶段性网损的求取方法进行了研究分析,以增强线损对比分析的准确度,为供电企业的线损考核与管理提供更有力的参考意见。本论文的主要内容如下:首先,研究了聚类分析理论,包括聚类的定义、流程以及常用聚类方法。同时针对最近邻聚类法中心点选取不合理、阈值选取不够灵活以及聚类结果不完善等问题提出一种改进的最近邻聚类法。其次,利用迭加原理分析了影响断面网损波动的原因。定义断面特征向量,针对采集缺失情况,采用粗糙集理论的核约减方法对数据采集完整断面的特征向量进行选择以获得核特征向量,之后采用加权的欧氏距离度量断面间的相似度,同时根据量化后的节点注入功率波动与网络参数变化造成的网损增量计算聚类中心的权系数向量。最后,提出利用改进最近邻聚类求取阶段性网损的计算方法,对数据缺失严重的断面,给出采用相关系数与相似度匹配规则进行聚类的处理方法。为了简化计算,在上述方法基础上,提出一种基于融合理论的断面聚类简化方法,通过对负荷曲线以及时间进程的分析,在保留负荷变化特征断面的基础上缩减了参与计算的断面数量而不影响计算精度。通过仿真分析验证所提方法的可行性与正确性。(本文来源于《燕山大学》期刊2014-05-01)
龚元元[4](2014)在《改进K近邻聚类算法在火山岩岩性识别中的应用》一文中研究指出火山岩储层是一种非常规的储层,开发火山岩储层,一项重要的前提的工作就是准确的识别火山岩岩性。但是因为火山岩的非均质性强,结构十分复杂,所以火山岩岩性的类型十分的多样化。火山岩储层开发中的一个难题就是如何提升岩性的准确率。该论文应用数理统计,交会图,自相关分析等方法分析常规测井曲线特征,纹理特征,并且使用灰度共生矩阵图区成像测井图像的纹理特征,使用改进的K近邻聚类算法识别火山岩岩性。(本文来源于《中国石油和化工标准与质量》期刊2014年04期)
李婧[5](2013)在《一种改进的最近邻聚类算法》一文中研究指出传统的最近邻聚类算法一般采用欧式距离的计算准则,当各个分量的分布不一样时,采用欧式距离有着明显的缺点;针对以上问题,采用标准化欧式距离的计算准则,将熵值法引入到算法中,提出了基于熵值法和标准化欧式距离的改进的最近邻聚类算法;熵值法用来修订算法的标准化欧式距离计算公式,以提高算法的聚类精确程度.(本文来源于《重庆工商大学学报(自然科学版)》期刊2013年10期)
何银水,胡兆吉,胡宗梅,谢晓闻[6](2013)在《改进的近邻聚类算法用于水下焊缝图像的识别》一文中研究指出遍历经阈值处理后的焊缝图像,搜索第一个样本数据作为第一个聚类的初始元素。以欧氏距离作为阈值距离T,计算以后搜索到的样本与当前聚类最后一个元素的距离t。如果该距离t<T,则计算其与之前所有聚类的最短距离t',同时记下所在的类c。如果t'<T,则一方面合并当前聚类和聚类c;另一方面用最近邻法对该样本归类;如果t>T,则计算其与所有类的最短距离t'',同时记下所在的类c',如果t''<T,则把该样本归为c'类,否则就开新类。该算法对机器人水下焊接焊缝图像的数据进行分类,可以准确提取V形焊缝数据,有助于自动获取待焊位置的坐标。(本文来源于《电焊机》期刊2013年05期)
李霞,蒋盛益[7](2011)在《改进的共享最近邻聚类算法》一文中研究指出聚类是一种无监督的机器学习方法,其任务是发现数据中的自然簇。共享最近邻聚类算法(SNN)在处理大小不同、形状不同以及密度不同的数据集上具有很好的聚类效果,但该算法还存在以下不足:(1)时间复杂度为O(n2),不适合处理大规模数据集;(2)没有明确给出参数阈值的简单指导性操作方法;(3)只能处理数值型属性数据集。对共享最近邻算法进行改进,使其能够处理混合属性数据集,并给出参数阈值的简单选择方法,改进后算法运行时间与数据集大小成近似线性关系,适用于大规模高维数据集。在真实数据集和人造数据集上的实验结果表明,提出的改进算法是有效可行的。(本文来源于《计算机工程与应用》期刊2011年08期)
李文江,程海英,闫孝姮[8](2011)在《改进的动态最近邻聚类算法在传感器校正中的应用》一文中研究指出针对动态最近邻聚类算法因中心点选取不当以及隐含层节点较少时,逼近效果不理想的问题,提出运用改进的动态最近邻聚类算法构造RBF神经网络(IDARBF神经网络),对传感器输出特性进行校正,有效地克服了原算法存在的问题;实验表明,IDARBF神经网络具有更好的非线性校正能力,运用改进的动态最近邻聚类算法处理后,传感器性能大幅度改善,精度更高,暗伤检测合格率为100%,检测效率128个/min。(本文来源于《计算机测量与控制》期刊2011年01期)
刘根水,张绍德,李娟[9](2008)在《基于改进最近邻聚类的机械手神经网络逆控制》一文中研究指出机械手具有非线性时变、多变量、强耦合的特性,在机械手系统可逆的基础上,设计一种机械手的神经网络逆控制方案。通过神经网络逆辨识建立机械手的神经网络逆模型,把神经网络逆模型作为控制器模型与原机械手串联,构成一个伪线性动态模型,把非线性问题转化为线性问题。其中,辨识器和控制器均采用RBF神经网络结构,网络学习采用具有在线学习功能的最近邻聚类学习算法。仿真结果验证了本方案的有效性和可行性。(本文来源于《安徽工业大学学报(自然科学版)》期刊2008年04期)
刘月清,章勇[10](2005)在《一种改进的动态最近邻聚类算法》一文中研究指出在RBF网络中,网络中心点的确定是影响网络性能的非常重要的因素。在分析现有RBF网络中心点确定方法的基础上,指出了已有的动态最近邻聚类算法的不足,并在此基础上对其作了改进。仿真结果表明,改进算法能够大大提高函数逼近的精确性,并且可用于分批数据的训练。(本文来源于《全国自动化新技术学术交流会会议论文集(一)》期刊2005-11-01)
改进的最近邻聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
驾驶员能从准确的道路网事故热点分析结果中获取事故发生地点、事故发生原因、事故发生时间等道路安全信息,这对于为驾驶员创建一个安全的行车环境是至关重要的。因此,事故热点分析是解决道路安全策略的关键问题,其中包括热点发现,热点评价,热点分析及热点动态预测四个方面。本文提出了一种热点发现算法DTH3N,并提出了基于PCA的热点内特性分析方法。具体内容如下:(1)简述了道路网事故热点识别和评估的基本方式,并详细介绍了作为所提出热点识别算法基础的自然最近邻(3N)概念以及相应的自然最近邻聚类算法(CB3N),同时分析了经典的复合安全性能指数(CSPI)事故热点评估模型的优势和不足,进而详细介绍了应用于事故热点事故成因分析的主成分分析(PCA)。(2)提出了DTH3N的热点识别算法,对其算法思想,聚类过程进行详细描述,并给出算法相应参数的筛选标准。基于数据库STATs19的事故数据在MATLAB上进行一系列实验。实验结果显示,与现有聚类算法相比,本文所提出的DTH3N在对空间簇的分离上表现出很好的性能。(3)基于CSPI值,定义两个事故热点成因因子,并基于PCA构建相应的事故热点成因因子综合权重模型。实验结果表明,本文所提出的事故热点成因分析模型所获取的输出参数可以作为热点评估的补充。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
改进的最近邻聚类论文参考文献
[1].宁可,孙同晶,徐洁洁.面向海量数据的改进最近邻优先吸收聚类算法[J].计算机工程.2018
[2].朱颖祥.基于改进自然最近邻聚类的道路网事故热点识别与评估[D].重庆大学.2016
[3].刘怡然.基于改进最近邻聚类的阶段性网损计算与分析[D].燕山大学.2014
[4].龚元元.改进K近邻聚类算法在火山岩岩性识别中的应用[J].中国石油和化工标准与质量.2014
[5].李婧.一种改进的最近邻聚类算法[J].重庆工商大学学报(自然科学版).2013
[6].何银水,胡兆吉,胡宗梅,谢晓闻.改进的近邻聚类算法用于水下焊缝图像的识别[J].电焊机.2013
[7].李霞,蒋盛益.改进的共享最近邻聚类算法[J].计算机工程与应用.2011
[8].李文江,程海英,闫孝姮.改进的动态最近邻聚类算法在传感器校正中的应用[J].计算机测量与控制.2011
[9].刘根水,张绍德,李娟.基于改进最近邻聚类的机械手神经网络逆控制[J].安徽工业大学学报(自然科学版).2008
[10].刘月清,章勇.一种改进的动态最近邻聚类算法[C].全国自动化新技术学术交流会会议论文集(一).2005
标签:海量数据; 聚类; MapReduce框架; 最近邻优先吸收聚类算法;