流聚类论文-叶福兰

流聚类论文-叶福兰

导读:本文包含了流聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:离群点,检测,不确定数据流,聚类

流聚类论文文献综述

叶福兰[1](2019)在《基于离群点检测的不确定数据流聚类算法研究》一文中研究指出应用网络流量、日志管理等数据流过程中,常遭设备精度、噪声等问题影响出现大量不确定性数据流,影响数据流的管理与挖掘。相关研究表明,检测数据流中的离群点能够挖掘网络中被忽视的异常数据。因此,提出基于离群点检测的不确定数据流聚类算法,首先,通过微聚类划分算法将数据集划分成若干个微聚类;然后,根据信息熵的微聚类过滤机制获取全局离群点,在离群点微聚类中使用基于距离的方法挖掘出局部离群点;最后,采用不确定数据流子空间聚类算法完成全局离群点以及局部离群点两种不确定数据流聚类。分析结果表明,在数据量和维度的影响下,采用同类聚类算法聚类时聚类效果较差,而所提算法可有效克服此类问题,且具有较强的伸缩性。(本文来源于《中国电子科学研究院学报》期刊2019年10期)

杨涛,张红梅,王家乐,周卓洁,杜宏[2](2019)在《大数据下数据流聚类挖掘算法的优化分析》一文中研究指出随着IT技术的不断提升和完善,不管是在PC端,还是在移动端,人们借助互联网工具来实现的各种服务,都以数据的形式被记录下来,而这些数据不仅体量庞大、变化迅速,而且还呈现出一定的时序性。传统的数据分析已经不能适应如今庞大的数据流,同时不同的算法,最终所得到的处理结果也是不一样的,此时利用数据流相关的技术得到了重视和大规模的开发应用。鉴于此,文中通过明确数据流的概念和特点,并列举了常用的数据流聚类算法。充分考虑时间权值对数据流聚类的影响,在微簇中心点引入了时间衰减函数,提出F-Stream算法,分别对在线微聚类算法、离线宏聚类算法和数据流全局化缓存结构进行了优化设计。通过和CluStream算法进行时间效率、聚类质量和敏感参数的对比实验,发现F-Stream算法的整体性能更优,具有很好的聚类效果。(本文来源于《物联网技术》期刊2019年08期)

唐中海,徐静[3](2019)在《基于大数据的定性数据流聚类优化模型研究》一文中研究指出探讨了基于大数据的定性数据流聚类优化模型,设计了一个函数作为评价聚类模型有效性的目标函数,同时考虑了聚类模型的确定性和与上一个聚类模型的连续性.根据概念漂移的检测指标,提出了一种综合检测指标和优化模型的定性数据流聚类结构演化趋势的检测方法.通过对几个真实数据集的实验研究,验证了该算法在定性数据流聚类中的有效性,并与现有的数据流聚类算法进行了比较.(本文来源于《西安文理学院学报(自然科学版)》期刊2019年04期)

张东月,周丽华,吴湘云,赵丽红[4](2019)在《基于网格耦合的数据流聚类》一文中研究指出随着越来越多的应用程序产生数据流,数据流聚类分析的研究受到了广泛关注.基于网格的聚类通过将数据流映射到网格结构中形成数据概要,进而对概要进行聚类.这种方法通常具有较高的效率,但是每个网格独立处理,没有考虑网格之间的相互影响,因此聚类质量有待提高.在聚类过程中不再独立处理网格,而是考虑了网格之间的耦合关系,提出了一种基于网格耦合的数据流聚类算法.网格的耦合更加准确地表达了数据之间的相关性,从而提高了聚类的质量.在合成和真实数据流上的实验结果表明,所提算法具有较高的聚类质量和效率.(本文来源于《软件学报》期刊2019年03期)

王全[5](2018)在《基于改进KMC算法的叁相交通流聚类研究》一文中研究指出针对城市快速路交通流的运行特性,利用K均值聚类算法研究了交通流的叁相特性。对KMC算法进行改进,避免聚类计算陷入局部最优并获得较好的初始聚类中心。以信息熵及其跃迁值为判定准则,确定了交通流时间序列聚类分析的最优聚类数目。通过对上下游关联路段的交通流时间序列进行聚类,发现不同路段聚类结果存在的共同点和差异,并利用自信息量完成对分类结果的可靠性分析。文中对交通流时间序列聚类分析进行研究,从数据角度提出了确定叁相交通流边界的可靠方法,为交通流运行状态判别和预测提供理论和方法支持。(本文来源于《物联网技术》期刊2018年10期)

韦洁华,韦春妙[6](2018)在《基于微簇的两阶段高维数据流聚类算法》一文中研究指出提出了一种基于微簇的两阶段高维数据流聚类算法.首先,对新到达的数据进行降维处理,使用改进的线性判别分析方法获得一个局部投影子空间;然后,在子空间内最大化流入数据近邻微簇之间的距离;最终,将流入数据划分到投影空间的微簇中.基于高维数据流的实验结果显示,本算法的分类性能优于其他的数据流聚类算法,并且具有较低的计算复杂度.(本文来源于《西南师范大学学报(自然科学版)》期刊2018年07期)

杨姣,高仲合,王来花,韦锦涛[7](2018)在《数据流聚类挖掘算法优化研究》一文中研究指出在大数据时代,概念漂移检测技术用于解决数据流的动态性问题,还存在不足之处.为此,该文基于概念漂移检测算法对大数据下数据流聚类挖掘算法进行优化,提出了改进的FKNN模型算法,解决了算法中的需要专家及运算效率比较低下以及采样密度必须足够大或者说维度比较低的难题.(本文来源于《曲阜师范大学学报(自然科学版)》期刊2018年03期)

孙梦冉[8](2018)在《基于核方法的流聚类演化算法研究》一文中研究指出流数据分析作为数据挖掘领域研究的重点课题之一,采用的技术主要有分类、频繁项挖掘、聚类、估计、预测、相关性分组和关联规则等,其中流聚类领域经典算法CluStream中的在线-离线处理框架能够在线分析流数据信息,并根据用户的需求离线聚类,输出相应时段的数据信息,但算法对高维数据的划分效率较低,基于此,提出一种基于核方法的流聚类演化算法。首先,针对流数据维数多样,难以在原始空间下线性划分的问题,引入核方法,通过非线性映射规则,将数据映射到高维特征空间的核矩阵中,从而对其进行有效的线性划分,同时避免了数据处理当中的维数灾难问题。然而由于流数据的无限性,核矩阵的构造会导致计算量大和内存占用大的问题,本文采用基于统计杠杆分数的差异性采样法,在线得到与整个流数据中的数据分布相似的样本集,来构造样本核矩阵,该方法在缓解内存压力、降低算法时间复杂度方面具有良好的效果,同时具备实时处理的性能。然后,通过对样本核矩阵中的数据进行循环聚类,得到流数据中的概要数据模型,用来对新数据进行划分。最后,针对流数据演化过程的更新,本文算法受以往流聚类算法中引入时间衰减因子的启发,利用时间衰减函数的原理构造衰退聚类机制,实时更新和划分数据来反映流数据的演化过程。通过随机数据集和UCI数据集上的实验表明,本文算法具有良好的聚类性能,同时对不同维度数据集的聚类性能具有较好的稳定性。(本文来源于《辽宁工程技术大学》期刊2018-06-04)

张军,刘文杰[9](2018)在《一种新的数据流聚类融合算法研究》一文中研究指出提出一种新的选择性聚类融合算法,该算法主要基于分形维数来处理一些高维数据,选择策略则是主要基于互信息,考虑到已选聚类成员的重要程度与聚类成员的质量和多样性,此算法比较适用的数据聚集类为任意形状的,聚类融合可通过加权定义实现。仿真实验中在UCI数据集环境运用本文提出的选择性聚类融合算法,实验结果表明该算法具有良好的有效性。(本文来源于《科技通报》期刊2018年05期)

付家祺,陈坚,淳浩,年青[10](2018)在《一种基于密度和约束的数据流聚类算法》一文中研究指出文章在传统聚类算法的基础上,提出了一种基于密度和约束的数据流聚类算法——C-DBDStream(Constraint and Density Based Clustering of Data Stream)。该算法使用数据流聚类在线和离线两阶段框架。在线聚类阶段使用衰减窗口模型,对数据流中的数据对象进行初步的聚类,应用约束条件生成微簇,并将实例级的约束扩展到了微簇级,并将结果以快照的形式保存下来为下一阶段做准备;离线聚类阶段则利用微簇级约束规则聚类,采用DBSCAN算法中的密度可达寻找密度连通区域以产生最终结果。经实验证明,与Clu Stream算法的对比中,C-DBDStream算法提高了聚类效果。(本文来源于《科技创新与应用》期刊2018年12期)

流聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着IT技术的不断提升和完善,不管是在PC端,还是在移动端,人们借助互联网工具来实现的各种服务,都以数据的形式被记录下来,而这些数据不仅体量庞大、变化迅速,而且还呈现出一定的时序性。传统的数据分析已经不能适应如今庞大的数据流,同时不同的算法,最终所得到的处理结果也是不一样的,此时利用数据流相关的技术得到了重视和大规模的开发应用。鉴于此,文中通过明确数据流的概念和特点,并列举了常用的数据流聚类算法。充分考虑时间权值对数据流聚类的影响,在微簇中心点引入了时间衰减函数,提出F-Stream算法,分别对在线微聚类算法、离线宏聚类算法和数据流全局化缓存结构进行了优化设计。通过和CluStream算法进行时间效率、聚类质量和敏感参数的对比实验,发现F-Stream算法的整体性能更优,具有很好的聚类效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

流聚类论文参考文献

[1].叶福兰.基于离群点检测的不确定数据流聚类算法研究[J].中国电子科学研究院学报.2019

[2].杨涛,张红梅,王家乐,周卓洁,杜宏.大数据下数据流聚类挖掘算法的优化分析[J].物联网技术.2019

[3].唐中海,徐静.基于大数据的定性数据流聚类优化模型研究[J].西安文理学院学报(自然科学版).2019

[4].张东月,周丽华,吴湘云,赵丽红.基于网格耦合的数据流聚类[J].软件学报.2019

[5].王全.基于改进KMC算法的叁相交通流聚类研究[J].物联网技术.2018

[6].韦洁华,韦春妙.基于微簇的两阶段高维数据流聚类算法[J].西南师范大学学报(自然科学版).2018

[7].杨姣,高仲合,王来花,韦锦涛.数据流聚类挖掘算法优化研究[J].曲阜师范大学学报(自然科学版).2018

[8].孙梦冉.基于核方法的流聚类演化算法研究[D].辽宁工程技术大学.2018

[9].张军,刘文杰.一种新的数据流聚类融合算法研究[J].科技通报.2018

[10].付家祺,陈坚,淳浩,年青.一种基于密度和约束的数据流聚类算法[J].科技创新与应用.2018

标签:;  ;  ;  ;  

流聚类论文-叶福兰
下载Doc文档

猜你喜欢