聚类结果论文-宋彦坡,陶焰明,彭小奇,陈卓,高东波

聚类结果论文-宋彦坡,陶焰明,彭小奇,陈卓,高东波

导读:本文包含了聚类结果论文开题报告文献综述及选题提纲参考文献,主要关键词:两相流,气泡,聚类,数值模拟

聚类结果论文文献综述

宋彦坡,陶焰明,彭小奇,陈卓,高东波[1](2019)在《基于数值模拟结果聚类的两相流气体形态识别》一文中研究指出气体分布形态对气液两相流中的传热、传质及化学反应均有重要影响,为从数值模拟结果中提取该信息,论文构造了一种阈值自适应的凝聚层次聚类算法,并提出了一种基于此聚类算法的气体形态识别方法。针对数值模拟结果数据量巨大的特点,论文还提出了一种"数据空间软分割-子空间分别处理-结果合并"的处理方法。利用二维、叁维人造数据及实际数值模拟结果对本文方法的测试结果表明:即使在离散网格尺度不均一、部分网格单元有一定扭曲的条件下,论文方法仍可根据数值模拟结果高效地识别气液两相流中的气体的聚集形态(气泡/气泡群);数据空间软分割方法能有效地降低算法的空间复杂度,便于在大数据条件下的实现气体形态识别。(本文来源于《工程热物理学报》期刊2019年10期)

魏振钢,郑东辉,魏兆强[2](2019)在《聚类算法结果的可视化分析方法》一文中研究指出聚类结果的可视化是发现数据规律的有效手段。本文给出的过程法PC(Process Clustergram)通过记录聚类过程中各数据簇的数量变化、拆分和重组的情况,可以显式的看出数据集在聚类过程中数据簇的变化过程以及数据簇之间的数量变化。结果表明,相较于目前的可视化方法,本方法可以发现聚类结果的稳定性与数据集的某个维度的关系,这极大地提高了数据分析的效率。(本文来源于《中国海洋大学学报(自然科学版)》期刊2019年09期)

杨楠,李亚平[3](2019)在《基于Word2Vec模型特征扩展的Web搜索结果聚类性能的改进》一文中研究指出对于用户泛化和模糊的查询,将Web搜索引擎返回的列表内容聚类处理,便于用户有效查找感兴趣的内容。由于返回的列表由称为片段(snippet)的短文本组成,而传统的单词频率-逆文档频率(TF-IDF)特征选择模型不能适用于稀疏的短文本,使得聚类性能下降。一个有效的方法就是通过一个外部的知识库对短文本进行扩展。受到基于神经网络词表示方法的启发,提出了通过词嵌入技术的Word2Vec模型对短文本扩展,即采用Word2Vec模型的TopN个最相似的单词用于对片段(snippet)的扩展,扩展文档使得TF-IDF模型特征选择得到聚类性能的提高。同时考虑到通用性单词造成的噪声引入,对扩展文档的TF-IDF矩阵进行了词频权重修正。实验在两个公开数据集ODP239和SearchSnippets上完成,将所提方法和纯snippet无扩展的方法、基于Wordnet的特征扩展方法和基于Wikipedia的特征扩展方法进行了对比。实验结果表明,所提方法在聚类性能方面优于对比方法。(本文来源于《计算机应用》期刊2019年06期)

俞立平[4](2018)在《基于聚类分析的期刊多属性评价方法选择研究——聚类结果一致度筛选法》一文中研究指出[目的 /意义]解决学术期刊多属性评价方法众多、评价结果不一致问题。[方法 /过程]提出一种基于聚类分析的多属性评价方法选取方法——聚类结果一致度筛选法。其原理是首先对原始评价指标进行聚类,然后采用可行的多属性评价方法进行评价并对评价结果进行二次聚类,最后根据评价结果聚类与原始指标聚类结果一致度的高低来选择评价方法,优先选取聚类结果一致度最高的评价方法。本文基于JCR2015数学期刊,选取11个指标,分别采用加权线性汇总、TOPSIS、VIKOR、主成分分析、调和平均进行评价,然后基于聚类结果一致度进行评价方法选取,发现调和平均的聚类一致度最高。[结果 /结论]可以采用该方法对多属性评价方法进行选择;聚类种类设置对结果影响较小;该方法具有较高的稳健性。(本文来源于《图书情报工作》期刊2018年21期)

蒋宗礼,赵思露[5](2018)在《主题模型在检索结果聚类中的应用》一文中研究指出检索结果聚类能够有效帮助提高获取信息的效率和质量。针对传统文本聚类模型存在数据维数过高、缺乏语义理解等问题,提出一种面向检索结果聚类的融合共现分析主题建模算法。基于改进的LDA模型,对得到的"文档-主题"概率分布进行聚类分析,采用K-means算法完成聚类过程,最后提出根据聚类中心提取主题词作为类簇标签。实验结果表明,改进的LDA算法在检索结果聚类应用上不仅获得了很好的聚类效果,类簇标签也有良好的可读性。(本文来源于《软件导刊》期刊2018年12期)

刘宇征[6](2018)在《搜索结果的聚类研究》一文中研究指出随着互联网技术的普及和发展,网络信息呈指数式增长。面对海量的信息,搜索引擎成为人们日常获取所需信息的重要工具。但是传统的搜索引擎将搜索结果以线性列表的方式排列,使得用户无法快速、准确地获得感兴趣的信息。因此,使用聚类算法对搜索结果进行聚类,可以帮助用户快速查找到所需信息。本文在对中文分词、特征选择、权重计算、相似度度量等文本聚类技术进行深入研究的基础上,分析了搜索结果聚类与文本聚类之间的联系。根据搜索结果聚类的特点,提出一种基于改进的K-Means算法的搜索结果聚类方法。基于划分的K-Means算法是一种被广泛应用的动态聚类算法,具有实现简单、收敛速度快等优点。但该算法存在一些不足使其无法适应搜索结果聚类,比如:人工指定聚类个数、随机生成聚类中心、对孤立点敏感、无法“软聚类”和无法生成聚类标签等。针对以上K-Means算法的不足,对其进行了改进:首先,利用基于密度的最大最小距离法发现初始聚类中心,即将密度最大的对象作为第一个初始聚类中心,再根据最大最小距离选择其余的聚类中心,然后根据文本平均相似度设置参数作为终止条件,确定聚类个数;其次,引入邻居的概念,获取初始聚类中心的邻居,根据邻居计算其所在类簇新的聚类中心,并排除初始聚类中心中的孤立点;最后,对类簇中特征词进行过滤,并在类簇的基础上使用TF-IDF方法计算特征词权重,根据权重选取类簇标签。由于TF-IDF方法在计算权重时只考虑了词频,而忽略了词性和词长对特征词权重的影响,因此,在TF-IDF方法中引入了词性因子和长度因子。最后,通过搭建Nutch搜索引擎,获得搜索结果,并利用Jsoup进行解析形成待聚类的搜索结果文本集。利用改进后的K-means聚类算法进行聚类,结果表明,改进后的K-Means算法相比于原K-Means取得了更好的聚类效果。比较增加长度因子和词性因子TF-IDF方法和原TF-IDF方法的聚类效果,结果表明,长度因子和词性因子会对聚类结果产生积极的影响。(本文来源于《东南大学》期刊2018-05-01)

刘宇征,邵家玉[7](2018)在《基于K-Means的搜索结果聚类方法》一文中研究指出K-Means算法是一种常用的聚类算法。通过分析传统K-Means聚类算法可知,该算法随机选取聚类中心并需要手动设定聚类个数,因此容易出现局部最优、稳定性差,适用范围窄的问题。为了改善聚类结果,对K-Means算法进行了改进,根据文本距离确定初始聚类中心,并在初始聚类完成后,对聚类进行合并,形成最终的聚类结果。实验结果表明,改进后的K-Means算法提高了聚类的查准率和查全率。(本文来源于《工业控制计算机》期刊2018年03期)

陈腊生[8](2018)在《针对搜索结果的位图表示及聚类算法改进研究》一文中研究指出网络科技和搜索技术的迅猛发展使得人们越来越多地通过互联网和搜索引擎获取信息,搜索结果种类多、排列乱是影响用户快速获取有效信息的重要因素。为提高用户获取有效信息的速度、改善用户的搜索体验,聚类分析技术被广泛应用到搜索结果中。目前,针对搜索结果聚类的大部分研究集中于聚类方式,忽略了搜索结果的表示方法对聚类效果和收敛速率的影响;此外,常用于搜索结果聚类的K-means算法的聚类效果和收敛速率受初始聚类中心影响较大,而当前关于初始聚类中心的研究仍然存在一些不足。基于此,本文从搜索结果的表示方法和初始聚类中心的选择两个方面展开研究,具体完成了以下几项工作:(1)针对向量空间模型存在文本相似度计算耗时以及存储空间需求较大的问题,本文结合向量空间模型和布尔模型各自的优点提出了基于位图的文本表示方法表示搜索结果。该方法先用向量空间模型将搜索结果表示成特征向量,然后将特征权重转换为对应的布尔值,最后以位为单位存储布尔值形成位图特征向量。实验结果表明,本文提出的位图文本表示方法可以有效的提高搜索结果的文本相似度计算速率,同时减少特征矩阵所需的存储空间。(2)针对K-means算法随机选择初始聚类中心导致算法不可重复实现,同时可能使算法陷入局部最优解、减缓算法收敛速率的问题,本文提出了基于悲观准则和近邻算法的初始聚类中心选择算法。通过悲观准则选择K个相距最远的数据作为备选初始聚类中心,然后寻找各个备选初始聚类中心的近邻簇,最后以各个近邻簇的中心作为初始聚类中心。实验结果表明,本文提出的基于悲观准则和近邻算法的初始聚类中心选择算法可以有效的提高K-means算法的聚类效果和收敛速率,同时保证了算法的稳定性。(3)针对现有聚类搜索引擎产品存在的问题,本文设计并实现了一个基于本文研究成果的聚类搜索引擎原型系统。该原型系统实现了搜索结果获取、预处理、特征表示、初始聚类中心选择、聚类以及搜索结果展示等功能。其运行效果表明,将本文研究成果应用到搜索结果聚类中,能够有效地提高用户获取信息的效率,改善用户的使用体验,同时为将来类似的聚类搜索引擎系统的研发提供了借鉴参考。(本文来源于《武汉理工大学》期刊2018-03-01)

秦瑶瑶[9](2017)在《非负矩阵分解及在社区检测和搜索结果聚类中的应用》一文中研究指出一方面,随着互联网上数据和信息的迅速增长,人们被淹没在数据的海洋里。如何从这些海量的数据中获取人们想要的信息,成为当今数据挖掘和机器学习面临的主要任务。由于大数据的4V特征(Volume、Variety、Value、Velocity),使得如何对这些海量的数据进行降维处理成为人们关心的主要问题之一。非负矩阵分解由于其能发现数据内在的维度和结构、具有较好的可解释性、可以直接对数据进行聚类分析等优点,受到了人们的广泛关注。另一方面,现实世界的诸多系统都可以表示为复杂网络的形式,而从复杂网络中发现连接紧密的社区结构(即对节点进行聚类分析)具有重要的意义。近年来,复杂网络社区检测引起了人们极大的兴趣,随着复杂网络社区检测方法研究的深入,涌现出许多基于非负矩阵分解方法的社区发现模型,并取得了一些鼓舞人心的结果。但基于非负矩阵分解的社区发现模型仍然存在以下问题:(1)非负矩阵分解模型本身对初值敏感,面对网络社区检测问题需要考虑网络自身结构特性设计有效的初值选择策略。(2)现有的用于网络社区检测的非负矩阵分解模型的有效性还有待进一步提高,已有模型没有考虑对分解出的基向量进行正交约束,以增强分解结果的稀疏性。(3)现有的基于网络社区检测的非负矩阵分解方法没有考虑节点自身的特性,如当网络表示视频之间的共观看关系时,节点上的属性即是视频的标题短文本,需要研究基于非负矩阵分解的社会媒体短文本聚类及网络和节点属性相结合的非负矩阵分解方法。针对以上问题,本论文的贡献如下:(1)提出了一种新的矩阵分解初始化方法(CALS),该方法使用Pagerank方法对原始矩阵进行排序,考虑节点的重要性和节点间的距离双重因素选取k(社区个数)个初始值对基矩阵进行初始化。然后,使用最小二乘方法求解出隶属度矩阵。在人工和真实数据集上的实验结果表明:CALS不仅可以提高算法的稳定性,而且提高了非负矩阵分解方法用于社区检测的精度。(2)提出了一种基于正交约束的非负矩阵分解模型(ALSOC),正交约束的引入实现了分解的低秩性、稀疏性。基于最小二乘的方法的迭代求解方法在真实数据集和人工合成数据集上的都表现出较好的性能。相关实验结果证明了:ALSOC方法不仅可以保证结果的稀疏性,还可以提高算法的准确性。(3)本文初步尝试了非负矩阵分解方法在短文本聚类上的效果,并将非负矩阵分解方法用于优酷UGC(User Generated Content)数据的搜索结果聚类。在优酷内部搭建一个视频主题分析原型系统,以便对搜索结果进行二次整理,提高搜索结果的多样性并为用户提供多层次的选择。(本文来源于《北京交通大学》期刊2017-03-01)

徐英[10](2016)在《一种基于多重距离聚类的多源侦察结果融合算法》一文中研究指出由于来自不同传感器的侦察图像获取和传输的非实时性以及图像情报分析结果的非连续性,反侦察监视裁决需要对来自不同传感器的侦察结果进行空间和属性综合聚类,合并属于同一目标的侦察结果。考虑空间位置和多个非空间属性的相似性,提出了基于空间和属性多重距离的空间聚类算法MDBSC(Multiple Distance Based Spatial Clustering),用于多源侦察结果的关联融合,给出了算法步骤和实例。(本文来源于《兵器装备工程学报》期刊2016年09期)

聚类结果论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

聚类结果的可视化是发现数据规律的有效手段。本文给出的过程法PC(Process Clustergram)通过记录聚类过程中各数据簇的数量变化、拆分和重组的情况,可以显式的看出数据集在聚类过程中数据簇的变化过程以及数据簇之间的数量变化。结果表明,相较于目前的可视化方法,本方法可以发现聚类结果的稳定性与数据集的某个维度的关系,这极大地提高了数据分析的效率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

聚类结果论文参考文献

[1].宋彦坡,陶焰明,彭小奇,陈卓,高东波.基于数值模拟结果聚类的两相流气体形态识别[J].工程热物理学报.2019

[2].魏振钢,郑东辉,魏兆强.聚类算法结果的可视化分析方法[J].中国海洋大学学报(自然科学版).2019

[3].杨楠,李亚平.基于Word2Vec模型特征扩展的Web搜索结果聚类性能的改进[J].计算机应用.2019

[4].俞立平.基于聚类分析的期刊多属性评价方法选择研究——聚类结果一致度筛选法[J].图书情报工作.2018

[5].蒋宗礼,赵思露.主题模型在检索结果聚类中的应用[J].软件导刊.2018

[6].刘宇征.搜索结果的聚类研究[D].东南大学.2018

[7].刘宇征,邵家玉.基于K-Means的搜索结果聚类方法[J].工业控制计算机.2018

[8].陈腊生.针对搜索结果的位图表示及聚类算法改进研究[D].武汉理工大学.2018

[9].秦瑶瑶.非负矩阵分解及在社区检测和搜索结果聚类中的应用[D].北京交通大学.2017

[10].徐英.一种基于多重距离聚类的多源侦察结果融合算法[J].兵器装备工程学报.2016

标签:;  ;  ;  ;  

聚类结果论文-宋彦坡,陶焰明,彭小奇,陈卓,高东波
下载Doc文档

猜你喜欢