符号聚类论文-杨梦婷

符号聚类论文-杨梦婷

导读:本文包含了符号聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:半监督学习,谱聚类,归一化割,符号网络

符号聚类论文文献综述

杨梦婷[1](2019)在《基于符号网络的半监督谱聚类》一文中研究指出聚类就是把对象分成同类中对象间的相似性强于其他类中对象的过程,是多元统计分析中的一门技术。归一化割(Normalized cut,简称Ncut)等图划分方法是典型的聚类方法,通常利用无符号网络来表达数据,以非负权重衡量节点间相似性,通过对图的拉普拉斯矩阵的特征值和特征向量分析来达到聚类目的。这类方法因其划分平衡性,以及对复杂数据空间的处理能力,在很多领域中得到了应用。在机器学习中,一般将聚类归为无监督式学习。聚类的这种无监督属性,往往使其是不适定的。半监督聚类同时利用部分监督信息与无监督样本改进聚类性能,可以帮助用户获得更合适的聚类结果。无符号网络表达能力有限,无法同时表征相似与相异性。实际上真实复杂系统中普遍存在着消极、对立、互斥关系,借助于符号网络,分别以正、负边表达积极与消极关系。最近,负边在各个网络分析中体现出了附加价值。本文将部分监督信息分别表达为强关系的正负边,基于符号网络探讨半监督聚类问题,并将其应用于图像分割。符号归一化割(Signed Normalized cut,简称SNcut)是定义于符号网络的一类图划分准则,它融入了正负边的信息。本文尝试利用SNcut进行半监督聚类,对MSRA1K图像数据库进行图像分割实证,分析了常用的图像聚类统计指标和部分图像的聚类结果。定性并定量地分析了多种SNcut的聚类表现,验证了负边的附加价值。此外,还提出了基于MRF正则化的改进方案。本文的主要工作如下:1.总结了已有的多种符号网络谱聚类方法,并进行讨论。2.将符号归一化割用于半监督聚类,通过交互式图像分割进行实证。将半监督信息转换为成对约束,以负边表达勿连约束从而构造符号网络。通过在真实图像数据库上的实验,对比分析了多种SNcut算法。3.在图像分割问题上验证了负边的附加价值。通过比较Ncut、增加正边的Ncut、增加负边的Ncut与同时增加正边和负边的Ncut,验证了负边对Ncut聚类的提升效果。4.提出了基于MRF正则化的SNcut聚类。将MRF势函数集成于目标函数,分别利用谱方法与核割法求解,在图像数据集上验证了这两种方法的改进性能,并比较其优劣。(本文来源于《湖南师范大学》期刊2019-05-01)

张可,李媛,柴毅,黄磊[2](2018)在《基于分段趋势的符号化时间序列聚类表示》一文中研究指出符号聚合近似表示方法(Symbolic Aggregate approXimation,SAX)是对大型时间序列数据进行降维处理的有效方法之一,由其基于平均值计算,在分析时间序列分段内的趋势特征时存在较大困难.针对这个问题,本文提出了一种基于分段趋势的符号聚合近似(Trend in segment-based Symbolic Aggregate approXimation,TSAX)表示方法,通过给每个分段增加下标符号表示段内趋势信息.该方法继承了SAX方法的降维优势,使其得到更加紧凑的下界性定理,并刻画出区分明显、数量有限的分段趋势特征.然后利用动态弯曲距离进行相似度计算,通过层次聚类方法进行聚类分析,完成对不同类别的时间序列的区分.通过实验与对比验证表明,基于分段趋势的符号化序列方法在时间序列聚类分析上具有更佳的准确性和实用性.(本文来源于《第37届中国控制会议论文集(D)》期刊2018-07-25)

杨予丹[3](2018)在《基于加权符号图聚类和马尔科夫随机场的图像分割》一文中研究指出图像分割是根据图像的颜色、灰度值、纹理、形状等特征或特征集合的相似性准则,将其分成一些不同且不重迭的区域。图像分割是计算机视觉中的基本而又核心的问题之一,以归一化割(Normalized cut,简称Ncut)等为代表的无符号图聚类方法在该问题上获得了成功应用。相比于无符号图,加权符号图能够表达更丰富的关系。当前普遍应用于图像分割的图聚类方法均以无符号图为基础,本文尝试利用加权符号图聚类进行半监督图像分割,分析了加权符号图上的符号归一化割(Signed Normalized cut,简称 Signed Ncut)的表现,并提出了基于MRF正则化的改进方案。本文的工作有两部分:(1)将半监督信息表达为成对约束,并将像素之间的关系表达为加权符号图,用符号归一化割进行聚类。采用了图聚类的主流优化方法——谱方法来求解其松弛问题,通过k-means算法得到图像的二相分割。Signed Ncut的整体表现明显优于Ncut,说明其在半监督图像分割问题上具有可行性。但是,Signed Ncut在分割精度等统计指标以及轮廓贴合性上仍有待提升。(2)尝试在SignedNcut中引入MRF正则化势函数,以进一步提升Signed Ncut的分割效果。通过对Signed Ncut进行线性近似,构造了上界辅助函数,基于图割技术迭代地优化逼近最优解。实验表明,MRF正则化的SignedNcut具有更好的轮廓贴合性,在相关的统计指标上表现更好。综上所述,本文尝试利用带权符号图来表达像素之间的关系,将Signed Ncut与MRF正则化进行了融合,为图像分割提供了新思路,也扩充了符号图聚类的应用。(本文来源于《湖南师范大学》期刊2018-06-01)

欧阳静,张立彬,潘国兵,徐红伟,陈金鑫[4](2017)在《基于统计特征矢量符号值和聚类经验模态分解的短时电能质量扰动信号分析》一文中研究指出研究了希尔伯特-黄变换(HHT)方法分析电能质量扰动信号的不足,提出了一种统计特征矢量符号化(SFVS)算法与聚类经验模态分解(EEMD)相结合的短时电能质量扰动信号分析方法。该方法采用循环周期比较的欧氏距离的边界检测算法来对电能质量扰动信号的突变时间进行检测,以突变时刻为边界点将原始电能质量信号进行划分,再用EEMD方法对区块划分信号进行分解,有效抑制模态混迭,以改善信号分解性能。测试结果表明,该方法能够实现突变时刻的准确检测,对电能质量扰动信号中的各种成分进行准确分析。(本文来源于《高技术通讯》期刊2017年Z2期)

程铃钫,陈黎飞[5](2018)在《符号序列的概率向量聚类方法》一文中研究指出针对符号序列聚类中表示模型及序列间距离度量定义的困难问题,提出一种基于概率向量的表示模型及基于该模型的符号序列聚类算法。该模型引入符号序列的概率分布表示法,定义了一种基于概率分布差异的符号序列距离度量及该模型的目标函数,最后给出了一种符号序列K-均值型聚类算法,并在来自不同领域的实际应用序列集上进行了实验验证。实验结果表明,与基于子序列表示模型的符号序列聚类算法相比,所提方法在DNA序列和语音序列等具有较多符号的实际数据上,在有效提高聚类精度的同时降低聚类时间50%以上。(本文来源于《计算机应用研究》期刊2018年06期)

陆一潇,潘常春,白杰,杨根科[6](2017)在《基于对称KL散度的符号大数据动态聚类算法》一文中研究指出区间符号数据目前已经在数据表达与数据处理中有着广泛而实际应用,特别是在数据挖掘、人工智能这些新兴领域。本文定义了一个基于KL散度的相似性度量,希望尽可能的利用区间符号数据的内部信息,而不是仅仅利用其边界值,并将这一新的相似性度量方法用于动态聚类算法中。为了评估这个聚类算法的优越性,文中通过仿真数据和真实公交数据分别进行了实验,并将这一新的度量方法与其他叁种相似性度量(Hausdorff距离、City-block距离和Wasserstein距离)比较。仿真生成的数据通过各种不同的分布来体现原始类别的差异,并引入ARI这一指标来衡量每种相似性度量下的聚类效果。由于ARI指标对聚类算法中的度量定义不敏感,所以能够客观地给出效果评价。仿真生成的数据的实验结果很好地说明了基于KL散度的相似性度量比其他叁种度量方法有着更高的聚类准确度。最后,文中把这一度量方法用于真实的公交车站点数据,采用基于路况相似性的方法来预测公交车的到站时间,并且和其他度量方法比较最终的预测准确度。真实数据实验的结果也表明这一新的相似性度量方法比现存的叁种方法有着更好的表现。(本文来源于《第八届中国卫星导航学术年会论文集——S11PNT新概念、新方法及新技术》期刊2017-05-23)

陈晓,郭景峰,刘凤春[7](2016)在《一种改进Shapley值的符号网络聚类研究》一文中研究指出符号网络中宏观网络结构(拓扑结构属性和符号属性)和微观博弈对联盟(社区)的形成具有相互影响,是符号网络博弈模型的新特征.基于以上思想,提出一种新的符号网络层次聚类算法HCSVSN(Hierarchical Clustering Based on the Shapley Value in Signed Netw ork).首先,基于结点的符号属性和结点度,提出改进Shapely值的计算方法,可以避免忽略外部环境(网络结构)对Shapley值的影响,并可以降低Shapley值计算的复杂性;其次,基于网络密度对联盟形成的影响,提出联盟收益均值的计算方法,并给出符号网络联盟博弈模型;然后,基于联盟平均收益最大化实现符号网络的社区发现;最后,通过实验验证算法的准确性和有效性.(本文来源于《小型微型计算机系统》期刊2016年11期)

王建新[8](2016)在《符号型数据聚类算法的研究》一文中研究指出近年来符号型数据的无监督学习在模式识别、机器学习、数据挖掘和知识发现等诸多领域,起着愈来愈重要的作用。为了有效地挖掘符号型数据内在的组结构信息,相关文献中已经发展了很多符号型数据的聚类算法。然而这些算法相比数值型数据的聚类算法,在性能方面仍然有很大的提升空间,其根本原因在于符号型数据缺乏类似数值型数据那样清晰的空间结构。本工作跟踪国际国内的研究前沿,针对符号型数据的聚类问题进行了深入的探究和实验,取得的成果如下:(1)深入研究目前国际国内流行的、经典的符号型数据聚类算法,分析比较各个方法的优缺点,进而引出新的聚类算法的研究动机和目标。通过采用新的符号数据表示方案,将原始的符号数据在不失任何信息的情况下,映射到新的维度的欧式空间中。基于这一新的符号数据的聚类框架,为了找到类中更有代表性的模式,结合Carreira-Perpi~n'an提出的K-Modes算法进行无监督学习(SBC_K-modes算法)。通过与其它四种经典的符号型数据聚类算法在9个UCI数据集上实验的比较,结果验证了新算法的有效性。(2)在对符号数据可能存在的空间结构的进一步研究和假设的基础上,提出一种新的符号数据的再表示方案。经过推理和实验验证了这一表示的正确性和有效性。在这一表示的基础上,结合两种不同的差异性度量方式和K-Means算法基本范式,提出了两种算法(NSBC和JSBC)。通过与其它四种经典的符号型数据聚类算法在9个UCI数据集上实验的比较,结果验证了新算法的有效性。总之,本文对符号数据聚类相关理论进行了研究,提出了新的符号数据的再表示方案和相应的算法,并在UCI数据集上对算法的有效性进行了验证。本文的研究为符号型数据的聚类分析提供了新方法与新思路,在数据挖掘和知识发现等领域有着一定的应用价值。(本文来源于《山西大学》期刊2016-06-01)

张豪[9](2015)在《符号序列相似性度量及聚类新算法》一文中研究指出聚类是一种无监督的机器学习方法,其广泛应用于机器视觉、信息检索和模式提取等诸多数据挖掘领域。在科研和商业应用中,符号序列数据日益增长,常见的符号序列有:生物信息学领域中的DNA序列、蛋白质序列和语音识别领域的语音序列等。因此,面向符号序列的聚类成为目前的一项热门研究。受到符号序列的非数值特性、长度差异较大及符号间存在复杂联系的影响,传统的基于数值型的相似性度量方法无法直接应用于符号序列的相似性度量,这使得符号序列聚类成为一项具有挑战性的任务。除了有效的相似性度量方法之外,符号序列聚类还需要有效的聚类算法。本文分析目前主流的符号序列相似性度量方法,分析并研究序列相似性度量方法中需要考虑和解决的问题,继而提出规范化的相似性度量方法与基于子序列全局相似度的序列相似性度量方法;针对基于单链接凝聚层次聚类存在的问题,提出基于无回路连通图的构建与划分的聚类算法,具有理论意义与重要的实际应用价值。本文的主要工作及贡献如下:1. 提出了规范化的相似性度量方法,将序列比对与规范化因子结合,其中序列比对算法反映了序列的局部与全局信息,规范化因子有效了地降低了序列的长度给序列相似度带来的偏倚。2. 针对现有的基于子序列相似度的序列相似性度量方法缺乏全局信息的问题,引入包含序列全局信息的符号熵,提出了基于符号熵的子序列相似性度量方法,在此基础上,提出了基于动态规划的序列相似性度量方法。3. 针对广泛应用于符号序列聚类的单链接凝聚层次聚类算法存在的缺点,提出了基于无回路连通图的构建与划分的聚类算法,新的聚类算法与上述两个序列相似性度量方法分别结合而成符号序列聚类的两个新算法,有效地提高了聚类精度。(本文来源于《福建师范大学》期刊2015-05-27)

张豪,陈黎飞,郭躬德[10](2015)在《规范化相似度的符号序列层次聚类》一文中研究指出符号序列由有限个符号按一定顺序排列而成,广泛存在于数据挖掘的许多应用领域,如基因序列、蛋白质序列和语音序列等。作为序列挖掘的一种主要方法,序列聚类分析在识别序列数据内在结构等方面具有重要的应用价值;同时,由于符号序列间相似性度量较为困难,序列聚类也是当前的一项开放性难题。首先提出一种新的符号序列相似度度量,引入长度规范因子解决现有度量对序列长度敏感的问题,从而提高了符号序列相似度度量的有效性。在此基础上,提出一种新的聚类方法,根据样本相似度构建无回路连通图,通过图划分进行符号序列的层次聚类。在多个实际数据集上的实验结果表明,采用规范化度量的新方法可以有效提高符号序列的聚类精度。(本文来源于《计算机科学》期刊2015年05期)

符号聚类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

符号聚合近似表示方法(Symbolic Aggregate approXimation,SAX)是对大型时间序列数据进行降维处理的有效方法之一,由其基于平均值计算,在分析时间序列分段内的趋势特征时存在较大困难.针对这个问题,本文提出了一种基于分段趋势的符号聚合近似(Trend in segment-based Symbolic Aggregate approXimation,TSAX)表示方法,通过给每个分段增加下标符号表示段内趋势信息.该方法继承了SAX方法的降维优势,使其得到更加紧凑的下界性定理,并刻画出区分明显、数量有限的分段趋势特征.然后利用动态弯曲距离进行相似度计算,通过层次聚类方法进行聚类分析,完成对不同类别的时间序列的区分.通过实验与对比验证表明,基于分段趋势的符号化序列方法在时间序列聚类分析上具有更佳的准确性和实用性.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

符号聚类论文参考文献

[1].杨梦婷.基于符号网络的半监督谱聚类[D].湖南师范大学.2019

[2].张可,李媛,柴毅,黄磊.基于分段趋势的符号化时间序列聚类表示[C].第37届中国控制会议论文集(D).2018

[3].杨予丹.基于加权符号图聚类和马尔科夫随机场的图像分割[D].湖南师范大学.2018

[4].欧阳静,张立彬,潘国兵,徐红伟,陈金鑫.基于统计特征矢量符号值和聚类经验模态分解的短时电能质量扰动信号分析[J].高技术通讯.2017

[5].程铃钫,陈黎飞.符号序列的概率向量聚类方法[J].计算机应用研究.2018

[6].陆一潇,潘常春,白杰,杨根科.基于对称KL散度的符号大数据动态聚类算法[C].第八届中国卫星导航学术年会论文集——S11PNT新概念、新方法及新技术.2017

[7].陈晓,郭景峰,刘凤春.一种改进Shapley值的符号网络聚类研究[J].小型微型计算机系统.2016

[8].王建新.符号型数据聚类算法的研究[D].山西大学.2016

[9].张豪.符号序列相似性度量及聚类新算法[D].福建师范大学.2015

[10].张豪,陈黎飞,郭躬德.规范化相似度的符号序列层次聚类[J].计算机科学.2015

标签:;  ;  ;  ;  

符号聚类论文-杨梦婷
下载Doc文档

猜你喜欢