聚类结果评价论文-俞立平

聚类结果评价论文-俞立平

导读:本文包含了聚类结果评价论文开题报告文献综述及选题提纲参考文献,主要关键词:聚类分析,期刊评价,聚类结果一致度,评价方法选取

聚类结果评价论文文献综述

俞立平[1](2018)在《基于聚类分析的期刊多属性评价方法选择研究——聚类结果一致度筛选法》一文中研究指出[目的 /意义]解决学术期刊多属性评价方法众多、评价结果不一致问题。[方法 /过程]提出一种基于聚类分析的多属性评价方法选取方法——聚类结果一致度筛选法。其原理是首先对原始评价指标进行聚类,然后采用可行的多属性评价方法进行评价并对评价结果进行二次聚类,最后根据评价结果聚类与原始指标聚类结果一致度的高低来选择评价方法,优先选取聚类结果一致度最高的评价方法。本文基于JCR2015数学期刊,选取11个指标,分别采用加权线性汇总、TOPSIS、VIKOR、主成分分析、调和平均进行评价,然后基于聚类结果一致度进行评价方法选取,发现调和平均的聚类一致度最高。[结果 /结论]可以采用该方法对多属性评价方法进行选择;聚类种类设置对结果影响较小;该方法具有较高的稳健性。(本文来源于《图书情报工作》期刊2018年21期)

董兰芳,巢中迪[2](2016)在《一种拟合聚类结果的特征重要性评价方法》一文中研究指出从使类内联系更紧密、类间联系更稀疏的角度考虑,特征选择可以转换为对聚类的特征选择问题.目前基于Filter的特征选择方法普遍从特征本身的特性考虑,强调特征的信息量、特征之间的依赖性和特征子集与分类结果的相关性,关注的重点在于消除冗余项、去除不相关项,虽然能取得不错的效果,但是这种效果本身是不可预知的,需要经过分类器训练得出.将特征选择问题转换成聚类问题是从整体的效果考虑,认为使得样本能够取得较好分类效果的特征子集在聚类上应当具有类似的效果,问题进一步转换成在特征集中寻找一个最优子集使得样本聚类的结果与分类标签最大程度拟合.这种转换一方面可以减少计算量,另一方面特征选择的效果在某种程度上是可预知的.(本文来源于《小型微型计算机系统》期刊2016年06期)

肖婷,朱昌明,翟东宇,邓莹[3](2016)在《聚类分析法与专家评价法在企业绩效评价中的应用与结果比较》一文中研究指出以某科技专项基础数据信息为基础,通过聚类分析和专家评价两种方法对科技专项的部分样本进行绩效评价分析,并结合评价结果给出相应的分析与建议。(本文来源于《科技创业月刊》期刊2016年07期)

王茜[4](2015)在《参考聚类结果的CO_2浓度数据区域对比分析评价》一文中研究指出作为最重要的温室气体,大气中CO2增加对增强温室效应的贡献大约是65%。GOSAT卫星以它多时相的全球观测数据为全球碳循环研究提供了丰富的CO2浓度时空数据集,可用于大范围、实时客观地定量大气CO2浓度。鉴于卫星观测模式及气象等客观条件所限,GOSAT卫星所获取的大气CO2柱浓度数据在时空采样上很不均匀,其为后续分析带来了困难。因此,本研究在利用时空克里格(MCSTK)插值方法插补空缺数据的基础上,选用K-均值的聚类方法,分别以中国、美国及全球作为研究区域,以CO2的时序变化作为特征向量,挖掘CO2浓度分布的格局,并有助于分析其影响因素。本研究中采用了ACOS团队基于GOSAT观测结果反演得到的CO2柱浓度数据集,通过时空克里格(MCSTK)插值制图,获得了研究区域的CO2柱浓度时空连续数据集。在此基础上的聚类结果表明:中国区域大气CO2浓度的插值结果对K-均值聚类的响应较好,分类较少时,其大气CO2浓度差异较小,而分类较多时,其大气CO2浓度差异明显,且中国区域的聚类大气CO2浓度趋势与原始大气CO2浓度区域较为一致。美国区域大气CO2浓度的插值结果针对叁年12季度的K-均值聚类的结果不及中国空间聚类结果。进一步通过将叁年数据分开聚类,可得中国和美国聚类中心以及中国和美国聚合度较高的区域。本研究通过分析的CO2柱浓度数据集可以得到:从2010年到2012年全球平均XCO2浓度分别为387.0ppm、388.8ppm、391.0ppm,与WMO发布的全球地面观测结果基本一致。其中中国平均XCO2浓度分别为387.7ppm、389.6ppm、391.9ppm,美国平均XCO2浓度分别为387.7ppm、389.4ppm、391.6ppm。中国和美国大气CO2浓度年均值均高于全球平均水平。全球各个纬度带均显示了不同的年增长趋势和季节变化差异,其中赤道附近有较为明显的季节震荡。同一年的季节上,明显以4-6月最高,7-8月最低。南北半球季节上的高值与低值呈现相反的变化,且时间序列上的季节变化幅度明显不同。其中北半球中纬度地区(特别是中国和美国)是主要的化石燃料燃烧排放区,中国和美国CO2浓度均呈现逐年上涨的趋势,且增幅高于世界平均水平,这与全球经济社会发展状况相吻合。我们基于这些先验知识,对照CARMA全球电厂数据碳排放量统计,得出高浓度高排放区域,并对其进行前向和后向轨迹模拟,并对模拟进行概率统计,得出中国和美国区域目标位置CO2气团扩散的聚类中心以及各方向的扩散概率,表明扩散对周边环境的影响。(本文来源于《西安科技大学》期刊2015-06-30)

胡勇[5](2014)在《聚类分析结果评价方法研究》一文中研究指出数据挖掘是当前在大数据分析中被广泛应用的一门技术;其中,聚类算法主要是通过无监督的方式对数据进行聚类,它包含了对各种数据类型进行聚类的多种算法,因而得到许多的计算机人员与统计人员的重视。虽然其中的各种算法的已经被广泛应用。但是没有一种算法能够对所有的数据类型是通用的,同时针对这种无监督类型进行聚类的效果,聚类的质量指标评价是非常重要的。但是,如果要通过聚类评价指标来判断聚类效果的好坏,以及实现最佳的聚类通常在计算的方面与评价方面还比较困难。论文在基于PolyAnalyst软件下,根据聚类的K-means算法针对不同类型的数据集进行了可视化的聚类,就K-means实验后的结论进行了深入的分析研究,并且辅以大量的可视化散点图和实例数据集实验结果图。根据清晰的实例图与鲜明的结果,本课题提出了一种新型的组合指标评价方法,来验证聚类的质量效果。该算法引进了叁个概念:第一,组合概念,该指标不同于传统的指标评价,它运用了传统指标与新改进的指标相结合来评价聚类的质量效果;第二,图形颜色所占百分比概念,根据聚类间类与类所符合阈值的颜色百分比来进行评价;第叁,离散度概念,它针对于整体和局部的计算进行评价。实验的验证证明了该指标的有效性和精密性。最后,文章在基于K-means算法的结果与所需求的结果散点图进行比较,运用了四种不同类型的数据簇集进行了详尽的描述和验证。在不同类型的数据集上的实验结果表明,课题提出的组合评价质量聚类算法是有效的与可用的。组合指标加强了聚类算法结果的解释性与算法的适用性。实验表明,本论文的K-means法和组合模式评估方法对处理实数据集的聚类是有效的,可用性较高,聚类结果的可解释性良好。(本文来源于《内蒙古科技大学》期刊2014-05-19)

张敞,王园园,赵裕啸,伍章俊[6](2011)在《一种基于信息熵的聚类结果评价方法》一文中研究指出文章基于信息熵理论,将模糊聚类评价方法和决策树分类算法联系起来,提出从信息熵角度用决策树分类算法来评价聚类算法结果的有效性,从而确定最佳的聚类个数;并将该方法应用到证券行业客户忠诚度分析模型的建立中。实验结果表明,该方法可以明显提高聚类的效果,并且使得聚类结果的可解释性强,具有良好的实用价值。(本文来源于《合肥工业大学学报(自然科学版)》期刊2011年08期)

吕宗磊,王建东,李莹,宰云峰[7](2008)在《一种基于模态逻辑的聚类结果评价方法》一文中研究指出聚类评价指标对衡量一个聚类的优劣有着重要作用.现有的聚类评价指标通常都基于统计理论或模糊理论.收到基础理论的限制,在一些特殊场合,这些指标不能对聚类进行正确的评估.提出了一种基于模态逻辑的新的聚类评价指标.通过把相似性定义成数据集上的二元关系聚类被描述成Kripke结构.用原子公式表示每个簇后,聚类的结果可以用一组逻辑公式来表示.根据最小描述长度原则,聚类评价指标由这种表示方式的准确性和复杂性构成.由于这种新的评价指标对相似性没有任何附加的限制,它较之现有的评价指标更为通用,而那些指标往往都默认了某种相似性度量方式.列举了用于对比新旧指标的实验.实验结果表明,这种新的评价指标在一般情况下与大多数评价指标一致,而在一些类似"双环"的特殊情况下比现有评价方式更有效.(本文来源于《计算机研究与发展》期刊2008年09期)

李莹[8](2008)在《聚类结果评价方法与聚类知识提取技术的研究》一文中研究指出聚类是一种无监督的学习,其任务是按照给定的相似性将数据分组,使得同组数据彼此相似而不同组数据不相似。由于用来聚类的数据本身并没有类别信息,故而无法通过传统的“训练——测试”方法来判定聚类的效果。因此,对聚类结果的评判就只能依赖于聚类评价指标。聚类评价指标的作用是检测聚类的结果是否符合“同组数据相似,不同组数据不相似”的要求。而对于什么样的数据被称为相似则并无一个统一的标准。聚类算法与聚类评价指标所采取的相似性定义往往并不一致,这就导致了在某种意义下聚类评价指标的无用性。“可解释性”是评价聚类的一个重要依据,因此在评价聚类时应首先对聚类结果做出相应的解释,而后根据解释信息做出评价。解释聚类结果时首先应对聚类结果进行一定程度的抽象,提取出相应的知识;然后通过知识来描述、解释聚类结果。代表点方法是一类经典的聚类表示方法,基于这种方法构造的聚类算法与增量聚类算法都具有很好的效果。有鉴于此,本文提出了一种用聚类算法原有相似性定义进行聚类评价的方法。这种方法首先对聚类结果进行知识提取,抽取数据集中最为核心、最为本质的信息;然后针对这些本质信息做出相应评价,这种评价依据的是最小描述长度原理。实验表明,这种新的评价方法在一般情况下与大多数现有常用评价指标的结果一致;而在一些特殊应用场合则优于一些现有评价指标。除了可以给出具体的定量评价值之外,这种新的评价方法还可以对聚类结果的结构信息进行描述与分析。(本文来源于《南京航空航天大学》期刊2008-01-01)

黄良辉,陈常青,赵婷[9](2006)在《一种基于模糊聚类思想的评价结果组合模型》一文中研究指出对多属性组合评价问题进行了研究.在已知多个评价排序结果及评价方法偏好信息的情况下,首先给出了一种基于模糊聚类思想的评价结果组合模型,该模型利用模糊聚类中求解聚类中心的思想和过程来求解组合评价值;然后通过应用该模型和其他常用的评价结果组合模型进行实证对比分析,验证了该模型的有效性;最后对提出的模型作了进一步分析.(本文来源于《2006中国控制与决策学术年会论文集》期刊2006-07-01)

易东,杨梦苏,李辉智,黄明辉,王文昌[10](2004)在《基因表达聚类结果的信息熵评价方法》一文中研究指出目的 探讨基因表达数据聚类结果信息熵评价方法 ,为合理地选择聚类方法提供一种定量评价依据。方法 采用entropy信息熵方法 ,考察常用的六种聚类方法所得到的分类结果与部分已知功能基因分类之间的符合程度 ,并将该指标作为一种评价依据。结果 将该方法应用于Lyer的血清刺激表达数据集聚类结果的评价 ,给出了六种聚类方法的entropy图。结论 本研究首次提出用熵理论评价聚类结果 ,并观察到同一数据集由于功能聚类信息的不同而引起的评价结果的差异。并且结果显示SOM和模糊聚类算法对分析处理Lyer的血清刺激的基因表达数据更为合理(本文来源于《第叁军医大学学报》期刊2004年04期)

聚类结果评价论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

从使类内联系更紧密、类间联系更稀疏的角度考虑,特征选择可以转换为对聚类的特征选择问题.目前基于Filter的特征选择方法普遍从特征本身的特性考虑,强调特征的信息量、特征之间的依赖性和特征子集与分类结果的相关性,关注的重点在于消除冗余项、去除不相关项,虽然能取得不错的效果,但是这种效果本身是不可预知的,需要经过分类器训练得出.将特征选择问题转换成聚类问题是从整体的效果考虑,认为使得样本能够取得较好分类效果的特征子集在聚类上应当具有类似的效果,问题进一步转换成在特征集中寻找一个最优子集使得样本聚类的结果与分类标签最大程度拟合.这种转换一方面可以减少计算量,另一方面特征选择的效果在某种程度上是可预知的.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

聚类结果评价论文参考文献

[1].俞立平.基于聚类分析的期刊多属性评价方法选择研究——聚类结果一致度筛选法[J].图书情报工作.2018

[2].董兰芳,巢中迪.一种拟合聚类结果的特征重要性评价方法[J].小型微型计算机系统.2016

[3].肖婷,朱昌明,翟东宇,邓莹.聚类分析法与专家评价法在企业绩效评价中的应用与结果比较[J].科技创业月刊.2016

[4].王茜.参考聚类结果的CO_2浓度数据区域对比分析评价[D].西安科技大学.2015

[5].胡勇.聚类分析结果评价方法研究[D].内蒙古科技大学.2014

[6].张敞,王园园,赵裕啸,伍章俊.一种基于信息熵的聚类结果评价方法[J].合肥工业大学学报(自然科学版).2011

[7].吕宗磊,王建东,李莹,宰云峰.一种基于模态逻辑的聚类结果评价方法[J].计算机研究与发展.2008

[8].李莹.聚类结果评价方法与聚类知识提取技术的研究[D].南京航空航天大学.2008

[9].黄良辉,陈常青,赵婷.一种基于模糊聚类思想的评价结果组合模型[C].2006中国控制与决策学术年会论文集.2006

[10].易东,杨梦苏,李辉智,黄明辉,王文昌.基因表达聚类结果的信息熵评价方法[J].第叁军医大学学报.2004

标签:;  ;  ;  ;  

聚类结果评价论文-俞立平
下载Doc文档

猜你喜欢