导读:本文包含了度量聚类论文开题报告文献综述及选题提纲参考文献,主要关键词:系统性风险,K-均值法,股票收益率,下尾相关性
度量聚类论文文献综述
王洁,李志民[1](2019)在《基于聚类分析的系统性风险度量研究》一文中研究指出针对目前金融系统性风险危害大,精准度量难的问题,提出了一种新的度量方法。以Clayton Copula函数测算股票收益率的下尾相关性为基础,将系统性风险定义为每家金融机构发生危机导致整个金融系统也发生危机的加权平均概率。实证分析选取了40家上市金融机构的每日股票对数收益率数据,用K-均值法将40家金融机构分为3类子系统:银行业、证券业、保险业,分别度量每个子系统以及整个金融业的系统性风险。结果表明:近几年来保险业系统性风险最高,银行业其次,证券业最低,但证券业系统性风险波动最剧烈,整个金融业的系统性风险一直处于较高且脆弱的状态,与实际情况相符合。(本文来源于《重庆工商大学学报(自然科学版)》期刊2019年06期)
曹卫东,胡炜[2](2019)在《基于信息度量和聚类的模式集成方法》一文中研究指出针对模式集成过程中表示不同语义的属性因名称特征和数据实例特征相似而引起的误配问题,提出一种基于信息度量和聚类的模式集成方法。该方法通过构造数据实例的点互信息向量将属性表示到向量空间中,将模式集成问题简化成求解空间中的属性点的相似性问题,进而基于DBSCAN算法对属性进行聚类,有效识别同名异义的属性,同时结合属性的加权相似度对类中误匹配属性进行筛除,提高属性匹配结果的精确度。实验结果表明,该方法能有效地将模式信息与数据实例相结合来取得更准确的匹配结果,可以解决多个异构模式的集成问题。(本文来源于《现代电子技术》期刊2019年22期)
李敏,杨亚锋,李丽红[3](2019)在《基于聚类与粒化度量的高效决策表约简》一文中研究指出属性约简是粗糙集理论的核心内容之一,传统的属性约简每次只考虑去掉一个属性后对原来知识系统的影响,或者利用区分函数进行约简,但是当数据集较大时,区分函数范式转换获得解集具有一定的困难性,降低约简效率。针对决策系统的属性约简与高效决策的粒度选择问题,将粒化度量和聚类相结合,由聚类结果选择粒结构,再由粒化度量得到各粒结构的重要度,从而进行属性约简。考虑同时去掉多个属性,提高了效率;最后结合实例验证此方法约简与利用区分矩阵的方法约简结果一致。(本文来源于《电脑知识与技术》期刊2019年26期)
李博,张晓,颜靖艺,李可威,李恒[4](2019)在《基于值差度量和聚类优化的K最近邻算法在银行客户行为预测中的应用》一文中研究指出为提升贷款金融客户行为预测的准确性,针对传统的K-最近邻(KNN)算法在数据分析中处理非数值因素的不完备问题,提出了一种采用值差度量(VDM)距离的对聚类结果迭代优化的改进KNN算法。首先对收集到的数据信息进行基于VDM距离的KNN算法的聚类,再对聚类结果进行迭代分析,最后通过联合训练提高了预测精度。基于葡萄牙零售银行2008—2013年收集的客户数据比较可知,改进的KNN算法与传统的KNN算法、基于属性值相关距离的KNN改进(FCD-KNN)算法、高斯贝叶斯算法、Gradient Boosting等现有算法相比具有更好的性能和稳定性,在银行数据预测客户行为中具有很大的应用价值。(本文来源于《计算机应用》期刊2019年09期)
杜实,车雨桐,王利航,任景瑞[5](2019)在《基于动态时间规整度量的k均值航迹聚类》一文中研究指出为找到涵盖比较全面的各组类具有代表性的中心航迹,需要对航迹进行分类分析。首先介绍针对得到的航空器轨迹数据的处理方法及流程,并进行重要数据的转换和提取,标画出实际飞行总航迹。然后运用基于空间相似距离的k均值聚类算法进行聚类分析,并通过动态时间规整(dynamic time warping,DTW)算法对航迹聚类不同K取值的分类结果进行相似性度量,确定合适的K值,从而在众多航迹中将实际飞行航迹按照空间运行的相似性进行归类处理,找到中心航迹,实现航迹的分类。应用北京首都国际机场36L跑道上着陆航空器的航迹数据进行算例分析,分析结果证明,该算法可以有效地对航迹进行分类分析。(本文来源于《中国科技论文》期刊2019年06期)
王致远[6](2019)在《基于相似性度量的高速公路短时交通流聚类与预测研究》一文中研究指出短时交通流分析是智能交通系统的重要组成部分,其中短时交通流聚类能够发现不同时间不同路段的相似交通流模式,为交通管理提供支撑;短时交通流预测能够提供未来较短时间的交通流状态的预测,为实现智能交通诱导与控制提供支撑。本文以某旅游景区周边某高速公路卡口在国庆节假日和非节假日交通流量为实验对象,以改进短时交通流序列的相似性度量为核心手段,从聚类和预测两个研究角度出发,解决了两个过去较少被研究又有其实际意义的问题:在短时交通流聚类中对现有相似性度量局限性的讨论和改进,以及将K近邻回归方法应用在短时交通流预测中实现非对称损失的预测。首先,本文介绍了数据基本信息,对数据进行描述性统计和预处理;分析了节假日和非节假日的交通流特征的差别,使用时间序列分析手段分析其序列生成机制。其次,本文利用节假日和非节假日交通流模式的差别,检验了分层聚类、K均值及K中心点聚类在短时交通流聚类上的可行性;检验了 LOESS平滑技术对聚类效果的提升,以及不同LOESS参数对聚类效果的影响;检验应用其他经典相似性度量手段实现聚类上的可行性;并对经典的欧氏距离在短时交通流聚类上的局限性讨论,通过在欧氏距离上加上对序列差平稳性的惩罚项实现了改进,并用实验验证了改进。再次,本文在序列生成机制的基础上建立了 IMA(1,1)的基准模型;之后将“一步型预测”的静态K近邻方法改造成“滚动型预测”的动态K近邻方法,使用原始流量数据和LOESS平滑后流量数据进行动态预测,并进行残差分析;之后研究了K近邻方法中叁个关键参数的灵敏度,找到了该问题下最优参数取值;最后提出了非对称损失预测问题,提出了改进相似性度量实现非对称损失预测的叁种思路,对判别标准和预测算法进行改进,并用实验验证新算法成功实现了非对称损失预测。本文的研究特色在于抓住改进交通流序列相似性度量这个关键问题,在短时交通流聚类中实现了对欧氏距离的改进,在预测中实现了非对称损失的预测,增强了K近邻回归在短时交通流预测中的应用能力,具有一定的理论及应用意义。本文的不足在于提出的非对称损失预测方法较为朴素粗糙,有易受异常值影响等缺点,未来还需要更多的相关研究和改进使其更加成熟。(本文来源于《北京交通大学》期刊2019-06-01)
邵俊健[7](2019)在《高维数据的聚类算法及其距离度量的研究》一文中研究指出目前,高维数据在我们的日常生活随处可见,如何从高维数据中获取我们所需要的信息是当前研究的一个热点。对于高维数据的聚类问题,可以通过降维后使用传统的聚类算法,也可使用子空间聚类算法进行聚类,亦可使用新的距离度量方式来计算各样本点之间的距离从而来衡量相似性。本文的工作主要包括以下两个方面。(1)合适的距离度量函数对于聚类结果有重要的影响。针对大规模高维数据集,使用增量式聚类算法进行距离度量的选择分析。SpFCM算法是将大规模数据集分成小样本进行增量分批聚类,可在有限的计算机内存中获得较好的聚类结果。在传统的SpFCM算法的基础上,使用不同的距离度量函数来衡量样本之间的相似性,以得出不同的距离度量对SpFCM算法的影响。在不同的大规模高维数据集中,使用欧式距离、余弦距离、相关系数距离和扩展的杰卡德距离来计算距离。实验结果表明,后叁个距离度量相对于欧式距离可以很大程度提高聚类效果,其中相关系数距离可以得到较好的结果,余弦距离次之,扩展的杰卡德距离效果比较一般。(2)针对含有高斯噪声的高维数据的聚类问题,提出一种使用新的距离度量方式的增量式聚类算法(Anti-noise fuzzy(c+p)-means clustering,ANFCM(c+p))。由于传统的模糊C均值聚类算法对初始化聚类中心比较敏感,所提出的聚类算法结合SpFCM的增量方法与FCPM中的初始化聚类中心的方法,即将先前数据块的聚类中心附近的几个样本点添加到下一个数据块以进行聚类,以避免FCM对噪声的敏感性。此外,提出的聚类算法使用一种新的改进后的距离度量的同时,并且使用改进的约束条件和目标函数。通过以上改进,可以有效的区分已知类和未知类在算法中的不同影响程度,同时加强已知类和未知类之间的影响程度。实验结果表明,该算法对高维且含有高斯噪声的数据集有很好的聚类效果,并且具有鲁棒性。(本文来源于《江南大学》期刊2019-06-01)
陈海兰,高学东[8](2019)在《基于波动特征的时间序列相似性度量及聚类分析》一文中研究指出在时间序列数据挖掘中,传统的时间序列相似性度量算法没有考虑反映时间序列结构的关键点特征。为了解决该问题,文章提出了基于波动特征的时间序列相似性度量算法,并通过聚类进行了效果分析。研究中首先利用小波分析方法提取时间序列整体变化趋势,然后给出了针对小波分析得到的序列进行波动点识别的方法,构造出包含时间序列重要波动信息的波动点序列。最后提出了非等长时间序列的相似性度量方法计算波动点序列间的距离。实验结果表明,该时间序列度量方法能更好地反映时间序列的趋势特征。(本文来源于《统计与决策》期刊2019年11期)
武旭,杜奕,贾传峻[9](2019)在《基于全距离完全度量聚类的交通运输能耗区域划分》一文中研究指出对全国进行区域划分,是研究大范围、有地域特征交通运输能耗问题的基础.首先以行政区域为单位,建立了交通运输业发展、交通能源消耗、社会经济发展叁大类交通运输能耗综合指标体系.在确定省市间距离和邻接关系矩阵后,生成本文研究区域的交通运输能耗邻接关系网络图,依据邻接关系及全距离完全度量方法,建立研究区域的交通运输能源消耗省域间最小生成树.以研究区域总同质度最大为目标对最小生成树进行截断,划分了5个交通运输能源消耗区域,分析了各个区域的交通能耗特点,提出了初步的政策建议.(本文来源于《交通运输系统工程与信息》期刊2019年02期)
邵俊健,王士同[10](2019)在《高维数据的增量式聚类算法的距离度量选择研究》一文中研究指出合适的距离度量函数对于聚类结果有重要的影响。针对大规模高维数据集,使用增量式聚类算法进行距离度量的选择分析。SpFCM算法是将大规模数据集分成小样本进行增量分批聚类,可在有限的计算机内存中获得较好的聚类结果。在传统的SpFCM算法的基础上,使用不同的距离度量函数来衡量样本之间的相似性,以得出不同的距离度量对SpFCM算法的影响。在不同的大规模高维数据集中,使用欧氏距离、余弦距离、相关系数距离和扩展的杰卡德距离来计算距离。实验结果表明,后3个距离度量相对于欧氏距离可以很大程度地提高聚类效果,其中相关系数距离可以得到较好的结果,余弦距离和扩展的杰卡德距离效果比较一般。(本文来源于《计算机工程与科学》期刊2019年02期)
度量聚类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对模式集成过程中表示不同语义的属性因名称特征和数据实例特征相似而引起的误配问题,提出一种基于信息度量和聚类的模式集成方法。该方法通过构造数据实例的点互信息向量将属性表示到向量空间中,将模式集成问题简化成求解空间中的属性点的相似性问题,进而基于DBSCAN算法对属性进行聚类,有效识别同名异义的属性,同时结合属性的加权相似度对类中误匹配属性进行筛除,提高属性匹配结果的精确度。实验结果表明,该方法能有效地将模式信息与数据实例相结合来取得更准确的匹配结果,可以解决多个异构模式的集成问题。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
度量聚类论文参考文献
[1].王洁,李志民.基于聚类分析的系统性风险度量研究[J].重庆工商大学学报(自然科学版).2019
[2].曹卫东,胡炜.基于信息度量和聚类的模式集成方法[J].现代电子技术.2019
[3].李敏,杨亚锋,李丽红.基于聚类与粒化度量的高效决策表约简[J].电脑知识与技术.2019
[4].李博,张晓,颜靖艺,李可威,李恒.基于值差度量和聚类优化的K最近邻算法在银行客户行为预测中的应用[J].计算机应用.2019
[5].杜实,车雨桐,王利航,任景瑞.基于动态时间规整度量的k均值航迹聚类[J].中国科技论文.2019
[6].王致远.基于相似性度量的高速公路短时交通流聚类与预测研究[D].北京交通大学.2019
[7].邵俊健.高维数据的聚类算法及其距离度量的研究[D].江南大学.2019
[8].陈海兰,高学东.基于波动特征的时间序列相似性度量及聚类分析[J].统计与决策.2019
[9].武旭,杜奕,贾传峻.基于全距离完全度量聚类的交通运输能耗区域划分[J].交通运输系统工程与信息.2019
[10].邵俊健,王士同.高维数据的增量式聚类算法的距离度量选择研究[J].计算机工程与科学.2019