导读:本文包含了分布式符号数据论文开题报告文献综述及选题提纲参考文献,主要关键词:分布式符号数据,区间型符号数据,一般分布,符号数据分析
分布式符号数据论文文献综述
陈颖[1](2012)在《一般分布式与区间型符号数据的动态聚类分析研究》一文中研究指出互联网技术的高速发展带来了数据的极大丰富,然而传统的聚类分析技术在面对如此庞大的样本空间时存在着局限性。符号数据分析产生于上个世纪80年代,它是针对海量数据进行知识发现和规律挖掘的一套理论方法。聚类作为一种解释复杂数据关系的技术在符号数据分析领域有着广泛的应用。但现有符号数据聚类分析的研究大多假设个体在区间内服从均匀分布,这往往并不符合实际情况。针对此问题,本文对一般分布的分布式符号数据和区间型符号数据动态聚类方法展开研究。首先给出了两种常用的符号数据的定义——分布式符号数据和区间型符号数据,随后对分布式符号数据的聚类分析进行了一些探索性研究,包括分布式符号数据的形成,一般分布情况下的距离度量,以及动态聚类算法等。以鸢尾属植物数据集为例,将其分组形成符号对象,并在其上进行动态聚类分析研究,以说明本算法的实用性。考虑区间数所包含个体的分布信息,基于Hausdorff距离提出了一种新的多维区间型符号数据距离度量。基于此,给出一般分布的区间型符号数据动态聚类算法。通过随机模拟试验对文中方法进行有效性评价,结论表明,在各种实验设计的条件下,考虑一般分布的动态聚类算法有效性均优于均匀分布假设下的动态聚类算法。最后将文中方法应用于汽车的聚类分析,进一步体现了文中方法在解决实际问题中的优势。本文针对多维分布式符号数据和区间型符号数据分别提出了动态聚类算法,并运用聚类有效性指标对其评价。应用研究结果表明,无论对于分布式符号数据或是区间型符号数据,本文所提出的一般分布的前提条件下的动态聚类分析方法较之均匀分布假设下的传统方法更有效也更客观。(本文来源于《天津大学》期刊2012-12-01)
高峰[2](2009)在《一般区间与分布式符号数据的PCA研究》一文中研究指出传统的主成分分析主要针对点数据,面对信息社会知识爆炸、信息量倍增的现象,传统的分析方法在处理海量数据,从整体上把握数据属性方面有所欠缺,符号数据分析方法通过“数据打包”,实现了从整体上把握海量数据内部之间的关系。本文主要研究一般分布的区间型符号数据和分布式符号数据的主成分分析和因子分析。在现有的针对均匀分布区间数据作主成分分析(PCA)的研究成果基础上,本文从区间变量的经验密度函数入手,逐步推导了区间变量的均值、方差、协方差、相关系数等描述性统计量,继而研究了区间数据的标准化问题。在此基础上,进行了主成分分析和因子分析的方法研究。依次以中国股市不同类股票和不同市值范围股票为符号对象,以市场表现和财务报表相关指标为变量,进行了案例分析。对分布式符号数据的主成分分析和因子分析进行了一些探索研究,包括分布式符号数据的形成,分布式符号数据的标准化,分布式数据的主成分分析和因子分析等等。以中国股市不同类股票为符号对象,以市场表现和财务报表相关指标为变量,形成分布式符号数据,进行了案例分析。研究结论表明,与以往文献假设样本点在区间内服从均匀分布相比,一般分布的区间型符号数据PCA方法更具有实际意义,而分布式符号数据的PCA方法则是对符号数据分析方法体系的进一步完善。(本文来源于《天津大学》期刊2009-05-01)
分布式符号数据论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
传统的主成分分析主要针对点数据,面对信息社会知识爆炸、信息量倍增的现象,传统的分析方法在处理海量数据,从整体上把握数据属性方面有所欠缺,符号数据分析方法通过“数据打包”,实现了从整体上把握海量数据内部之间的关系。本文主要研究一般分布的区间型符号数据和分布式符号数据的主成分分析和因子分析。在现有的针对均匀分布区间数据作主成分分析(PCA)的研究成果基础上,本文从区间变量的经验密度函数入手,逐步推导了区间变量的均值、方差、协方差、相关系数等描述性统计量,继而研究了区间数据的标准化问题。在此基础上,进行了主成分分析和因子分析的方法研究。依次以中国股市不同类股票和不同市值范围股票为符号对象,以市场表现和财务报表相关指标为变量,进行了案例分析。对分布式符号数据的主成分分析和因子分析进行了一些探索研究,包括分布式符号数据的形成,分布式符号数据的标准化,分布式数据的主成分分析和因子分析等等。以中国股市不同类股票为符号对象,以市场表现和财务报表相关指标为变量,形成分布式符号数据,进行了案例分析。研究结论表明,与以往文献假设样本点在区间内服从均匀分布相比,一般分布的区间型符号数据PCA方法更具有实际意义,而分布式符号数据的PCA方法则是对符号数据分析方法体系的进一步完善。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
分布式符号数据论文参考文献
[1].陈颖.一般分布式与区间型符号数据的动态聚类分析研究[D].天津大学.2012
[2].高峰.一般区间与分布式符号数据的PCA研究[D].天津大学.2009