区间型符号数据论文-郭均鹏,赵茹,李汶华

区间型符号数据论文-郭均鹏,赵茹,李汶华

导读:本文包含了区间型符号数据论文开题报告文献综述及选题提纲参考文献,主要关键词:回归分析,区间型符号数据,描述统计量

区间型符号数据论文文献综述

郭均鹏,赵茹,李汶华[1](2018)在《考虑内部散点的区间型符号数据的回归分析》一文中研究指出研究通过对样本"点"数据打包形成的区间型符号数据的回归分析.针对现有区间数回归分析只利用区间数的端点信息这一问题,分析如何充分利用原始的样本"点"数据信息,即区间数的内部散点信息.首先从理论上推导了当假设原始样本点数据误差项满足回归分析所假定的叁条性质时,区间数据回归分析的误差项也满足这叁条性质.然后,在考虑散点的区间型符号数据描述性统计量的基础上,提出了一种新的区间型符号数据回归分析的参数估计方法.随之给出了区间预测方法.最后选取常用的CCRM作为对比算法,分别通过随机模拟和实例分析,验证了文中方法的有效性.(本文来源于《管理科学学报》期刊2018年04期)

高峰[2](2016)在《大数据背景下的规划产业选择研究——基于区间型符号数据因子分析》一文中研究指出产业方向的选择是规划编制中的重要问题。在大数据背景下,从微观角度——海量企业数据入手进行产业分析与选择,为精确决策提供了可能。基于区间型符号数据的因子分析法可以有效针对大数据进行"打包"分析,弥补传统方法的不足。本研究阐述了区间分析在科技规划编制中的优势,介绍了区间型符号数据因子分析方法,并从海量企业基础数据出发,对天津科技规划中产业选择做了实证研究。(本文来源于《未来与发展》期刊2016年03期)

郭崇慧,刘永超[3](2015)在《区间型符号数据的特征选择方法》一文中研究指出对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。(本文来源于《运筹与管理》期刊2015年01期)

王明璐[4](2014)在《一般分布区间型符号数据的SOM聚类分析研究》一文中研究指出随着互联网技术的高速发展和信息化进程加快,社会的数据量呈现爆炸式增长,给传统的数据挖掘和分析技术带来新的挑战。符号数据分析技术(SDA,Symbolic Data Analysis)基于“数据打包”的思想针对海量数据的处理提供了一套知识发现和规律挖掘的理论方法。区间型符号数据是SDA中最常见的一类符号数据,应用也最为广泛。聚类分析作为一种无先验知识情况下对复杂数据关系进行分析处理的技术是数据挖掘技术的一个重要的研究分支,并在符号数据分析领域有着广泛的应用。源自神经网络的自组织映射(SOM,Self-Organizing Map)方法由于其拓扑保序和可视化等特点在聚类分析中有其独特的优势。现有的对区间型符号数据聚类分析的研究,多建立在打包构成区间数的原始数据服从均匀分布的假设的基础上,但实际情况往往不能满足这一理想假设。针对此问题,本文考虑放松原始数据分布的假设,针对一般分布的区间型符号数据的表示方法和距离度量以及在SOM聚类分析中的应用展开研究。首先给出了符号数据的基本概念,重点介绍了区间型符号数据的descriptive statistics,基于一般分布的假设,区别于传统均匀分布假设的区间数,给出了一般分布区间数的定义和特点概括。考虑区间数(Interval)中所包含的个体的分布(distribution of individuals)信息,本文提出了一般分布的区间型符号数据的一种新的表示方法,并阐述了与传统均匀分布的区间型符号数据的表示方法之间的联系与区别。在区间数的新的表示方法的基础上,基于传统的city-block距离给出了一般分布区间型符号数据的距离度量。并基于该距离度量给出了一般分布区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于一般分布假设并采用本文提出的表示方法和距离度量的SOM聚类算法的有效性优于基于均匀分布假设并采用传统Hausdorff距离度量的SOM聚类算法。最后将本文提出的聚类算法在我国的气象数据集上做了应用研究,进一步说明了本文算法可以有效地解决实际问题,具有一定的实用价值。(本文来源于《天津大学》期刊2014-12-01)

刘永超[5](2014)在《区间型符号数据特征选择方法及其应用研究》一文中研究指出随着数据收集和存储技术的不断进步,越来越多的数据出现在各个领域当中。数据的不断丰富加大了对海量数据分析方法和技术的需求。传统的数据分析方法在处理海量数据时,往往计算量很大,且难以从整体上掌握样本的性质。符号数据分析(Symbolic Data Analysis, SDA)技术通过对数据进行压缩处理,在一定程度上克服了传统数据分析方法的缺点。区间型数据作为最常见的一种符号数据,具有重要的研究意义。对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。要对区间型符号数据进行分析,首先要考虑区间数的相似性度量问题。因此,本文首先整理了比较常见的几种区间数相似性度量方法,并对其进行比较分析,发现区间数Hausdorff距离和区间数欧氏距离更符合区间数产生的意义,并将它们作为后续算法度量区间数相似性度量的基础。另外,本文给出了一种新的区间数距离度量方法,可以依据不同的分布调整相应的参数,以更好的表示区间数的意义。然后,由于原有的区间型符号数据特征选择方法不能识别类中心分别相互靠近的特征,所以针对此缺点本文提出了一种新的特征选择方法(FSMSID),该方法通过建立使得样本点与其所在样本类中心相似性与其他类中心相似性均值的差值最大化的优化模型,利用Lagrange乘子法求得区间型符号数据的特征权重,然后基于得到的特征权重构建相应的最近邻分类器,并以分类器的精度来评价所估计特征权重的优劣。在评价分类器的精度时,本文采用了十折交叉验证的方法。最后,为了验证本文方法的有效性,分别在人工生成的数据集和真实数据集进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别与类标号有关的特征。为了验证区间型符号数据分析方法相比于传统点数据处理方法的优越性,将FSMSID方法应用于胎儿心率监测数据集Cardiotocographyo首先要对Cardiotocography数据集做一定的预处理,然后将其转化为区间型符号数据,将FSMSID算法应用于该数据。最后通过与最近邻分类器在精度、时间复杂度上相比较,以验证区间型符号数据分析在处理大规模数据上的优点。此外,为了验证区间型符号数据比仅依靠样本均值表示数据的好处,分别依据所“打包”生成的区间型符号数据和“打包”样本点的均值,产生最近邻分类器,通过比较其对应分类器的分类精度来说明区间型符号数据比较起样本均值的优势。(本文来源于《大连理工大学》期刊2014-06-01)

李汶华,戴晖,郭均鹏,高飒,邓登[6](2013)在《一般分布区间型符号数据的系统聚类》一文中研究指出现有的区间型符号数据的研究大多假定个体在区间内服从均匀分布,实际上往往并非如此.针对该问题,研究了一般分布条件下区间型符号数据的系统聚类方法.阐述了一般分布区间型符号数据的定义,在一般分布的区间型符号数据的描述统计基础上,给出了基于Hausdorff距离的一般分布的区间型符号数据系统聚类算法,并通过随机模拟对聚类有效性进行评价。结果表明:与个体服从均匀分布的假设相比,一般分布的区间型符号数据的系统聚类分析有效性更好.最后将文中方法应用于电子商务客户价值的评价,进行了应用研究.(本文来源于《数理统计与管理》期刊2013年06期)

郭均鹏,陈颖,李汶华[7](2013)在《一般分布区间型符号数据的K均值聚类方法》一文中研究指出对于区间型符号数据聚类分析的研究,现有方法大多假设个体在区间内服从均匀分布,这往往并不符合实际情况.针对此问题,研究一般分布的区间型符号数据K均值聚类方法,给出了一般分布区间型符号数据的定义,并基于经验分布理论研究其描述统计.基于Hausdorff距离,考虑区间数所包含个体的分布信息,提出了一种新的区间型符号数据距离度量.给出了一般分布的区间型符号数据K均值聚类算法.通过随机模拟试验对该方法进行了有效性评价,结论表明,在各种实验设计的条件下,考虑一般分布的K均值聚类算法有效性均优于均匀分布假设下的K均值聚类算法.最后将文中方法应用于汽车的聚类分析,进一步体现了文中方法在解决实际问题中的优势.(本文来源于《管理科学学报》期刊2013年03期)

陈颖[8](2012)在《一般分布式与区间型符号数据的动态聚类分析研究》一文中研究指出互联网技术的高速发展带来了数据的极大丰富,然而传统的聚类分析技术在面对如此庞大的样本空间时存在着局限性。符号数据分析产生于上个世纪80年代,它是针对海量数据进行知识发现和规律挖掘的一套理论方法。聚类作为一种解释复杂数据关系的技术在符号数据分析领域有着广泛的应用。但现有符号数据聚类分析的研究大多假设个体在区间内服从均匀分布,这往往并不符合实际情况。针对此问题,本文对一般分布的分布式符号数据和区间型符号数据动态聚类方法展开研究。首先给出了两种常用的符号数据的定义——分布式符号数据和区间型符号数据,随后对分布式符号数据的聚类分析进行了一些探索性研究,包括分布式符号数据的形成,一般分布情况下的距离度量,以及动态聚类算法等。以鸢尾属植物数据集为例,将其分组形成符号对象,并在其上进行动态聚类分析研究,以说明本算法的实用性。考虑区间数所包含个体的分布信息,基于Hausdorff距离提出了一种新的多维区间型符号数据距离度量。基于此,给出一般分布的区间型符号数据动态聚类算法。通过随机模拟试验对文中方法进行有效性评价,结论表明,在各种实验设计的条件下,考虑一般分布的动态聚类算法有效性均优于均匀分布假设下的动态聚类算法。最后将文中方法应用于汽车的聚类分析,进一步体现了文中方法在解决实际问题中的优势。本文针对多维分布式符号数据和区间型符号数据分别提出了动态聚类算法,并运用聚类有效性指标对其评价。应用研究结果表明,无论对于分布式符号数据或是区间型符号数据,本文所提出的一般分布的前提条件下的动态聚类分析方法较之均匀分布假设下的传统方法更有效也更客观。(本文来源于《天津大学》期刊2012-12-01)

郭均鹏,宁静,史志奇[9](2013)在《基于区间型符号数据的群组推荐算法研究》一文中研究指出传统群组推荐算法基于点数据描述群组用户模型,存在着信息缺失、很难统筹考虑所有个体用户的需求等问题。针对该问题,对个体评分数据按照符号数据分析的思想进行"打包",将群组成员的评分信息汇总为区间型符号数据。在Hausdorff距离基础上,采用区间内部点数据的描述统计量,提出了一种全新的区间数距离度量方法,并利用这种距离对区间型符号数据描述的群组实施K-均值聚类,由此确定相似群组,最后通过最近邻的评分预测目标群组的评分。将这种全新的群组推荐算法与传统方法进行推荐精度与效率的对比实验,结果表明,在各种实验条件下,基于区间型符号数据的群组推荐算法均优于传统点数据的群组推荐算法。(本文来源于《计算机应用研究》期刊2013年01期)

郭均鹏,李汶华,高峰[10](2011)在《一般分布区间型符号数据的描述统计与分析》一文中研究指出以对大规模个体数据通过打包形成的区间型符号数据为研究对象,针对个体在区间内往往不服从均匀分布的实际情况,研究一般分布的区间型符号数据的描述统计和分析方法.对符号数据分析进行了概述,并定义了一般分布的区间变量.研究了一般分布的区间变量的经验分布函数和经验联合分布函数.在此基础上,讨论了一般分布区间变量的描述统计量的求解.最后给出了算例,运用一般分布区间型符号数据的因子分析方法.以中国股市为背景进行了应用研究.结论表明:以往研究基于均匀分布假设所给出的描述统计量的计算,可看作文中所给求解公式的特例.另外,研究方法基于经验分布理论,无需知道个体在区间内服从分布函数的具体表达式,且在计算过程中充分利用了区间内的个体信息.(本文来源于《系统工程理论与实践》期刊2011年12期)

区间型符号数据论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

产业方向的选择是规划编制中的重要问题。在大数据背景下,从微观角度——海量企业数据入手进行产业分析与选择,为精确决策提供了可能。基于区间型符号数据的因子分析法可以有效针对大数据进行"打包"分析,弥补传统方法的不足。本研究阐述了区间分析在科技规划编制中的优势,介绍了区间型符号数据因子分析方法,并从海量企业基础数据出发,对天津科技规划中产业选择做了实证研究。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

区间型符号数据论文参考文献

[1].郭均鹏,赵茹,李汶华.考虑内部散点的区间型符号数据的回归分析[J].管理科学学报.2018

[2].高峰.大数据背景下的规划产业选择研究——基于区间型符号数据因子分析[J].未来与发展.2016

[3].郭崇慧,刘永超.区间型符号数据的特征选择方法[J].运筹与管理.2015

[4].王明璐.一般分布区间型符号数据的SOM聚类分析研究[D].天津大学.2014

[5].刘永超.区间型符号数据特征选择方法及其应用研究[D].大连理工大学.2014

[6].李汶华,戴晖,郭均鹏,高飒,邓登.一般分布区间型符号数据的系统聚类[J].数理统计与管理.2013

[7].郭均鹏,陈颖,李汶华.一般分布区间型符号数据的K均值聚类方法[J].管理科学学报.2013

[8].陈颖.一般分布式与区间型符号数据的动态聚类分析研究[D].天津大学.2012

[9].郭均鹏,宁静,史志奇.基于区间型符号数据的群组推荐算法研究[J].计算机应用研究.2013

[10].郭均鹏,李汶华,高峰.一般分布区间型符号数据的描述统计与分析[J].系统工程理论与实践.2011

标签:;  ;  ;  

区间型符号数据论文-郭均鹏,赵茹,李汶华
下载Doc文档

猜你喜欢