时态数据流论文-孟志青,许微微

时态数据流论文-孟志青,许微微

导读:本文包含了时态数据流论文开题报告文献综述及选题提纲参考文献,主要关键词:时态文本模型,文本数据流,特征快速提取,实时挖掘算法

时态数据流论文文献综述

孟志青,许微微[1](2019)在《时态文本数据流特征流行趋势模型及算法》一文中研究指出当今在电商和社交等平台上每天会产生大量的文本数据流。快速提取文本数据流的特征并将其用于发现一些事物的趋势变化来指导企业运营十分重要,比如服装企业必须尽可能快速而又准确地感知流行信息,服装特征的流行趋势对设计生产与经营起着至关重要的作用。以线上商品的文本数据流为研究对象,结合线上的销售文本实时数据流,定义了商品的时态文本数据流特征趋势模型,然后提出了一种文本数据流特征趋势发现的实时挖掘算法。将该算法应用到服装销售的文本描述以提取流行特征应用,可以获得有效的服装流行趋势,为企业制定生产计划、选择营销策略提供了决策支持。使用电商平台的真实销售数据进行实验,结果证明:该算法提取流行特征的准确率较高、速度较快,具有重要的理论与实际意义。(本文来源于《计算机科学》期刊2019年S1期)

陈羽中,郭松荣,郭昆,李国辉,林魏超[2](2018)在《基于时态密度特征的改进数据流聚类算法》一文中研究指出针对经典Clu Stream聚类算法的在线微簇聚类过程中限制微簇数量的增长,对微簇进行强制合并,使其在线聚类结果受到影响,导致数据流聚类质量不高,且难以适应海量大数据等问题,提出一种基于时态密度特征的改进Clu Stream聚类算法.首先,提出微簇时态密度的概念,并用其对微簇进行描述;其次,提出新的微簇删除、合并的机制,能够根据在线微簇的情况动态地添加微簇的数量;最后,应用并行化的框架将算法并行化,以适应海量实时大数据的需求.通过在人工数据集和真实数据集上的对比实验表明,改进后的数据流聚类算法相较于Clu Stream算法能够得到更高质量的聚类结果.(本文来源于《小型微型计算机系统》期刊2018年01期)

张玲波,甘元科,石刚,王生原,董渊[3](2014)在《同步数据流语言时态消去的可信翻译》一文中研究指出为解决实现同步数据流语言Lustre到串行命令式语言C语言可信编译器过程中碰到的时态运算翻译的困难,提出了将所有的时态运算翻译单独分层定义和证明的方法。在同步数据流语言的时态特性和C语言的循环特性分析的基础上,结合可信编译器实现框架上下层的语言结构,使用Coq证明工具,形式化的定义了两种中间语言的语法和语义,经过分析时态翻译过程特点,归纳定义了时态变量传递性质,实现了翻译工作严格的形式化验证,最终完成了时态消去翻译的等价性证明。(本文来源于《计算机工程与设计》期刊2014年01期)

杨宁,唐常杰,王悦,陈瑜,郑皎凌[4](2010)在《一种基于时态密度的倾斜分布数据流聚类算法》一文中研究指出为解决倾斜分布的数据流聚类这一难题,提出了时态密度概念,给出其度量,揭示了其包括可增量计算在内的一系列数学性质;设计了时态密度树结构,提高了聚类时的存储和检索效率;设计了能够以实时或异步方式捕捉数据倾斜分布的数据流时态特征的聚类算法TDCA(temporal density based clustering algorithm),其时间复杂度为O(c×m×lgm).实验结果表明,该算法不仅有较强的功能,而且具有较好的规模可伸缩性.(本文来源于《软件学报》期刊2010年05期)

张锡琴[5](2009)在《时态数据流的增量聚类算法研究及其应用》一文中研究指出聚类分析是数据挖掘领域一项重要的研究课题。近年来,随着计算机和应用技术的高速发展,人们获得数据的能力有了极大的提高,同时获得的数据途径也越来越多。数据流(data stream)作为一种特殊的数据来源,越来越备受关注。如WEB点击流、气象观测信息流、电话记录信息流、卫星数据流等。由于数据流的数据量无限、对算法的响应要求很高,而且通常只能对数据访问一次,而传统的聚类算法对快速变化的数据流进行在线分析的支持存在着很多限制,因此急需开发适应数据流环境的聚类算法。计算机工作者们面临着新的挑战。本文针对时态数据流进行了研究,给出了时态数据流的概念和定义,同时在subspace a-cluster的基础上提出了TMSC(temporalmultiple-dimension subspace cluster)聚类算法来查找聚类,该算法采用了滑动窗口的形式,使得算法能保证无须针对所有时间点的数据同时进行聚类,减少了算法所需空间开销;同时有增量保持阶段,增量阶段无须重复计算之前的数据,只需处理新到达的相关数据,因此增量处理快;最后把算法用Java实现后,应用到了股票数据中,通过不同的参数设置,找到了不同时间段的聚类,有其一定意义。TMSC算法的主要创新之处为:1)从只能处理单维数据流扩展到了多维数据流;2)改进了聚类剪枝标准;3)对从m-level查找m+1-level的聚类给出了明确的定义和证明;4)发现了原先算法在增量更新阶段将会漏掉的聚类结果,通过保留所有聚类结果,解决了这一问题。(本文来源于《浙江工业大学》期刊2009-01-01)

时态数据流论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对经典Clu Stream聚类算法的在线微簇聚类过程中限制微簇数量的增长,对微簇进行强制合并,使其在线聚类结果受到影响,导致数据流聚类质量不高,且难以适应海量大数据等问题,提出一种基于时态密度特征的改进Clu Stream聚类算法.首先,提出微簇时态密度的概念,并用其对微簇进行描述;其次,提出新的微簇删除、合并的机制,能够根据在线微簇的情况动态地添加微簇的数量;最后,应用并行化的框架将算法并行化,以适应海量实时大数据的需求.通过在人工数据集和真实数据集上的对比实验表明,改进后的数据流聚类算法相较于Clu Stream算法能够得到更高质量的聚类结果.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

时态数据流论文参考文献

[1].孟志青,许微微.时态文本数据流特征流行趋势模型及算法[J].计算机科学.2019

[2].陈羽中,郭松荣,郭昆,李国辉,林魏超.基于时态密度特征的改进数据流聚类算法[J].小型微型计算机系统.2018

[3].张玲波,甘元科,石刚,王生原,董渊.同步数据流语言时态消去的可信翻译[J].计算机工程与设计.2014

[4].杨宁,唐常杰,王悦,陈瑜,郑皎凌.一种基于时态密度的倾斜分布数据流聚类算法[J].软件学报.2010

[5].张锡琴.时态数据流的增量聚类算法研究及其应用[D].浙江工业大学.2009

标签:;  ;  ;  ;  

时态数据流论文-孟志青,许微微
下载Doc文档

猜你喜欢