整体查询论文-陈爽

整体查询论文-陈爽

导读:本文包含了整体查询论文开题报告文献综述及选题提纲参考文献,主要关键词:XML,结点分发,MapReduce,Twig查询处理

整体查询论文文献综述

陈爽[1](2015)在《基于结点分发的分布式Twig整体匹配查询处理算法的研究与实现》一文中研究指出XML已成为Web数据交换和信息表示的事实标准。随着XML数据量的急剧增长,如何对这些正在快速增长的海量XML数据有效地组织和存储,并提供高效快速的数据检索,是当今数据挖掘领域的一个研究重点。目前,XML数据的存储和检索一般还使用原生的XML数据库或者关系数据库,但这类系统无法满足海量XML数据的性能要求,而基于分布式的XML数据存储和检索技术也尚未成熟。MapReduce的出现在一定程度上缓解了上述问题。MapReduce是一种处理海量数据的有效解决方案,但是基于该框架处理海量XML数据查询问题的研究成果却很少,而且现有的分布式Twig查询算法在Map阶段需要做结构连接操作,大多会产生大量无用的中间结果,此外,这种算法往往还需要额外的查询分解操作。针对以上问题,本文提出了两种基于结点分发的查询方案:NDTH算法和DTH算法,实现海量XML数据的Twig查询处理。本文提出的两种查询方案基于结点分发的思想,即在Map阶段不做结构连接操作,而是将处于不同分片上但却可能构成查询解的结点分发到一台Reduce计算节点上,这样在Reduce阶段就可以根据查询模式的特点,选择适合该查询且性能最优的整体匹配算法,如选用对祖先后代关系性能最优或父子关系最优的整体匹配算法等。本文首先基于ComMapReduce提出了 NDTH算法,该算法利用ComMapReduce的协调者节点收集全局的键值,通过全局键值能够舍弃那些不能构成最终查询解的结点,进而提高查询效率,同时保证最终查询结果不丢失。其次,本文通过对XML数据结构和MapReduce工作原理的研究,分析了现有基于MapReduce的XML查询处理方法中,文档分片技术的局限性,提出了松弛分割算法(Relax-Fragment)。该算法能够实现对XML文档的任意分割而不需要依赖查询信息。在松弛分片策略RFS的基础上,我们设计了基于松弛分片的DTH算法,该算法利用记录了分片祖先信息的松弛分片索引,能够加快查询速度,保证并行查询结果的正确性和完整性。最后,本文采用真实数据集进行实验,对本文所提的两种分布式Twig查询处理算法的实验结果进行了详细分析。本文实验结果表明,分布式NDTH算法和DTH算法能够减少海量XML数据查询处理时间,具有较高的查询效率和良好性能。(本文来源于《东北大学》期刊2015-06-01)

王鹏,张晓琳[2](2013)在《基于序列的不确定XML整体小枝查询技术》一文中研究指出针对基于序列的不确定XML小枝模式匹配算法需要子序列匹配和结构过滤两个阶段,而导致查询效率低的问题,提出一种以PrTRIM算法为基础的整体小枝模式匹配算法。H-PrTRIM算法将PrTRIM算法中子序列匹配和结构过滤两个阶段合并,在子序列匹配的同时进行结构过滤,使子序列匹配得到的结果就是查询的最终结果,解决了由于子序列匹配产生过多的中间结果而降低查询效率的问题。实验结果表明,H-PrTRIM算法的效率高于PrTRIM算法,应用于查询大文档和结构复杂的查询语句时更能体现出优势。(本文来源于《电子科技》期刊2013年11期)

付林林,廖湖声,高红雨,陈荣鑫[3](2011)在《采用流水线方式的XML整体小枝查询方案》一文中研究指出随着XML在数据交换和数据表示领域扮演着越来越重要的角色,近年来,为了提高小枝查询的效率,研究人员提出了多种方案,然而一些方法没有考虑如何利用多核计算资源;一些方法需要预先掌握XML数据整体拓扑结构.为了高效实现XML整体小枝查询,TwigPipe算法采用流水线方式,并提出了新的数据划分策略和查询算法,结合更为简单的数据中间表示形式以及预先枚举机制,TwigPipe算法能够有效地提高查询效率和降低内存需求.(本文来源于《计算机研究与发展》期刊2011年S3期)

付林林[4](2011)在《采用流水线方式的XML整体小枝查询算法的研究》一文中研究指出目前,XML已经在互联网环境中扮演着越来越重要的角色,逐渐成为各种各样数据的存储、交换和表示标准。为了满足查询和处理XML数据的需求,W3C发布了XQuery语言正式推荐标准,作为针对XML数据的查询与处理规范。XQuery语言是一种功能强大的XML查询与处理语言,其地位类似于关系数据库中的SQL语言,适用于来自不同XML数据源的信息,能够从XML中提取出所需数据,进而重构为指定的结构。在XQuery语言表示的查询中,针对XML数据结构特征进行查询是实际应用中最基本和最常见的操作,也是时空开销最大的操作之一,其查询性能对XQuery程序的执行效率有着重要影响。这些结构查询可以提取成为小枝模式(Twig Pattern),而后采用小枝查询(Twig Query)技术,通过匹配算法获取XML数据中全部满足模式结构的XML数据。随着XML应用的不断扩展和深入,相应的XQuery程序愈加复杂,XML数据规模愈加庞大。因此,XQuery程序的执行效率变得日益重要,如何通过优化手段提高查询与处理效率具有很重大的研究意义。近年来,为了提高小枝查询的效率,研究人员提出了多种方案,然而这些方案中有些没有考虑如何利用多核计算资源,有些则需要预先掌握XML数据整体拓扑结构。为了高效实现XML整体小枝查询,本课题提出了新的TwigPipe算法。TwigPipe算法基于流水线方式,采用了新的数据划分算法和查询算法,结合了更为简单的数据中间表示形式以及新的预先枚举机制,能够仅仅通过一遍扫描完成查询操作。另一方面,根据XML数据特点,本文提出了多种优化方法,用来支持针对不同数据的复杂查询,实验结果表明,TwigPipe算法有效提高了查询效率和降低内存需求。(本文来源于《北京工业大学》期刊2011-05-01)

何玲玲[5](2009)在《查询接口整体模式匹配技术的研究》一文中研究指出查询接口模式匹配是深网数据集成相关技术研究的难点和突破点,整体模式匹配技术已经成为查询接口模式匹配领域的热点课题。查询接口整体模式匹配技术可以同时匹配同一领域的所有模式,从而大大提高匹配效率。本文在综合分析国内外有关整体模式匹配技术研究现状的基础上,对查询接口整体模式匹配技术进行了更深入的研究。首先,针对属性预处理阶段中的属性字符匹配问题,提出了改进的WPrimeAtt算法,该算法引入主题数据集属性权值到属性素数化过程中,使改进的算法不在依赖阈值并且可以确保属性集合的稳定性,并给出算法的理论证明和实例分析。其次,针对整体模式匹配阶段中的组属性挖掘和同义词匹配问题,提出了改进的GroupAttMining算法和Discoverysynonym算法,该算法基于属性正关联关系和负关联关系公式实现属性间的复杂模式匹配和简单模式匹配,并给出算法的理论证明和实例分析。再次,针对整体模式匹配中的概念划分建立问题,提出了概念划分问题的优化版本及最优模式模型的概念,并证明概念划分是NP完全的定理和整体模式匹配是NP完全的定理,在此基础上提出了Concept-partition算法和HSM算法来实现概念划分建立和整体模式匹配,并给出算法的理论证明和实例分析。最后,对上述算法进行了实验验证,给出实验结果图表,并对实验的结果进行了分析和比较,验证了算法的正确性。(本文来源于《燕山大学》期刊2009-12-01)

整体查询论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对基于序列的不确定XML小枝模式匹配算法需要子序列匹配和结构过滤两个阶段,而导致查询效率低的问题,提出一种以PrTRIM算法为基础的整体小枝模式匹配算法。H-PrTRIM算法将PrTRIM算法中子序列匹配和结构过滤两个阶段合并,在子序列匹配的同时进行结构过滤,使子序列匹配得到的结果就是查询的最终结果,解决了由于子序列匹配产生过多的中间结果而降低查询效率的问题。实验结果表明,H-PrTRIM算法的效率高于PrTRIM算法,应用于查询大文档和结构复杂的查询语句时更能体现出优势。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

整体查询论文参考文献

[1].陈爽.基于结点分发的分布式Twig整体匹配查询处理算法的研究与实现[D].东北大学.2015

[2].王鹏,张晓琳.基于序列的不确定XML整体小枝查询技术[J].电子科技.2013

[3].付林林,廖湖声,高红雨,陈荣鑫.采用流水线方式的XML整体小枝查询方案[J].计算机研究与发展.2011

[4].付林林.采用流水线方式的XML整体小枝查询算法的研究[D].北京工业大学.2011

[5].何玲玲.查询接口整体模式匹配技术的研究[D].燕山大学.2009

标签:;  ;  ;  ;  

整体查询论文-陈爽
下载Doc文档

猜你喜欢