导读:本文包含了小枝模式查询论文开题报告文献综述及选题提纲参考文献,主要关键词:不确定XML,P-文档,分布节点,区间编码
小枝模式查询论文文献综述
刘立新,张晓琳,吕庆,张换香,褚艳华[1](2013)在《一种非归并不确定XML小枝模式查询算法》一文中研究指出针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的普通节点进行编码,用一定规则对分布节点进行标识;查询时采用公共分布节点路径的方法处理分布结点,最后结合最低公共祖先节点的概率计算查询结果的概率值。理论分析和实验结果证明了ProTwigList算法的查询效率。(本文来源于《计算机科学》期刊2013年05期)
邓光超[2](2012)在《基于XML数据的小枝模式查询算法研究》一文中研究指出随着信息技术的迅猛发展,可扩展标记语言(XML)已经成为网络数据表示和交换事实上的标准,越来越多的XML数据成为信息共享的载体。大量XML数据的涌现促进了XML数据库技术的快速发展,小枝模式查询处理作为XML查询处理模块的核心组件,成为众多学者研究的热点问题。本文主要研究高效的小枝模式查询处理问题,主要研究内容如下:首先,深入分析和比较了现有小枝模式匹配算法的特点,并总结了每个算法的适用领域以及存在的问题。在小枝模式的分支结点和其子结点之间只存在祖先/后代关系的情况下,TwigStack算法和TJFast算法才能达到最优性,并且在处理查询时需要先对小枝模式进行分解求出局部匹配结果,然后再进行合并导致出现了大量的中间冗余结果,增加了额外的开销。此外,由于通过元素编码不能直接求出所需的元素信息,导致单个元素的处理代价比较高,影响了整体查询效率。其次,在Dewey编码的基础上增加路径索引,提出了一种新的编码方案,该编码方案可以根据编码求出元素标签和祖先结点而不依赖于有限状态转换器FST,从而减少元素处理代价。针对已有方法查询效率低下的问题,采用新的编码方案提出了一种新的查询算法—TJPath,通过降低单个元素的处理代价提升了整体查询效率。最后,提出了一个实验系统,并在此基础上实现了TwigStack、TJFast、TJPath算法。通过对实验数据在扫描元素数量、处理时间、扩展性等性能指标方面的对比验证了本文提出方法的高效性。(本文来源于《燕山大学》期刊2012-05-01)
白山,陶世群[3](2012)在《一种XML数据流小枝模式查询算法》一文中研究指出针对传统XML文档小枝模式查询算法系统开销大的问题,提出一种XML数据流小枝模式查询算法。该算法结合SAX数据流解析技术,将层次关系队列结构应用于XML文档查询中,采用动态生成区间编码的方式,免除建立编码索引文件的步骤。实验结果表明,在对相关数据集进行查询时,该算法可减少I/O操作,缩短查询响应时间,提高查询效率。(本文来源于《计算机工程》期刊2012年06期)
赵圣猛,赵雷[4](2011)在《一种采用扩展Dewey编码非归并的小枝模式查询算法》一文中研究指出小枝模式查询是XML查询中重要的操作,已经有许多种算法提出,如TwigStack和TJFast算法等,但是他们都是基于归并思想的,不能避免大量的不必要的路径归并.本文提出的TwigWM(Twig Without Merging)算法使用部分栈与链表的结构来实现非归并查询,由于从扩展Dewey编码中能够直接得到祖先元素结点的编码,所以TwigWM算法采用扩展Dewey编码.实验结果表明,TwigWM算法要优于TJFast、Twig2Stack等算法.(本文来源于《小型微型计算机系统》期刊2011年05期)
刘仲燕[5](2011)在《基于DTD的XML小枝模式近似匹配查询问题的研究》一文中研究指出Internet发展到今天已经渗入到人们生活工作的各方面。XML(半结构化语言)已经成为一种最重要的数据载体,在Web服务、电子商务、数字图书馆等诸多网络相关应用领域已经成为描述数据的事实上的标准。近年来,如何对XML数据进行有效的管理和查询,以及如何方便用户从海量的XML数据中提取他们所需要的信息,受到越来越多的当今国内外学者的关注。因此,许多对XML数据查询算法的研究应运而生,从而使得XML数据查询成为XML数据管理领域的一个热点。本文从XML数据库系统最便于用户使用的角度出发,透彻分析了目前存在小枝查询技术与以及其面临的不足。通过研究本文提出了一种新的小枝连接算法,该算法不仅仅满足严格匹配,也满足用户对DTD模式信息了解不够透彻,而查询目标确定情况下的用户查询需求,实现灵活匹配。本文的主要工作和创新点有以下几个方面:1.介绍了XML文档模型基本知识以及结点编码方案,介绍了小枝查询的研究现状以及存在的不足。根据本文查询算法的特点,采用了前缀编码和扩展的前缀编码方式。2.本文提出的基于DTD的目标路径近似匹配结构连接算法(FTJ),首先利用前缀编码对DTD节点进行编码,检查DTD中有无与查询路径近似匹配的目标路径,得到近似匹,配的小枝查询Q,然后再调用TJFAST.通过将经典小枝连接进行的数据集对比实验的结果来看,对本文提出的算法能够最大程度的满足用户需求。该算法包括目标结点预处理和小枝查询模式匹配两部分。并通过实验给予了性能验证。3.在前两点研究的基础上,提出、设计了一种基于DTD的目标路径近似匹配结构连接改进算法。该算法是在FTJ算法基础上的改进,增加了小枝的条件分支部分预处理,使算法的通用性得以提高。本文对如何有效而灵活查询XML数据库进行了研究,为更好的解决此问题提供一种行之有效的思路和方法。本文的研究是基于目前XML查询领域中应用中比较热点的小枝连接的技术,提出更灵活的查询算法以满足用户多变的查询策略,这使本文课题研究既具有探索性的理论研究价值,也具有一定的应用价值和现实意义。(本文来源于《山东大学》期刊2011-04-20)
江锦华,吴羽,胡天磊,陈刚[6](2011)在《基于路径连接的XML复杂小枝模式查询处理》一文中研究指出针对可扩展标记语言(XML)查询中具有嵌套OR谓词的复杂小枝模式查询处理,提出一种基于路径连接的查询方法.该方法以路径为分解粒度,结合分支扩展(AOBE)的概念,通过路径连接过程实现对复杂小枝模式查询的整体处理.为了进一步提高算法效率,在已有研究的基础上挖掘相应的优化规则,利用索引跳过那些明显不参与连接的元素的访问和计算.与已有算法相比,基于路径连接的查询方法大大简化了复杂小枝模式查询处理过程,只访问查询叶节点对应的元素,可以显着减少结构连接的操作数目和扫描元素的个数.实验结果表明,该方法能够有效地改善复杂小枝模式查询处理的性能.(本文来源于《浙江大学学报(工学版)》期刊2011年01期)
武文英[7](2010)在《基于小枝模式的XML数据查询处理技术研究》一文中研究指出自1998年XML诞生之日起,XML这种特殊的半结构化标记语言就被广泛地应用于很多领域之中,如今,XML也已经成为Internet上的数据表示和交换的一种标准格式。随着XML技术的日益普及,对于XML数据的有效管理问题,如XML数据的存储管理、编码、查询处理、查询优化、索引技术引起了国内外众多学者的关注,其中对于查询处理的研究是目前研究的重点之一。为了实现对XML数据的高效查询,现已提出了很多种XML的编码方式及其查询匹配算法。对于XML数据的查询匹配,大体上可以分为两大类:结构连接和整体小枝模式匹配。结构连接的处理算法基本是将小枝模式分解为一系列由两个结点对组成的子树,然后分别对每一棵子树进行结构连接,最终将这些中间结果连接起来实现小枝模式的查询。而整体小枝模式匹配是将整个小枝模式作为一个整体来进行处理,这样就可以大大减少不必要的中间结果的生成。本文聚焦在小枝模式查询处理算法。鉴于大多数的查询处理算法总会产生很多无用的中间结果,本文提出了一种新的小枝模式匹配算法——PSBDirect,该算法是在PSB编码的基础上提出的,其充分利用了前缀编码和素数编码的优越特性来快速判定结点之间的位置关系,对一些不参与到最终查询结果中的结点不进行遍历,从而提高了小枝模式查询处理的效率。此外,对于XML数据库系统,往往需要同时处理多个小枝模式匹配查询,而这些查询之间或多或少存在某些相似性。本文通过将多个小枝模式进行重构,然后对现有的TJFast算法进行改进以实现对于多个小枝模式的同时查询,这样可以大大减少对XML文档的遍历,同时也就提高了查询处理的效率。(本文来源于《天津理工大学》期刊2010-12-01)
王瑞[8](2010)在《基于有序对的XML小枝模式查询处理研究》一文中研究指出随着Internet的发展,半结构化的数据在信息交换中越来越重要,如何准确、高效地查询XML数据已经成为研究的热点问题。XML文档可以用一棵嵌套的文档树来表示,查询路径也可以表示成一棵查询树即小枝模式,因此XML数据的查询就是从XML文档树中查找出所有满足小枝模式的XML数据片段,这个过程就叫做小枝模式查询。近年来,研究工作者提出了很多匹配小枝模式的查询算法:如TwigStack算法以及最近提出的TwigList和TwigNM算法等。小枝模式中包含有父子边和祖先后裔边两种,这些算法对仅含祖先后裔边的小枝模式查询是很有效的,但是当小枝模式中仅含父子边或同时含有祖先后裔和父子边时,这些算法仍可能产生大量的中间结果,尤其是输入和输出的规模很大时。针对目前算法存在的不足之处,通过结合ViST算法中利用字符串匹配查询从而不需要结构连接的思想,以及Twig2Stack算法中自底向上和不需合并的思想,本文提出了两种基于有序对的小枝模式匹配算法PCTwig和OPTwig,所做的主要工作如下:(1)提出了一种基于有序对的新思路,通过有序对的建立更好地将结点与结点连接起来。利用查询树和文档树中有序对的匹配来进行查询。(2)针对小枝模式中的叁种结点:根结点、中间结点和叶子结点,提出叁种不同的匹配方法。又根据小枝模式中结点间的两种关系:父子关系和祖先后裔关系,构造了MatchPC和MatchAD函数。(3)提出了两种新算法PCTwig和OPTwig,对文档树和查询树的存储结构进行了规定。对查询树进行自底向上的存储,在碰到分支结点时,进行标记。这样可以在查询过程中对分支进行判断,从而避免无用结点的产生。(4)在实验系统上把两种新算法与经典算法TwigStack和TwigStackList算法进行了比较,证明了PCTwig和OPTwig算法的有效性。(本文来源于《山西大学》期刊2010-06-01)
胡江明[9](2010)在《XML数据编码与小枝模式查询的研究》一文中研究指出目前,随着XML相关标准和技术的不断推广和应用,各领域出了大量的XML数据,特别是在Web上。有大量显而易见的事实表明:XML已经成为数据表示和交换的标准。大量XML文档的出现促进了XML数据库的研究,包括XML数据的存储、索引技术、查询处理技术和查询优化技术,其中索引技术之编码机制和查询处理技术之小枝模式查询匹配算法是当前研究的热点。为了有效支持XML数据的结构查询,目前已经提出了多种编码机制和小枝模式查询匹配算法,以减少对数据库的访问和连接操作,提高查询效率。本文通过分析XML语言、XPath语言、XQuery语言、XML小枝模式查询和XML常用评测数据集,重点研究已有的各种XML文档树编码机制和小枝模式查询匹配算法,总结出XML文档树编码机制和小枝模式查询匹配算法存在的问题和待改进的地方。首先,针对已有XML编码机制时空效率不高、对XML文档动态更新支持不够的问题,结合素数和IBSL两种编码机制的思想,提出了一种新的XML文档树编码机制-PBSL,该编码机制不仅有较好的查询效率,能完全高效地支持XML文档动态更新,而且大大降低了空间成本。接着,针对已有小枝模式查询匹配算法或基于归并会有很高的计算代价或非常复杂的问题,尤其是考虑了大部分查询表达式中只有一个结点是最终的输出结点的特点,提出了一种新的XML小枝模式查询匹配算法TwigNMI。该算法和以往大部分的小枝模式查询算法不同,不是从根结点开始查询匹配,而是直接以输出结点为导向,自底向上逆向到根结点匹配,不需要归并,只用了一个栈来实现,且能够扫描更少的有效数据结点而得到最终满足查询的匹配结果。本文提出的PBSL编码机制和小枝模式查询匹配算法TwigNMI,是在XML数据库研究方向上进行的有效尝试,为以后的相关研究提供了新的思路和方法。(本文来源于《中南大学》期刊2010-05-01)
马少龙[10](2010)在《XML小枝模式查询方法研究》一文中研究指出随着数据库和网络技术的迅速发展,XML已经成为网络上信息表达和数据交换事实上的标准。随着XML数据的不断增长,尤其是大规模XML数据的出现,对这些XML数据的有效管理和查询成为学术界和工业界的研究热点。由于XML文档具有的半结构的特性,使得传统的对关系数据库的查询算法对其不适用,因此如何高效地查询XML数据成为新的研究课题。本文对整体小枝模式查询展开研究,在XML数据库中,小枝模式查询是XML查询处理的核心操作,Twig查询处理的效率高低在很大程度上决定了整个XML查询的处理效率。近几年来,研究者提出了许多处理XML小枝模式查询的算法,最新的研究成果是整体小枝(holistic twig)模式查询方法,它把可以用树结构表示的twig作为一个整体来处理,整体twig查询可以避免结构连接产生大量的中间结果而具有很大的优越性。现在提出的算法在处理只有祖先后代关系的Twig查询时效率很高,但是对于带有父子关系的查询,这些算法的查询效率并不高,特别是产生了很多无用的中间结果。本文在总结和分析了现有的整体Twig查询算法后,发现现有编码在支持XML整体小枝模式查询方面信息不足。在XML编码中引入XML模式信息,提出一种新的XML编码方法,XML扩展区间编码方案,通过XML文档中某元素的扩展区间编码可以得到该元素所有孩子元素的标签名称集合。基于这种编码方法本文提出了整体twig查询算法-TwigStackBE算法,该算法能处理带A-D关系和P-C关系的Twig查询,并且是CPU和I/O最优的。然后本文利用扩展区间编码之上的索引结构,减少了算法扫描数据元素列表元素个数,对TwigStackBE算法进行了改进。通过把TwigStackBE算法与经典整体twig查询算法TwigStack,TJFast算法进行实验对比,可以看出TwigStackBE算法具体更优越的性能。(本文来源于《山东大学》期刊2010-04-05)
小枝模式查询论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着信息技术的迅猛发展,可扩展标记语言(XML)已经成为网络数据表示和交换事实上的标准,越来越多的XML数据成为信息共享的载体。大量XML数据的涌现促进了XML数据库技术的快速发展,小枝模式查询处理作为XML查询处理模块的核心组件,成为众多学者研究的热点问题。本文主要研究高效的小枝模式查询处理问题,主要研究内容如下:首先,深入分析和比较了现有小枝模式匹配算法的特点,并总结了每个算法的适用领域以及存在的问题。在小枝模式的分支结点和其子结点之间只存在祖先/后代关系的情况下,TwigStack算法和TJFast算法才能达到最优性,并且在处理查询时需要先对小枝模式进行分解求出局部匹配结果,然后再进行合并导致出现了大量的中间冗余结果,增加了额外的开销。此外,由于通过元素编码不能直接求出所需的元素信息,导致单个元素的处理代价比较高,影响了整体查询效率。其次,在Dewey编码的基础上增加路径索引,提出了一种新的编码方案,该编码方案可以根据编码求出元素标签和祖先结点而不依赖于有限状态转换器FST,从而减少元素处理代价。针对已有方法查询效率低下的问题,采用新的编码方案提出了一种新的查询算法—TJPath,通过降低单个元素的处理代价提升了整体查询效率。最后,提出了一个实验系统,并在此基础上实现了TwigStack、TJFast、TJPath算法。通过对实验数据在扫描元素数量、处理时间、扩展性等性能指标方面的对比验证了本文提出方法的高效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
小枝模式查询论文参考文献
[1].刘立新,张晓琳,吕庆,张换香,褚艳华.一种非归并不确定XML小枝模式查询算法[J].计算机科学.2013
[2].邓光超.基于XML数据的小枝模式查询算法研究[D].燕山大学.2012
[3].白山,陶世群.一种XML数据流小枝模式查询算法[J].计算机工程.2012
[4].赵圣猛,赵雷.一种采用扩展Dewey编码非归并的小枝模式查询算法[J].小型微型计算机系统.2011
[5].刘仲燕.基于DTD的XML小枝模式近似匹配查询问题的研究[D].山东大学.2011
[6].江锦华,吴羽,胡天磊,陈刚.基于路径连接的XML复杂小枝模式查询处理[J].浙江大学学报(工学版).2011
[7].武文英.基于小枝模式的XML数据查询处理技术研究[D].天津理工大学.2010
[8].王瑞.基于有序对的XML小枝模式查询处理研究[D].山西大学.2010
[9].胡江明.XML数据编码与小枝模式查询的研究[D].中南大学.2010
[10].马少龙.XML小枝模式查询方法研究[D].山东大学.2010