导读:本文包含了流上关键字查询论文开题报告文献综述及选题提纲参考文献,主要关键词:XML,数据流,关键字查询,Top-K
流上关键字查询论文文献综述
黎玲利,王宏志,高宏,李建中[1](2012)在《XML数据流上Top-K关键字查询处理》一文中研究指出利用关键字可以在模式未知的情况下对XML数据进行查询.在当前的XML数据流上的关键字查询处理中,打分函数往往不能都满足各种用户不同的需求.提出了一种基于skyline的XML数据流上的Top-K关键字查询.对于这种查询,不需要考虑影响结果与查询相关性的复杂因素,只需利用skyline挑选与查询最相关的结果.提出了两种XML数据流上的有效的基于skyline的Top-K关键查询处理算法,包括对单查询和多查询的处理算法.通过扩展实验对两种算法的有效性和可扩展性进行了验证.经过实验验证,所提出的查询处理算法的效率几乎不受关键字个数、查询结果数量、查询数量等参数的影响,运行时间和文档大小大致呈线性关系.(本文来源于《软件学报》期刊2012年06期)
缪丰羽,林宏康[2](2012)在《一种支持动态XML文档上关键字查询的索引结构》一文中研究指出在关键字查询领域,目前提出的大多数索引结构主要考虑的是静态的XML文档。当XML文档出现频繁更新时,这些索引结构可能面临着大范围的重新编码,从而增加了数据库索引维护的代价。为了能在XML文档动态更新的环境下保持其索引结构的稳定,提出了一种支持动态XML文档上关键字查询的索引结构DLSS(DDE Level Structure Summary)。该索引结构采用了一种针对动态更新改进的Dewey编码,该编码只需在文档更新时对新的节点赋予相应的编码,而不需要调整原有的编码结构。实验证明,DLSS索引结构可以在XML文档频繁更新或者较少更新时都能保持索引结构的相对稳定,并能在其上实现较高的关键字查询效率。(本文来源于《计算机技术与发展》期刊2012年06期)
冯静[3](2012)在《XML数据流上关键字查询的研究与实现》一文中研究指出当前,应用于股票交易、电子邮件监测、网络信息订阅与发布等领域的以流形式存在的XML数据越来越多,对其进行关键字查询是XML数据查询的一个研究热点。XML数据流上的关键字查询不同于XPath&XQuery等结构语言查询,用户不需掌握复杂的结构化查询语言和XML的结构信息,只需提交查询的关键字即可获得感兴趣的信息。但XML数据流的大容量、到达无序且不受控制、仅被访问一次,这些特性给关键字查询带来了新的挑战。基于此,本文对XML数据流上的关键字查询做了细致的研究。本文在综述和分析现有XML数据流上的关键字查询相关技术的基础上,着重分析了XML数据流上的关键字查询技术。首先针对现有算法的优缺点,给出了完备性结果集——全部最小最近公共祖先ASLCA(A11Smallest Lowest Common Ancestor)和最大包含序列MCS(Max Contain Sequence)的定义,并提出和实现了XML数据流上的关键字查询算法—XAMM算法(XML All-slca Max-contain-sequence Minus),该算法解决了Dewey编码浪费内存空间,克服了XPath&XQuery等结构化查询操作不友好的缺陷。接着设计了XML数据流上关键字查询原型系统,该系统在综合考虑用户的查询意图和查询数据集的精确性的基础上,从用户操作、关键字分类、关键字语义扩展、数据集粗糙过滤和查询执行五个模块对该系统进行设计。在查询执行前,为准确捕获用户的查询意图,对用户提交的关键字表达式进行语法规定,根据关键字在查询中充当的角色,将关键字分为用于查询的条件关键字和用于显示结果的结果关键字,并利用WordNet语义词典对关键字语义进行扩展;同时对XML文档数据集利用布隆过滤器进行数字签名,匹配关键字语义扩展结果,以此将无关的文档集过滤掉,通过对数据集的粗糙过滤,可在查询前精简数据集,为精确化查询作准备。在执行查询时,执行XAMM算法,同时为将满足用户意图的查询结果返回给用户,在分析现有基于WordNet的经典语义相似度计算方法均忽略概念间层次关系的基础上,提出了概念非对称性语义相似度计算方法——NASSC方法(based on Notion Asymmetric Semantic Similarity Calculation)。用NASSC方法计算候选查询结果和关键字同义词词集的语义相似度,将相似度高的结果返回给用户,完成查询。最后通过对比实验,证明了XAMM算法优于现有的算法,XAMM算法的结果集比SRCT和SLCA结果集更完备,并具有较好的查询性能。并通过将NASSC方法与经典的语义相似度计算方法进行对比实验,证明了NASSC方法计算的相似度有较高的准确率。同时实现了XML数据流上的关键字查询原型系统,通过系统演示证明该系统对用户是操作友好的。(本文来源于《西南大学》期刊2012-04-25)
黎玲利[4](2010)在《XML数据流上的TOP-K关键字查询处理》一文中研究指出由于其灵活性和可扩展性,XML成为越来越多互联网上数据的表示标准。在一类应用中,XML数据表现为源源不断到来的数据片断,在这类应用中的XML数据称为XML数据流。XML数据流的应用包括网络信息订阅与发布、电子邮件监测等。在许多应用中,如果用户对XML数据流中数据的模式不了解,则难以写出合适的查询,因而利用关键字对XML数据流进行查询成为一种需要。本文研究了一种面向XML数据流的关键字查询-XML数据流上的TOP-K关键字查询。这类查询在模式未知的情况下,根据用户给出的关键字集合和返回结果数量K,随时给出接收到数据中前K个与关键字集合最相关的XML数据片断。为了有效地处理XML数据流上的TOP-K关键字查询,根据用户需求的不同,本文分别研究了叁种XML数据流上的TOP-K关键字查询,并设计了相应算法,其主要研究成果如下:(1)提出了基于打分策略的XML数据流上的TOP-K关键字查询处理方法。具体的,设计了一种打分策略RSR来评价查询结果的相关性;并提出了基于RSR打分策略的XML数据流上的TOP-K关键字查询;提出了一种基于栈的TKS算法,并对算法的时间和空间复杂性进行了分析;设计了一种过滤方法来提高算法的效率和节省存储空间;实验结果表明该算法具有很高的效率和可扩展性。(2)提出了基于skyline的XML数据流上的TOP-K关键字查询处理方法。具体的,考虑到相同的关键字查询可能有不同的查询需求,skyline被应用于XML数据流上的关键字查询,这是XML数据上关键字查询里对查询结果选择的一个新角度;提出了一种新颖的XML数据流上的TOP-K关键字查询:基于松弛skyline的XML数据流上的TOP-K关键字查询,简称为LSK查询;提出了一种有效的基于松弛skyline的XML数据流上的TOP-K关键字查询算法;在LSK查询的基础上提出了多查询下的基于松弛Skyline的XML数据流上的TOP-K关键字查询,简称为MLSK查询;提出了一种有效支持MLSK查询的处理算法MULSK算法;实验结果表明这些算法具有很高的效率和可扩展性。(3)提出了分布式环境下的XML数据流上的TOP-K关键字查询处理。具体的,设计了一种结点上的有效的过滤策略来降低网络吞吐量;证明了使得网络吞吐量最小的网络路由结构设计问题是一个NPC问题;提出了一种设计网络路由结构的启发式算法;通过模拟实验表明算法具有很高的效率和可扩展性,并验证了该算法的有效性。(本文来源于《哈尔滨工业大学》期刊2010-06-01)
李波,杨卫东[5](2009)在《XML流上的关键字查询算法》一文中研究指出针对当前XML流过滤研究中存在的问题,使用关键字查询方法作为解决方案。提出最右包含边界的概念,结合一个虚拟栈实现用于在XML数据流上进行关键字查询的XVirtualStack算法。理论分析和实验结果证明,该算法具有高效性。(本文来源于《计算机工程》期刊2009年04期)
黎玲利,王宏志,李建中,骆吉洲[6](2008)在《XML数据流上的TOP-K关键字查询处理》一文中研究指出利用关键字可以在模式未知的情况下对XML数据进行查询。提出了一种面向XML数据流的关键字查询技术——TOP-K关键字查询。这类查询在模式未知的情况下,对用户给出的关键字集合和结果个数K,随时给出接收到数据中前K个与关键字集合最相关的XML数据片断。为了有效地处理TOP-K关键字查询,本文设计了一种基于栈的算法,可以动态地维护临时结果集合并有效地过滤掉无用的元素。本文通过实验对算法的有效性和可扩展性进行了验证。(本文来源于《第二十五届中国数据库学术会议论文集(一)》期刊2008-10-24)
奠石镁[7](2008)在《XML文档流上的一种关键字查询方法研究》一文中研究指出本文将当前数据库领域的2个研究热点—XML 文档和数据流处理一的最新研究结合起来,提出了 XML 文档流关键字查询的问题。基于最小连通子树的概念,设计了相应的数据结构和基于栈的查询算法,可以有效解决 XML 文档流上进行关键字查询的问题。具体方法是把 XML 数据流表示成3类 SAX 事件:BEGIN(tag)、END(tag)和 TEXT0。对每类事件的处理算法进行了详细,并进行了正确性证明。从理论上分析了算法的复杂度,并在 XMark 和 treebank.xml 两个数据集上对所提方法进行了广泛的实验,结果验证了本文工作的有效性。(本文来源于《计算机与网络》期刊2008年16期)
王小锋,张新,谢敏,孟小峰,周军锋[8](2006)在《XML数据流上的关键字查询》一文中研究指出XML数据流上的XPath & XQuery查询处理是目前研究者关注的热点问题,但由于XPath &XQuery查询语言相对复杂,在不知道模式信息的前提下,用户很难通过已有的查询接口得到自己感兴趣的数据片断,因此如何在数据流模型上根据XML数据的特点为用户提供最友好的查询接口就成为一个亟待解决的问题.针对这个问题,创新地提出了在XML数据流上做关键字查询的问题,给出了最小相关连通子树(SRCT)的概念用于处理返回的结果,并设计了一种新的基于栈的Lookup算法,可以有效解决在XML数据流上进行关键字查询的问题,最后通过实验从不同角度对Lookup算法的各项性能指标进行了验证.(本文来源于《第二十叁届中国数据库学术会议论文集(研究报告篇)》期刊2006-11-10)
流上关键字查询论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在关键字查询领域,目前提出的大多数索引结构主要考虑的是静态的XML文档。当XML文档出现频繁更新时,这些索引结构可能面临着大范围的重新编码,从而增加了数据库索引维护的代价。为了能在XML文档动态更新的环境下保持其索引结构的稳定,提出了一种支持动态XML文档上关键字查询的索引结构DLSS(DDE Level Structure Summary)。该索引结构采用了一种针对动态更新改进的Dewey编码,该编码只需在文档更新时对新的节点赋予相应的编码,而不需要调整原有的编码结构。实验证明,DLSS索引结构可以在XML文档频繁更新或者较少更新时都能保持索引结构的相对稳定,并能在其上实现较高的关键字查询效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
流上关键字查询论文参考文献
[1].黎玲利,王宏志,高宏,李建中.XML数据流上Top-K关键字查询处理[J].软件学报.2012
[2].缪丰羽,林宏康.一种支持动态XML文档上关键字查询的索引结构[J].计算机技术与发展.2012
[3].冯静.XML数据流上关键字查询的研究与实现[D].西南大学.2012
[4].黎玲利.XML数据流上的TOP-K关键字查询处理[D].哈尔滨工业大学.2010
[5].李波,杨卫东.XML流上的关键字查询算法[J].计算机工程.2009
[6].黎玲利,王宏志,李建中,骆吉洲.XML数据流上的TOP-K关键字查询处理[C].第二十五届中国数据库学术会议论文集(一).2008
[7].奠石镁.XML文档流上的一种关键字查询方法研究[J].计算机与网络.2008
[8].王小锋,张新,谢敏,孟小峰,周军锋.XML数据流上的关键字查询[C].第二十叁届中国数据库学术会议论文集(研究报告篇).2006