导读:本文包含了多关键字查询论文开题报告文献综述及选题提纲参考文献,主要关键词:XML,关键字查询,区间预留,IRBN
多关键字查询论文文献综述
魏东平,罗丹[1](2019)在《一种基于区间预留编码的XML关键字查询算法》一文中研究指出近年来,随着XML数据的爆炸式增长,对XML关键字查询技术的研究日益受到关注。数据编码是关键字查询的基础,目前主要有2种方式——基于路径的编码及区间编码。区间编码可更好地适应对查询中的XML数据进行动态的更新,因而具有更多的优势。本文研究基于区间编码的关键字查询问题,提出一种新的查询算法。该算法首先根据预留的区间值建立索引,再根据最小范围值对索引进行选择遍历,减少了不必要的比较,达到了提高查询效率的目的。研究发现,预留空间的选择对查询效率有一定的影响。为此,本文设计一种基于节点自身进行区间预留的编码方式(Interval Reservation Based on Node, IRBN),为节点设置权值,并根据权值进行区间值的设定,形成根据节点自身分配区间的较为均衡的编码。实验表明,IRBN编码是合理的,有较高的查询效率。(本文来源于《计算机与现代化》期刊2019年10期)
姚远,肖锐[2](2019)在《分布式空间Top-K频繁关键字查询系统》一文中研究指出随着地理数据量的不断增大,传统的空间数据库已经无法满足实际应用的需要。为此,该文围绕矢量数据的Top-K频繁关键字问题,设计了一个分布式空间数据库系统。主要内容为分布式矢量数据存储模型设计,基于Hilbert排列码的矢量数据划分策略,分布式空间数据的索引结构以及索引算法设计。(本文来源于《现代信息科技》期刊2019年19期)
吴洋[3](2019)在《面向集合的反向空间关键字查询研究》一文中研究指出GPS设备的迅速普及以及基于位置服务的快速发展,产生了大量带有文本信息的空间对象。面向集合的空间关键字查询(Collective Spatial Keyword Querying,CoSKQ)作为空间关键字查询的变种,成为了当前研究热点之一。本文提出并定义了一种新的面向集合的反向空间关键字查询(Reverse Collective Spatial Keyword Querying,RCoSKQ),在这种查询中,对于任意一个结果集中的用户,与其他同样覆盖查询关键字集的空间对象集相比,查询点集与该用户的空间相似性最高。但在RCoSKQ查询过程中,面临两个问题,第一,覆盖查询关键字集的空间对象集很多,需要高效的方法过滤掉不合格的对象集;第二,需要快速的方法从用户集中筛选合格用户。本文主要工作如下:本文首先提出了一种基于区域剪枝的查询算法。首先获取所有的集合关键字集,对于每个集合关键字集,分别以每个查询点为中心对空间进行划分。然后,对每个分区的空间进行剪枝,并生成分区影响集。最后,使用分区影响集筛选合格用户。取所有查询点的合格用户的交集,将所有集合关键字集的合格用户合并。其次,在基于区域剪枝算法的基础上,提出了一种基于半空间剪枝的查询算法。首先获取所有的集合关键字集,对于每个集合关键字集,计算集合影响区域;然后,利川集合影响区域筛选合格用户,返回该区域内的用户;最后,合并所有集合关键字集的合格用户。最后,本文使用两个真实的数据集和几个合成的数据集,设计合理的对比实验,研究不同参数对算法在响应时间和I/O cost方面的影响。实验结果表明,基于区域剪枝的查询算法能够有效地解决RCoSKQ问题,而基于半空间剪枝的查询算法更加高效。(本文来源于《杭州电子科技大学》期刊2019-03-01)
王瑛琦[4](2018)在《面向关系数据库的关键字查询技术研究》一文中研究指出随着互联网和信息技术的快速发展,信息呈现爆炸式增长趋势。数据库作为组织、存储和管理结构化数据的主要方式,在商业智能、企业资源管理乃至个人日常生产生活等领域得到了广泛应用。有关数据库的查询访问需求也与日俱增。传统的结构化查询方式(例如SQL语句)需要用户掌握专业的查询语言并且熟悉数据库复杂的底层模式,给数据库的查询访问工作带来了诸多困难与不便。在此研究及应用背景下,面向关系数据库的关键字查询技术应运而生,并引起数据库社区及研究人员的广泛关注。应用该技术,用户仅需提交若干关键字即可完成查询工作,大大降低了数据库的使用门槛,具有良好的应用前景。近年来,在关系数据库关键字查询方面涌现出大量研究成果。但是,由于关系数据库具有不同于Web和传统IR系统的结构特点,该领域的研究仍面临许多困难和挑战。例如,查询预处理机制的缺失,无法有效填补非结构化查询与结构化数据间的信息鸿沟;查询算法中频繁的多表连接操作,使得查询效率无法得到良好保障;缺少一种高效的排序机制,实现查询结果的自动化排序过程。因此,针对现有研究存在的不足,本着对已有方法进行改进、完善和发展的目的,本文从模式抽象、查询扩展、查询优化、结果排序等研究视角出发,解决了关键字查询相关方法及应用系统中存在的具体问题。总体而言,本文的研究主要包括以下4个方面:首先,针对现有模式抽象方法考虑因素单一、抽象结果准确率偏低的问题,对关系数据库模式抽象方法进行研究。提出了一种基于图划分策略的模式抽象方法GP-RDSS(Relational Database Schema Summarization based on Graph Partition),帮助用户在大型数据库中快速且准确地掌握相关信息。具体而言,(1)从结构紧密性、内容相似性两方面出发构建表间相似性矩阵,并通过挖掘查询日志信息对矩阵进行修正,使其度量综合全面、更具合理性;(2)提出固有重要性和依赖重要性的概念,形式化定义表重要性度量方案,能够对表重要性进行准确度量;(3)提出模式抽象算法,该算法将图划分策略和数据库自身特点巧妙结合,同时考虑用户查询偏好对模式抽象过程的影响,使模式抽象结果得到进一步提升;(4)在数据集TPC-E上进行实验,通过与现有模式抽象方法的对比,验证了本文方法的有效性和可行性。其次,针对关键字查询方式中存在的语义模糊及表达能力受限等问题,对关系数据库关键字查询扩展方法进行研究。提出了一种基于查询推荐及解释的查询扩展方法ReInterpretQE(Query Expansion Based on Recommendation and Interpretation)。具体而言,(1)查询推荐阶段,基于词相关性矩阵和动态规划思想构建查询推荐模型,将原始查询转换为关键字查询列表;(2)查询解释阶段,基于数据库统计信息及模式图,完成关键字查询到查询子图间的映射,该子图不仅包含与原始查询语义相关的内容信息,还包含关键字间潜在的结构信息;(3)在公开数据集DBLP上进行实验,结果验证了本文查询扩展方法的合理性及有效性。再次,针对现有查询方法需要在线进行表连接而导致查询效率较低,且无法适用于大规模数据库的问题,对关系数据库关键字查询方法进行研究。提出了一种基于主题类簇单元的离线方法TCU-Based查询(Query Based on Topic Cluster Units),适用于结构复杂的大规模关系数据库。具体而言,(1)形式化定义了主题类簇单元的概念,通过对数据表及元组进行垂直分组和水平分组,离线构建主题类簇单元集合并将其作为查询应答;(2)设计一种基于遗传算法的表连接优化方案,降低预处理时间开销,并基于关联规则算法提出索引优化机制提高查询效率;(3)在公开数据集Freebase上进行实验,结果表明该方法在查询效率和准确率方面显着优于传统关键字查询方法。最后,针对传统排序方法中影响因子权重需要人工手动设置而导致排序准确率较低的问题,对面向关系数据库的排序方法进行研究。将学习排序模型引入关系数据库领域,提出了一种虚拟文档列表级的并行学习排序方法PARR-H(Parallel AdaRdbRank-Hierarchy)。具体而言,(1)构建全局特征关联图,并在此基础上提出一种分层式弱排序器构建策略;(2)提出一种列表级学习排序算法ARR-H(AdaRdbRank-Hierarchy),并基于该算法进行并行化扩展研究,构建并行学习排序框架PARR-H,使排序准确率和训练效率得到良好兼顾;(3)分别在数据集OHSUMED、WSJ和AP上进行实验,实验结果表明本文学习排序方法PARR-H在排序有效性和训练效率方面均有显着提高。(本文来源于《哈尔滨工程大学》期刊2018-09-01)
吴婷[5](2018)在《云环境下改进的动态模糊多关键字查询算法研究》一文中研究指出针对当前密文搜索领域大多数多关键字查询算法均不能同时保证云环境下的安全性、便捷性,以及实用搜索算法所常见的模糊查询、多关键字查询等操作,本文提出了一种能够适应云计算应用的密文搜索算法,该算法基于MRSE与向量空间模型进行构建,在已有的MRSE的基础上进行了改进,增加了包括分块纠删码、bloomfilter在内的几种优化方案,能够将散落在云端的数据在加密的条件下进行关键字搜索,使得算法搜索性能大大增强。仿真实验结果表明,本文提出的改进的动态模糊多关键字查询算法大大增强了密文搜索的运行效率和安全性,保证了云环境数据的查询准确度,降低了运算和存储的负载,并能够实现多关键字搜索和模糊搜索,增强了云搜索服务的性能,是一种适合云环境应用的密文搜索算法。(本文来源于《科技通报》期刊2018年06期)
贾晋[6](2018)在《基于用户位置的关键字查询推荐系统设计与实现》一文中研究指出查询推荐作为提高数据查询结果质量和准确度的重要手段,在商业互联网数据搜索引擎、企业数据库查询、电子商务、个性化信息服务等领域发挥着重大的作用,其目标是推荐能准确表达用户意图的查询,使推荐的查询能获取到满足用户查询需求的数据。随着移动互联网的爆发,用户从PC端搜索需求转移到移动端。移动搜索结果不仅要求与用户提交的查询词语义相关,还与用户的当前的位置相关,因此又被称为空间关键字搜索。现有的关键字推荐技术并没有考虑用户的当前位置和所推荐的查询词之间的关系。然而,在许多应用程序中,搜索结果与用户当前的查询位置息息相关,如基于位置的服务。本文应用一个基于位置的查询推荐框架,通过查询系统历史数据构建查询-文档二部图。该图包含查询节点和文档节点,以节点之间的边权重表示二类节点之间的关联程度,捕获了用户提交的关键字与被推荐的查询关键字之间的语义相关性;通过对二部图上边权重的调整捕获了与用户当前位置之间的位置相关性。随机在该图上选择一个查询节点为起始点,在带重启的随机游走模型上应用查询推荐算法,计算其相关节点得分,最终以得分最高的关键字作为被推荐的对象。论文的主要研究工作包括:1.设计基于用户位置的查询推荐系统架构。系统采用客户端/服务器(Client/Server)结构,总体划分为叁个模块,数据模块、服务器模块、客户端模块。数据模块负责采集和清洗数据,以查询词和文档构建查询-文档二部图。服务器模块通过结合文档的空间邻近位置调整二部图,计算用户提交的查询词与其他查询词之间的相似度。客户端主要负责为用户展示推荐的查询词和最终在用户附近的检索结果的展示。2.根据架构设计实现基于位置的关键字推荐系统应用。从大众点评网上采集数据用于系统演示。其中,推荐菜品对应查询-文档二部图中的查询词节点,餐厅对应查询-文档二部图中的文档节点,构建推荐菜品-餐厅二部图。用户通过该系统提交菜品名称及当前位置,服务器使用基于位置的关键字查询推荐模型查找附近餐馆提供的几种菜品。3.针对系统存在的冷启动问题提出新查询关联算法。本系统是根据查询系统日志建立查询-文档二部图,建立查询推荐模型。问题在于,当用户提交日志中不存在的关键字时,那么系统不能为用户推荐查询词。根据这一问题拟采用新查询关联算法,主要思想是用在线分类器对新查询词分类,然后计算该关键字和所属分类器内的关键字之间的相似度,选择相似度高的查询词输入系统再次为用户推荐查询词。(本文来源于《深圳大学》期刊2018-06-30)
钱志虎[7](2018)在《基于语义理解的空间关键字查询》一文中研究指出最近几年中,随着地理定位技术的不断进步和智能移动设备的广泛使用,基于位置的服务系统(LBS)变得越来越普遍。以百度地图为首的各种基于位置的服务成为了大众化的出行工具,给人们的生产和生活带来了极大的方便。在LBS系统中,空间关键字查询是一种重要的核心技术。现有的空间关键字查询技术主要集中于查询点与空间对象之间的空间和文本相似度,而在很大程度上忽略了两者之间的语义相关性。为了解决这个问题,在本文中,我们研究了基于语义的空间关键字查询,在传统的空间关键字查询基础上加入了对空间对象语义的处理,将语义信息嵌入到对空间对象的查询建模和处理当中,从而提供给用户更加准确而有意义的结果。本文致力于找到k个不仅空间和文本距离上与查询点相近的空间对象,而且要求这些对象与查询点的语义相似。为了支持高效的查询处理,我们提出了新的索引结构NIQ-tree和LHQ-tree,它们层次化地结合了空间、文本以及语义信息,使得在查询处理过程中有效缩小搜索空间。NIQ-tree利用i Distance索引高维度的主题分布,在搜索过程中精确查询且快速确定与查询语义最相似的结果;LHQ-tree利用LSH将空间对象和查询点哈希到不同的桶内,通过返回与查询点相同桶内的对象使得查询更快。我们在真实数据集上的扩展实验也证明了我们提出的方法的可行性以及有效性。最后,我们实现了基于语义的空间关键字查询原型系统。(本文来源于《苏州大学》期刊2018-05-01)
费云峰,丁国辉,滕一平,李景,孙莎莎[8](2019)在《一种高效基于模式图的数据库关键字查询方法》一文中研究指出针对基于模式图的数据库关键字查询方法中普遍存在的查询效率较低的问题,提出了合并网络查询方法(CCNE)。该方法设计了一种合并网络结构,可以有效地避免传统方法中因候选网络之间的重复结构造成的冗余操作;同时,给出一种改进的候选网络生成策略,可以避免产生冗余候选网络并缩小遍历范围,从而提高效率;最后在合并网络的基础上,设计一种合并网络执行算法,在很大程度上减少了传统方法所需执行的大量复杂数据库查询操作,进一步提高了查询效率。多组基于真实数据集的实验结果表明,CCNE可以在保证查询结果无缺失的情况下有效提高查询效率。(本文来源于《计算机应用研究》期刊2019年03期)
张鹏飞[9](2018)在《空间关键字查询相关问题研究》一文中研究指出随着移动互联网、社交网络、传感器网络以及全球定位导航系统的应用普及,带有地理位置信息的空间数据的规模快速增长。移动互联网中的交易数据、社交网络中的社交数据以及传感器网络中的感知数据是空间数据的重要来源,这些数据具有海量、异构以及多维等特点。利用空间数据处理技术对它们进行查询分析,从而支持日益多样化的查询需求,是空间数据库领域的研究热点。空间关键字查询作为重要的分支,能够综合利用空间邻近性和文本相关性对空间数据进行查询处理以满足用户的查询需求,在基于位置的应用服务、环境气象监测与预测和基于社交网络的舆情监测中具有重要的应用研究价值。空间关键字查询也具有重要的理论研究价值。空间关键字查询包含查询模型、索引机制和查询算法叁要素。在实际应用场景中空间关键字查询仍面临一些问题,需要对空间关键字查询叁要素进行深入研究。首先,随着应用场景不断出现,用户的查询需求也日益多样化。现有的查询模型无法有效地表达用户的查询需求,导致查询结果与用户需求不匹配。其次,现有的路网索引都是在原始路网中进行构建索引效率低下,而且缺乏有效的延迟更新机制来处理数据频繁更新时的索引保持问题。对于关键字索引而言,虽然可以通过增加空间开销来降低错误命中发生的概率,但是缺乏灵活地控制错误命中与空间开销的技术。最后,在处理复杂度较高或者对查询响应实时性要求较高的查询模型时,现有的查询算法存在查询效率低下和查询准确性无法保证等问题,而且缺乏有效的动态构建安全区域的技术。本文致力于研究并解决空间关键字查询叁要素所面临的问题,从而有效地从空间数据中挖掘有价值的信息。本文在单点查询、多点查询和连续查询场景中对空间关键字查询叁要素进行研究,主要研究内容和创新点包括:·欧氏空间中基于关键字级别的组合查询研究(单点查询)。本文在现有的组合关键字查询模型中引入关键字级别属性,研究基于关键字级别的组合查询模型(NP难问题),从而更好地满足用户的查询需求。本文对现有的索引机制进行改进,用于保存带有关键字级别信息的空间对象。针对不同的应用场景,本文提出了精确算法和具有准确度保证的近似算法,并给出分支界定和触发更新两种优化策略来提升近似算法的查询效率。·路网空间中聚合关键字近邻查询研究(多点查询)。本文将查询关键字引入到聚合近邻查询模型中,并研究聚合关键字近邻查询模型。现有的索引机制和查询算法在处理聚合关键字近邻查询时效率低下。本文提出双粒度索引机制来对路网摘要信息和详细信息分别进行索引,并研究延迟更新机制来处理数据频繁更新时的索引保持问题。针对关键字索引存在的问题,本文提出“协同过滤”技术来灵活地控制错误命中与空间开销。基于双粒度索引机制,本文提出最小优先查询算法和路径复用以及渐进计算两种优化策略来处理聚合关键字近邻查询和聚合关键字kk近邻查询。·路网空间中基于查询路径的空间关键字查询研究(连续查询)。上面的研究假定查询位置固定不变,但是在实际应用场景中用户通常沿着由导航系统或公共交通所确定的路线不断移动。本文将查询路径引入到连续查询模型中,并研究基于查询路径的范围关键字查询模型和k近邻关键字查询模型。针对大规模路网中的查询处理,本文在双粒度索引的基础上研究并提出基于骨干路网的索引机制。本文提出动态构建安全区间的技术和两阶段查询处理框架来处理基于查询路径的查询模型。空间关键字查询具有重要的应用研究价值和理论研究价值。本文在单点查询(欧氏空间中基于关键字级别的组合查询)、多点查询(路网空间中聚合关键字近邻查询)以及连续查询(路网空间中基于查询路径的空间关键字查询)场景中对查询模型、索引机制和查询算法进行研究,以满足日益多样化的查询需求。(本文来源于《浙江大学》期刊2018-04-20)
陈子军,李盛阳,刘文远[10](2017)在《路网上范围受限的Top-k空间关键字查询》一文中研究指出空间关键字查询是现在数据库领域的研究热点,查询时同时考虑对象与查询点的位置相关性和文本相关性.本文提出了路网上范围受限的Top-k空间关键字查询,查询返回在约束范围R内,满足关键字要求,并且距离查询点最近的前k个对象.尽管范围受限的近邻查询在欧式空间已经被研究过,但在路网中并没有关于这方面的研究.基于此,本文提出一种有效的算法.首先,为路网中的顶点建立标签索引,然后,为对象建立网格索引,查询时利用网格索引锁定查找范围,利用标签索引计算查询点与对象间的距离.最后,通过实验验证了该算法的有效性.(本文来源于《小型微型计算机系统》期刊2017年12期)
多关键字查询论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着地理数据量的不断增大,传统的空间数据库已经无法满足实际应用的需要。为此,该文围绕矢量数据的Top-K频繁关键字问题,设计了一个分布式空间数据库系统。主要内容为分布式矢量数据存储模型设计,基于Hilbert排列码的矢量数据划分策略,分布式空间数据的索引结构以及索引算法设计。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
多关键字查询论文参考文献
[1].魏东平,罗丹.一种基于区间预留编码的XML关键字查询算法[J].计算机与现代化.2019
[2].姚远,肖锐.分布式空间Top-K频繁关键字查询系统[J].现代信息科技.2019
[3].吴洋.面向集合的反向空间关键字查询研究[D].杭州电子科技大学.2019
[4].王瑛琦.面向关系数据库的关键字查询技术研究[D].哈尔滨工程大学.2018
[5].吴婷.云环境下改进的动态模糊多关键字查询算法研究[J].科技通报.2018
[6].贾晋.基于用户位置的关键字查询推荐系统设计与实现[D].深圳大学.2018
[7].钱志虎.基于语义理解的空间关键字查询[D].苏州大学.2018
[8].费云峰,丁国辉,滕一平,李景,孙莎莎.一种高效基于模式图的数据库关键字查询方法[J].计算机应用研究.2019
[9].张鹏飞.空间关键字查询相关问题研究[D].浙江大学.2018
[10].陈子军,李盛阳,刘文远.路网上范围受限的Top-k空间关键字查询[J].小型微型计算机系统.2017