导读:本文包含了查询解析论文开题报告文献综述及选题提纲参考文献,主要关键词:自定义查询语法,ANTLR,语法解析,大数据查询系统
查询解析论文文献综述
葛文帅[1](2019)在《业务导向的自定义大数据查询系统及其SQL解析器的设计与实现》一文中研究指出随着互联网的快速发展,用户数据以极快的速度积累,用户行为分析成为热门的研究内容。本论文实现的数据查询系统是互联网用户行为分析系统的一个数据查询子系统。本文定义了一种简单的领域专用语言,并将其命名为SSQL(Simple Structured Query Language,简单结构化数据查询语言),论文根据具体需求抽象出一般查询场景,进而将其抽象成为一般的语法规则。本文使用扩展的巴克斯范式来定义SSQL,并使用ANTLR(ANother Tool for Language Recognition,一一种语言识别器)作为语法解析器生成工具,然后使用解析器和遍历器构建查询任务。SSQL语法支持了数据定义语句、数据查询语句以及系统管理语句。查询语法支持的查询数据源包括HDFS结构化数据、MySQL、Hive、以及Redis,ElasticSearch等常见NoSQL数据源。此外,SSQL语法还对数据源的管理提供支持,支持了对数据源的定义及其增删查改。本论文基于SSQL查询语法设计和实现了一个数据查询系统,为数据开发者提供了快速、定制化的大数据查询平台。论文介绍了该查询系统的组成结构和其实现过程。该系统使用Spring开发框架构建而来,提供了一个简单易用的数据查询和管理的图形化用户接口,满足了互联网用户行为分析平台的数据查询和管理的需求。(本文来源于《北京邮电大学》期刊2019-05-29)
路伟朋[2](2019)在《基于区域树索引的实时实体解析和查询处理》一文中研究指出实体解析和查询处理是数据库和大数据领域中两个重要的研究课题。实体解析是指识别数据集中描述现实世界同一实体的多个元组,并且对这些元组进行合并的过程。针对大数据和含有重复元组的低质数据集,如果不考虑实体解析,可能导致传统查询处理方法低效,甚至失效。传统实体解析技术不能直接运用于查询处理,如何使得实体解析方法具有更好的有效性和可扩展性仍是悬而未决的问题。因此需要新的处理方法,既能够实时去掉重复元组又能够快速完成查询处理。为此,本文构建区域树索引,并基于该索引给出实时实体解析和查询处理方法。构建区域树索引,对《维数据空间Rn中的数据集进行实时实体解析。在一个n维数据集中,每个元组是一个《维实向量,针对存在重复元组的《维脏数据集,识别并聚类其中的重复元组:首先,提出空间划分算法PRC,将包含数据集的最小区域进行动态划分,每次将一个区域划分为若干个互不相交且完全的子区域;其次,在划分过程中将n维区域空间构建区域树索引;最后,利用分治机制有效地进行实时实体解析,即将大型数据集分解成若干较小的数据集,应用区域树索引,对每个较小的数据集进行实体解析,这样既降低了对物理设备的配置要求又使得解析过程快速有效。利用区域树索引和实体解析方法,给出点查询、区域查询及KNN查询处理的相应算法,得到的查询结果为不同的聚类或其代表。点查询利用区域树索引快速找到查询点所在叶节点,在节点链接的链表中针对列表属性,采用二分查找方法寻找查询元组位置,返回查询结果。区域查询通过查询区域与区域树索引中叶节点相互比较,找出与查询区域相交或包含的叶节点,在这些节点链接的链表中采用二分查找方式按列表属性找到距离区域中心最近点,在一定阂值内顺序遍历其它节点,找出区域内元组。KNN查询运用点查询与区域查询的相应处理机制,动态更新查询区域半径,直到找出K个满足条件的元组。针对上述基于区域树索引的实时实体解析和查询处理方法,使用十五个不同维数的数据集进行广泛的实验,其中维数n的范围为2≤n≤784。根据脏数据集中相应干净数据集的不同基数、不同维数及不同分布,实验对实时实体解析、点查询、区域查询及KNN查询进行了验证和分析。实验结果表明,本文给出的区域树索引和算法对实时实体解析和叁类查询处理均具有较好的性能,对每条数据的处理均可在亚秒内实现,满足实时性要求。(本文来源于《河北大学》期刊2019-05-01)
周旺红[3](2018)在《SQL Server 2012数据库T-SQL查询方法及实例解析》一文中研究指出Transact-SQL是标准SQL程序设计语言的增强版,是程序与SQLServer之间沟通的主要语言。数据库最大的特点是查询的便捷性,几乎所有的数据库操作都是在查询的基础上进行。提高查询速度,给数据的维护带来了方便。基于此,主要以货品订购信息管理数据库为例,介绍了关系型数据库中T-SQL查询语句的用法。主要包括投影、选择、排序和分组统计等查询。(本文来源于《信息与电脑(理论版)》期刊2018年24期)
杜旭[4](2018)在《基于实时实体解析的关键词查询处理》一文中研究指出在数据库和大数据领域的研究与应用中数据质量是重要的,脏数据处理是一个挑战,实体解析(Entity Resolution,ER)是其中的关键问题之一。实体解析是指识别同一数据源或不同数据源中表示现实世界同一实体的元组(或称记录),且将其进行合并的过程。关系数据库中传统关键词查询/关键词搜索方法和技术是基于干净数据的,因此对于具有重复元组的脏数据集,查询结果可能包含重复元组,即具有不同标识的元组表示现实世界的同一实体。针对脏数据集,传统Top-N查询可能失效,而传统实体解析的离线方法开销大,不能直接运用于查询处理。因此需要一种新的Top-N查询处理方法,既能够快速完成查询处理又能够实时去掉结果中的重复元组。本文给出一种基于实时实体解析的Top-N关键词查询处理方法。此方法构建索引表,将数据库中的元组词以及相关信息存入索引表;使用该索引表生成索引,并利用此索引确定一个查询的候选集;进而运用索引中的词频和文档频率等信息设计一个相似度函数;然后利用分治的思想设计一个聚类算法进行实时实体解析,最后返回没有重复元组的Top-N查询结果。实验使用了叁个数据集并给出了一个SIMPLE方法作为基准,用来对比和验证KEYSER方法的性能。实验结果表明KEYSER方法实体解析的耗时比SIMPLE方法低一个到五个数量级,SIMPLE方法处理脏数据集的时间开销不能满足实时性的要求。此外,通过对比传统查询方法的准确度,实验结果验证了传统查询方法针对脏数据是失效的,同时还验证了把Top-N关键词查询和实体解析结合在一起的KEYSER方法,对于脏和干净的数据集都具有很高的实时性与有效性。(本文来源于《河北大学》期刊2018-05-01)
王维维,李仁旺,赵亚平,王海周,宋圣涛[5](2016)在《Linux文件搜索命令解析以及locate命令查询优化》一文中研究指出随着linux系统逐渐被广泛使用,系统使用者一般使用命令行的方式操作系统包括文件查找,特别是将linux系统作为服务器时,在数量众多的文件中找到需要的文件需要消耗很多时间,为了更快找到所需要的文件,针对现有的两种linux文件搜索命令的实现原理以及实现过程进行剖析,以及对着名的Boyer-Moore串匹配算法进行分析后,使用改进的BM算法对其中一种搜索命令即locate命令中字符串匹配算法进行优化,对改进算法的复杂度进行分析发现,在文件名的字符串匹配过程中与原来KMP算法相比较具有更高的效率,查找的速度更快。(本文来源于《浙江理工大学学报(自然科学版)》期刊2016年03期)
国冰磊,于炯,廖彬,杨德先[6](2015)在《结构化查询语言动态功耗解析及建模》一文中研究指出为构建节能的绿色数据库,提出一种基于结构化查询语言(SQL)资源(中央处理单元(CPU)、磁盘)消耗的最小单位的数据库动态能耗模型。该模型对系统动态能耗进行解析,将系统主要硬件(CPU、磁盘)的资源消耗映射成功率消耗,采用多元线性回归方法拟合模型关键参数,实时地估算系统动态功率,构建单位统一的动态功耗模型。实验结果表明,相比基于元组总数的模型,CPU指令总数能更好地反映CPU的功率消耗,所构模型在数据库管理系统(DBMS)独占系统资源的静态环境下,平均相对误差小于6%,绝对误差不超过9%。该动态功耗模型更适合于构建节能的绿色数据库。(本文来源于《计算机应用》期刊2015年12期)
李群,高捷[7](2015)在《国家计量授权查询系统的构架解析及其推广》一文中研究指出本文针对<国家计量授权查询系统>的开发构架、运行环境、以及性能优势做了简要的介绍。该系统为各级质检部门及企事业单位在计量管理、检定校准检测等方面提供了权威准确可靠的信息查询。(本文来源于《计量与测试技术》期刊2015年08期)
林一冲[8](2015)在《mDNS查询报文解析与代答报文模块的分析与设计》一文中研究指出随着技术革新的进行,互联网络已经逐渐从平台特殊化的AppleTalk, IPX和NetBIOS等转化到了IP阶段,但由此也遗失了一些特性,比如无法添加无配置或配置不全的设备。每个设备都需要唯一的P地址,都依赖于DHCP。动态IP地址分配使得IP容易发生变化,设备不得不手动配置静态P,否则会使它们无法被连接到。规模扩大时,手动配置工作量加大,更难实现。所以人们产生一种需要,希望能快速方便地浏览所有可用设备,并自动连接到合适的服务器,而不需要知道它IP什么主机名或者它IP地址是什么。为了实现这样的愿景,基于mDNS服务发现的Bonjour孕育而生,采用Bonjour技术的设备可以自发地传播自己的服务,或者探寻其他设备提供的服务。苹果公司原本的Bonjour实现对于客户端的请求和服务端的服务供给并无限制,对设备的管理方式能力不足,没有实现跨VLAN的服务发现功能,并且太多的mDNS组播报文转发也产生较大的网络流量,给无线网络造成负担。为了满足企业级用户对Bonjour实现进行管理和优化的需求,有必要开发一个以接入控制器作为设备基础的mDNS网关系统软件,以实现低流量、可管理、高效率的需求。本人在mDNS网关系统项目中负责设计、实现和测试系统中的解析mDNS查询报文解析模块和封装查询代答报文模块,通过对查询报文头各个字段的解析以及报文数据中域名字符串的还原,以获得客户端完整信息,以此作为应答回复的内容,并对客户端信息加以管理。当接入控制器AC中缓存有可用资源,则封装此资源入代答报文,回复给客户端。(本文来源于《北京邮电大学》期刊2015-05-08)
黄祎[9](2013)在《创新制度设计 彰显公证职能——解析《关于在办理继承公证过程中查询被继承人名下存款等事宜的通知》》一文中研究指出最近,司法部、中国银行业监督管理委员会制定印发了《关于在办理继承公证过程中查询被继承人名下存款等事宜的通知》(以下简称《通知》)。现就该《通知》的理解与适用,略述己见。(本文来源于《中国司法》期刊2013年06期)
刘华杰,丁斌,王珏[10](2013)在《基于存储结构解析的Cach数据库可视化SQL查询研究与实现》一文中研究指出作为一种后关系型数据库,Cach数据库采用树状结构存储数据,适合医疗等复杂的应用。基于对Cach数据库存储结构解析,给出了Cach数据库可视化SQL查询的方法,实现了在结果集中以类似HTML链接的形式进行关联数据的逐级呈现或直接抓取关联数据快照,同时向用户呈现相关的数据GLOBAL存储信息及M语言访问关键语句,极大地提高用户对Cach数据库进行SQL查询的效率,扩展Cach数据库SQL查询的功能内涵,提高Cach数据库的使用方便性。(本文来源于《硅谷》期刊2013年10期)
查询解析论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
实体解析和查询处理是数据库和大数据领域中两个重要的研究课题。实体解析是指识别数据集中描述现实世界同一实体的多个元组,并且对这些元组进行合并的过程。针对大数据和含有重复元组的低质数据集,如果不考虑实体解析,可能导致传统查询处理方法低效,甚至失效。传统实体解析技术不能直接运用于查询处理,如何使得实体解析方法具有更好的有效性和可扩展性仍是悬而未决的问题。因此需要新的处理方法,既能够实时去掉重复元组又能够快速完成查询处理。为此,本文构建区域树索引,并基于该索引给出实时实体解析和查询处理方法。构建区域树索引,对《维数据空间Rn中的数据集进行实时实体解析。在一个n维数据集中,每个元组是一个《维实向量,针对存在重复元组的《维脏数据集,识别并聚类其中的重复元组:首先,提出空间划分算法PRC,将包含数据集的最小区域进行动态划分,每次将一个区域划分为若干个互不相交且完全的子区域;其次,在划分过程中将n维区域空间构建区域树索引;最后,利用分治机制有效地进行实时实体解析,即将大型数据集分解成若干较小的数据集,应用区域树索引,对每个较小的数据集进行实体解析,这样既降低了对物理设备的配置要求又使得解析过程快速有效。利用区域树索引和实体解析方法,给出点查询、区域查询及KNN查询处理的相应算法,得到的查询结果为不同的聚类或其代表。点查询利用区域树索引快速找到查询点所在叶节点,在节点链接的链表中针对列表属性,采用二分查找方法寻找查询元组位置,返回查询结果。区域查询通过查询区域与区域树索引中叶节点相互比较,找出与查询区域相交或包含的叶节点,在这些节点链接的链表中采用二分查找方式按列表属性找到距离区域中心最近点,在一定阂值内顺序遍历其它节点,找出区域内元组。KNN查询运用点查询与区域查询的相应处理机制,动态更新查询区域半径,直到找出K个满足条件的元组。针对上述基于区域树索引的实时实体解析和查询处理方法,使用十五个不同维数的数据集进行广泛的实验,其中维数n的范围为2≤n≤784。根据脏数据集中相应干净数据集的不同基数、不同维数及不同分布,实验对实时实体解析、点查询、区域查询及KNN查询进行了验证和分析。实验结果表明,本文给出的区域树索引和算法对实时实体解析和叁类查询处理均具有较好的性能,对每条数据的处理均可在亚秒内实现,满足实时性要求。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
查询解析论文参考文献
[1].葛文帅.业务导向的自定义大数据查询系统及其SQL解析器的设计与实现[D].北京邮电大学.2019
[2].路伟朋.基于区域树索引的实时实体解析和查询处理[D].河北大学.2019
[3].周旺红.SQLServer2012数据库T-SQL查询方法及实例解析[J].信息与电脑(理论版).2018
[4].杜旭.基于实时实体解析的关键词查询处理[D].河北大学.2018
[5].王维维,李仁旺,赵亚平,王海周,宋圣涛.Linux文件搜索命令解析以及locate命令查询优化[J].浙江理工大学学报(自然科学版).2016
[6].国冰磊,于炯,廖彬,杨德先.结构化查询语言动态功耗解析及建模[J].计算机应用.2015
[7].李群,高捷.国家计量授权查询系统的构架解析及其推广[J].计量与测试技术.2015
[8].林一冲.mDNS查询报文解析与代答报文模块的分析与设计[D].北京邮电大学.2015
[9].黄祎.创新制度设计彰显公证职能——解析《关于在办理继承公证过程中查询被继承人名下存款等事宜的通知》[J].中国司法.2013
[10].刘华杰,丁斌,王珏.基于存储结构解析的Cach数据库可视化SQL查询研究与实现[J].硅谷.2013