导读:本文包含了压缩查询论文开题报告文献综述及选题提纲参考文献,主要关键词:关系矩阵,关联数据,查询,压缩
压缩查询论文文献综述
符海东,彭燊,黄莉,顾进广[1](2018)在《HDVM:基于关系矩阵的关联数据压缩查询模型》一文中研究指出随着大数据时代的到来,大量的RDF数据充斥着整个数据网络.RDF(Resource Description Framework)后台引擎管理巨大的数据集时,数据集索引不能全部加载到内存中,导致系统需要执行缓慢的磁盘访问来解决SPARQL查询.本文提出了一种HDVM(Header Dictionary Vector Matrix)压缩查询模型,通过在关联数据集中提取潜在的叁元组关系矩阵,以主语向量、谓语向量和宾语矩阵的模型序列化存储来减少关联数据重复出现的次数,允许SPARQL查询在压缩状态下全内存执行.实验结果表明,本文提出的模型比常用的HDT(Header-Dictionary Triples)压缩方式提高了3%~20%的压缩率,同时在叁元组个数达到十亿级别的数据集上平均查询时间在400ms左右.(本文来源于《电子学报》期刊2018年03期)
欧锋[2](2010)在《基于LFB存储结构的XML压缩查询算法研究与应用》一文中研究指出随着网络和分布式技术的不断发展,使得全球很多服务器上的信息都可以得到共享。中国移动湖南省公司的经营分析系统需要收集各地市的数据,对其进行整理分析,找到真正需要的有用值。但问题是各地区存储数据的格式不一致,比如有的地区是用WORD格式存储,另一些地区使用EXCEL格式存储或PDF存储等等。所以要把它统一转换成一种格式,将这些数据孤岛统一联系起来,这个问题是本课题必须要解决的。XML技术可以很好的解决这个问题,这种半结构化的数据结构可以存取任何形式的数据。然而XML格式数据冗余较大,首先造成了存储空间的大量浪费,其次又增加了搜索处理的输入输出的时间,这样搜索速度必然会降低。目前,压缩是减小XML文档大小的一种行之有效的方法,但是压缩后的XML文档需要解压后才能对其进行验证、搜索等操作,这在某些应用中时间和空间代价过高。所以如何在有效压缩XML文档的同时能够在压缩后的文档上进行搜索等操作就成为基于XML的数据交换中需要解决的问题。为此,本文研究以下几个方面:首先,对现有的几种XML压缩方法的结构和技术特点进行详细的描述,分析了各种技术的优势和劣势,对比了各种压缩方法的性能。其次,研究了Xpath与Xquery和传统的分支搜索与按值搜索方法,并对这几种方法进行了详细的对比和分析,阐述LFB(Logic Function Block)存储结构。再次,借助LFB中的辅助信息,提出了基于LFB存储结构的分支算法和按值算法,寻找搜索的优化执行顺序,对比Xpath与Xquery和传统的分支搜索与按值搜索方法,说明基于LFB存储结构的分支算法和按值算法的优势,从理论分析说明本文的算法具有较好的伸缩性。最后,用Myeclipse IDE建立了一个试验平台。该平台建立一个树形XML模型,用以生成XML。随后对其数据进行仿真,给出建立的模型以及仿真数据,并对数据进行分析,实验结果表明本文的算法具有较高的搜索执行效率。(本文来源于《湖南大学》期刊2010-06-10)
刘胜飞,张云泉,张迪[3](2009)在《基于自索引的DBF压缩查询工具研究》一文中研究指出介绍了DBF表的文件格式和基于自索引的全文查询算法FM-index。针对DBF文件同时包含二进制文件头和纯文本数据记录的特点,以及对查询结果的特定要求,扩充了现有的FM-index算法,使其支持对DBF文件的压缩查询。测试结果表明,虽然FM-index在压缩/解压时间上与WinRAR仍有一段差距,但是FM-index对压缩查询功能的支持大大提高了文件的查询性能。(本文来源于《计算机应用研究》期刊2009年02期)
李千[4](2008)在《基于XML数据压缩查询优化的XBW_(ZIP)方法研究》一文中研究指出XML数据量指数级的增长,要求更有效的数据管理能力和更快、更精确的查询。XML数据格式虽然具有易创建、解析和扩展的特点,但数据格式过于冗长,难以实现具体的查询。基于XBW变换导航、子路径查询和内容查询,在压缩率和压缩时间方面,XBWZIP是一种基于XBW变换并且支持查询的XML数据压缩方法。(本文来源于《连云港职业技术学院学报》期刊2008年04期)
胡智飞,杨路明,刘波,李建军[5](2008)在《基于XBW变换的XML数据压缩查询方法》一文中研究指出XML数据格式虽然具有易于创建和解析的特点,但数据格式过于冗长,难以实现具体的查询。该文引入XBW变换,将XML数据压缩成3个线性序列,使XML数据的查询处理从树形结构转移到这3个序列上。基于XBW变换导航、子路径查询和内容查询,采用Rank & Select方法来实现查询。实验结果表明,在压缩率和压缩时间方面,XBWZIP的性能接近或者超过一些支持查询的XML压缩方法和一些通用压缩方法。(本文来源于《计算机工程》期刊2008年19期)
梁军[6](2008)在《FM-index压缩查询算法解析》一文中研究指出FM-index 是目前信息检索领域中国际上比较领先的压缩查询方法。该算法是压缩技术和索引技术的结合,它的最大优势在于能够支持在不解开压缩文件的情况下对源文件进行查询。本文对 FM-Index 如何实现压缩,如何建立索引以及如何实现压缩状态下的查询和定位算法进行了详细的解析,并对该算法的核心部分用图示加以说明,为 FM-Index 算法的相关研究及在实际中能良好的应用和改进提供了参考。(本文来源于《计算机与网络》期刊2008年12期)
压缩查询论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着网络和分布式技术的不断发展,使得全球很多服务器上的信息都可以得到共享。中国移动湖南省公司的经营分析系统需要收集各地市的数据,对其进行整理分析,找到真正需要的有用值。但问题是各地区存储数据的格式不一致,比如有的地区是用WORD格式存储,另一些地区使用EXCEL格式存储或PDF存储等等。所以要把它统一转换成一种格式,将这些数据孤岛统一联系起来,这个问题是本课题必须要解决的。XML技术可以很好的解决这个问题,这种半结构化的数据结构可以存取任何形式的数据。然而XML格式数据冗余较大,首先造成了存储空间的大量浪费,其次又增加了搜索处理的输入输出的时间,这样搜索速度必然会降低。目前,压缩是减小XML文档大小的一种行之有效的方法,但是压缩后的XML文档需要解压后才能对其进行验证、搜索等操作,这在某些应用中时间和空间代价过高。所以如何在有效压缩XML文档的同时能够在压缩后的文档上进行搜索等操作就成为基于XML的数据交换中需要解决的问题。为此,本文研究以下几个方面:首先,对现有的几种XML压缩方法的结构和技术特点进行详细的描述,分析了各种技术的优势和劣势,对比了各种压缩方法的性能。其次,研究了Xpath与Xquery和传统的分支搜索与按值搜索方法,并对这几种方法进行了详细的对比和分析,阐述LFB(Logic Function Block)存储结构。再次,借助LFB中的辅助信息,提出了基于LFB存储结构的分支算法和按值算法,寻找搜索的优化执行顺序,对比Xpath与Xquery和传统的分支搜索与按值搜索方法,说明基于LFB存储结构的分支算法和按值算法的优势,从理论分析说明本文的算法具有较好的伸缩性。最后,用Myeclipse IDE建立了一个试验平台。该平台建立一个树形XML模型,用以生成XML。随后对其数据进行仿真,给出建立的模型以及仿真数据,并对数据进行分析,实验结果表明本文的算法具有较高的搜索执行效率。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
压缩查询论文参考文献
[1].符海东,彭燊,黄莉,顾进广.HDVM:基于关系矩阵的关联数据压缩查询模型[J].电子学报.2018
[2].欧锋.基于LFB存储结构的XML压缩查询算法研究与应用[D].湖南大学.2010
[3].刘胜飞,张云泉,张迪.基于自索引的DBF压缩查询工具研究[J].计算机应用研究.2009
[4].李千.基于XML数据压缩查询优化的XBW_(ZIP)方法研究[J].连云港职业技术学院学报.2008
[5].胡智飞,杨路明,刘波,李建军.基于XBW变换的XML数据压缩查询方法[J].计算机工程.2008
[6].梁军.FM-index压缩查询算法解析[J].计算机与网络.2008