导读:本文包含了语义网数据查询论文开题报告文献综述及选题提纲参考文献,主要关键词:语义网,软件工程,数据查询,处理技术
语义网数据查询论文文献综述
洪晓彬[1](2018)在《基于语义网的软件工程数据查询处理技术》一文中研究指出新时期背景下,科学技术发展速度明显加快,通过对语义网的深入研究,能够为研究工作人员提供有价值的参考依据。基于此,笔者将语义网作为研究重点,阐述了以语义网为基础的软件工程数据查询处理技术,以促进软件工程专业的发展。(本文来源于《信息与电脑(理论版)》期刊2018年08期)
杨梦琴[2](2018)在《语义驱动的数据查询与智能可视化研究》一文中研究指出随着大数据时代的来临,如何从大批量的数据中挖掘并利用有价值的信息成为人们重点关注的问题。然而信息本身存在天然的隐蔽性,从数据的查询到结果的展示再到数据观察通常不能最大限度的获取到有价值的信息。尤其对于关系型数据库来说,它存储了大量的领域数据,目前对其访问需要用户掌握诸如SQL一样的查询语言,尽管它可以满足用户查询数据的需求,但却很难掌握。除此之外,由于人类拥有强大的视觉辨识能力,数据可视化这一课题也开始引起越来越多研究者的高度重视,其作用在于帮助人们更好地做决策。尽管在可视化领域技术发展过程中也涌现了不少优秀的可视化系统,但是依然存在诸多挑战尚未攻克。特别是其中对于用户意图分析的部分,大多数解决办法是让用户采用既定的规则去描述查询语言,这无疑降低了用户的体验度。又或者采用服务匹配的方式建立用户描述语言与数据库查询服务之间的联系,但该方法需要采用服务描述语言分别对双方进行描述,这会使得最终结果产生偏差。基于以上原因,本文设计并实现了语义驱动的数据查询与智能可视化技术模型。在该模型中,用户可以通过自然语言查询数据库数据,同时通过识别用户意图进行图表自动化推荐,使得用户不需要在意底层实现。本文的主要贡献如下:(1)学习词嵌入:本文以LSTM神经网络为基础采用Word2Vec词嵌入技术将扩展后的维基百科语料库训练成词向量,作为后续模型的输入。(2)SQL查询语句到依赖关系图的映射:本文利用与SQL语法一致的依赖关系图,将SQL语句的生成问题转换为依赖关系图中槽的填充问题,避免了sequence-to-sequence形式模型导致的顺序问题。(3)语义驱动的natural-language-to-SQL(NL2SQL)模型提出:本文基于SQL语法依赖关系图、Sequence-to-set和表列名注意力机制采用LSTM神经网络分别构建了SELECT子句与WHERE子句的预测模型。(4)高维数据可视化的智能推荐:本文基于数据透视表、表格透镜、表代数、表列名注意力机制实现了图形的自动化推荐过程,其中包括图表类型、可视化编码、不同视觉属性和可视化映射方式。由于本文对WiKiSQL数据集进行了扩展,所以为了验证语义驱动的数据查询与智能可视化研究的有效性,将SDM模型与WiKiSQL数据集的原始模型Seq2SQL进行实验对比,通过执行精度和逻辑形式精度这两项指标来综合评价生成SQL查询的准确率,最后基于NDCG评价指标与应用实例对自动生成的可视化图形进行评估。实验结果表明:本文提出的SDM模型比Seq2SQL模型的准确率提高了15%。同时,推荐生成的可视化图形能够让用户快速找到与问题对应的答案,在不需要重新提问的前提下,还能发现与之相关的信息。(本文来源于《重庆大学》期刊2018-04-01)
姚宇帆[3](2016)在《语义网的软件工程数据查询处理技术研究与分析》一文中研究指出随着不断发展科学技术,不断分析和研究语义网,可以在一定程度上为研究人员提供基础,本文着重分析了语义网基本内涵,依据应用软件工程现状,提出语义网的软件工程数据查询处理技术,为建立高效处理软件技术建立新思路。(本文来源于《信息系统工程》期刊2016年03期)
胡志刚,景冬梅,陈柏林,杨柳[4](2016)在《基于Hadoop平台的语义数据查询策略研究》一文中研究指出为了实现对海量RDF(resource description framework)数据的高效查询,研究了RDF叁元组在分布式数据库HBase中的存储方法,基于Map Reduce设计了海量RDF数据的两阶段查询策略,将查询分为SPARQL(simple protocol and RDF query language)预处理阶段与分布式查询执行阶段。SPARQL预处理阶段设计实现了基于SPARQL变量关联度的查询划分算法JOVR(join on variable relation),通过计算SPARQL查询语句中变量的关联度确定连接变量的连接顺序,根据连接变量将SPARQL子句连接操作划分到最小数量的MapReduce任务中;分布式查询执行阶段执行SPARQL预处理阶段划分的Map Reduce任务,实现对海量RDF数据的并行查询。在LUBM标准测试数据集中的实验表明,JOVR算法能够高效地实现对海量RDF数据的查询,并具有良好的稳定性与可扩展性。(本文来源于《计算机科学与探索》期刊2016年07期)
徐芳芳[5](2015)在《基于语义缓存的RDF数据查询优化》一文中研究指出资源描述框架(Resource Description Framework,RDF)是语义网框架中的核心概念,用于描述Web资源,将各种不同领域的元数据整合起来,保证元数据交换时不丧失语义信息,实现网络资源的自动化处理。随着语义网技术越来越多的应用,对大规模RDF数据的存储和查询也越来越重要。目前,大规模RDF数据的管理方案主要包括以下叁种:基于关系数据库的管理方案、基于叁元组的管理方案、基于图的管理方案。这叁种方案都有各自的优点和缺点,在面临海量数据时,查询处理效率较低,且不具备良好的可扩展性。本文通过对当前RDF数据管理技术进行总结与分析,借鉴已有的RDF查询优化技术,采用两级语义缓存的策略,提出了一种基于关系代数树缓存和基于谓词划分缓存的查询优化方法。在基于关系代数的缓存模块中,重用缓存中已有的子查询结果,提高了查询效率。在基于谓词划分的缓存模块中,取出缓存中已经存在的叁元组模式的结果,提高了查询效率。对于缓存未命中的查询部分,将查询发送到底层磁盘进行处理,保证了查询的完整性。实验验证与结果分析表明,本文提出的查询优化方法能够有效的提高RDF数据查询效率。(本文来源于《武汉科技大学》期刊2015-05-10)
陈婧[6](2015)在《基于语义网的软件工程数据查询处理技术》一文中研究指出近年来,随着科学技术的发摘展,语义网为软件工程的管理人要员和科研人员能够高效地进行数据查询和处理提供了一个契机。因此,本文阐述了语义网的内涵,然后通过分析软件工程数据的应用现状,从而提出了在语义网下的软件工程数据查询处理技术,为高效管理软件工程数据提供一个新的思路。(本文来源于《电子技术与软件工程》期刊2015年04期)
熊逵[7](2015)在《基于SPAROL的语义网数据查询系统的设计与实现》一文中研究指出语义网技术近年来越来越受到大型互联网公司、机构以及学术研究者的重视,随着语义网构建技术的发展,越来越多的语义网知识库涌现出来,并不断地在增长。如何对这些具有语义信息的数据进行快速检索进而利用这些数据逐渐成为语义网技术进一步应用发展的瓶颈,W3C组织已经公布了一种用于查询RDF数据的协议SPARQL(Simple Protocol and RDF Query Language),作为一个国际标准协议和查询语言,目前已经有许多数据库实现、API设计均支持该查询语言,然而对于语义网数据的消费者来说,查询语义网中的数据往往需要记住大量的语法细节,甚至语义网本身的本体设计,学习成本巨大。基于简化语义网查询的考量,本文提出了多种用户友好的、基于SPARQL语言的查询系统设计方案。该系统对需要检索的语义网数据库进行预处理,提取出URI相关联的label信息进行索引,从而可以结合当前普通用户使用传统搜索引擎的习惯,通过关键词(或自然语言)检索获取URI信息,进而生成具有用户查询意图的SPARQL查询语句,与语义网数据库进行交互。在对URI进行索引检索的过程中,本文提出一种基于字符串转换、字符串字面相似性计算结合的Top-K相似字符串检索方案,同时提出了一种基于图形化构件的,结合上下文语义信息的SPARQL查询语句自动生成方案,减少了用户查询语义网数据的学习成本,缩短了用户与语义网数据库的交互鸿沟。本文实现了一套基于SPARQL协议的语义网数据库查询系统,其中包括基于关键词的单实体语义信息查询子系统、基于多关键词的语义关联查询子系统、基于自然语言的SPARQL语句生成系统以及基于图形构建的SPARQL查询语句生成子系统。系统的测试实验显示,使用该系统能够方便地实现语义网信息查询。(本文来源于《浙江大学》期刊2015-01-01)
林晓[8](2014)在《一种基于语义相似度的P2P数据查询方法》一文中研究指出目前P2P网络中数据查询在语义方面的研究较少,而基于DHT的数据检索只支持准确查询,导致查询准确率不高,但是好的索引项的建立会给查询带来很大的方便。本文结合了RDF和Word Net在语义方面的特点提出了一种新的简易RDF概念列表来表示文档,并通过计算语义相似度来决定输出结果的P2P数据查询方法。仿真实验证明本文方法可以较好的提高查询成功率。(本文来源于《电子测试》期刊2014年23期)
李韧[9](2013)在《基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究》一文中研究指出语义Web是Tim Berners-Lee提出的下一代互联网远景,通过引入了哲学领域本体的概念,使得计算机能够理解Web上的资源,并能实现计算机之间的语义信息共享。在世界万维网联盟(World Wide Web Consortium, W3C)提出的语义Web体系结构中,基于SPARQL的资源描述框架(Resource Description Framework, RDF)数据查询、基于描述逻辑的Web本体描述语言(Web Ontology Language, OWL)一致性检测推理和基于语义Web规则语言(Semantic Web Rule Language, SWRL)的OWL本体规则推理构成了语义Web领域的研究核心。然而,随着语义Web技术的不断快速发展,本体数据已呈现出大规模性、高速增长性、多样性等大数据特性。然而,传统的本体数据查询与推理工具由于设计运行于单机环境下,不可避免地存在计算性能和可扩展性不足等问题,影响了语义Web技术的进一步推广应用。近年来,云计算因其具备高性能、易扩展的海量数据存储和计算能力已经成为产业界和学术界在信息技术领域的最新研究方向之一,其中开源Hadoop云计算工具已成为当前大数据处理的事实标准。目前,国内外研究人员已开始将Hadoop关键技术引入语义Web研究领域,以探寻分布式环境下的高效率本体数据查询与推理方法,并已逐步形成了以语义Web和云计算技术相结合的新研究方向,但其研究仍然处于起步阶段,存在许多关键问题尚待解决。本文通过结合云计算和语义Web理论和关键技术,研究基于Hadoop的本体数据查询与推理并行化方法,为实现面向大规模语义Web本体的数据管理云服务奠定理论研究基础。主要研究内容和创新性成果包括以下五个方面:(1)以W3C提出的语义Web体系结构为基础,结合云计算Hadoop关键技术特性,提出了一种大规模语义Web本体数据查询与推理云计算框架。首先,对该框架进行了功能层级划分,自底向上分别由物理层、存储层、数据层、逻辑层、接口层、网络层和应用层组成。然后,基于本体查询与推理理论,设计了核心的逻辑层由数据预处理器、数据适配器、查询与推理分析器、查询与推理计划生成器、MapReduce SPARQL查询引擎、MapReduce SWRL规则推理引擎和MapReduceTableau推理引擎构成。该框架的提出为实现高性能、易扩展的语义Web数据管理云服务提供体系结构和数据交互流程支持和借鉴,为进一步研究其中的关键技术理论奠定基础。(2)基于语义Web中RDF叁元组数据特性和基于描述逻辑的OWL本体描述语言形式化语义,结合HBase基于列的数据存储模式特性,提出了由叁个HBase数据表T_OS_P、T_PO_S和T_SP_O构成的本体数据分布式存储策略,分析了在进行基于MapReduce的本体查询和推理任务时的数据检索机制,并通过与现有的数据存储策略进行对比和分析,论证了本文提出方法能够在本体数据存储空间开销和检索性能方面实现较好的平衡。(3)基于SPARQL语法和形式化语义,结合MapReduce键值对的计算特性,提出了SPARQL复杂组图模式在MapReduce环境下的分布式查询方法。首先提出了SPARQL复杂组图模式查询的相关解析模型定义。然后提出了基于MapReduce的SPARQL复杂组图模式查询任务生成算法,实现了查询任务数的优化,并以此为基础,提出了在map和reduce函数中的SPARQL复杂组图模式分布式查询算法。最后,通过使用语义Web研究领域广泛采用的SP2Bench本体测试数据集和标准测试语句,对提出方法与现有的Jena、Sesame和RDF-3X查询引擎进行了对比实验和可扩展性实验。实验结果表明,提出方法在面向大规模RDF数据的SPARQL复杂组图模式进行查询时,其计算性能和可扩展性均优于传统的单机环境下运行的查询引擎。(4)基于OWL Lite本体所对应的描述逻辑SHIF语义及其Tableau推理算法,结合MapReduce键值对的数据计算特性,提出了基于MapReduce的OWL本体一致性分布式检测推理方法。首先定义了OWL本体一致性检测的相关解析模型。然后提出了基于MapReduce的OWL Lite本体数据划分方法和分布式Tableau推理算法。最后通过使用LUBM本体测试数据集,对提出方法与现有Pellet、RacerPro和HermiT推理引擎进行了对比实验和可扩展性实验,证明了提出方法在进行大规模OWL本体的一致性检测推理时,在计算性能和可扩展性方面均优于传统单机环境下运行的描述逻辑推理引擎。(5)基于SWRL规则语法和形式化语义,结合MapReduce键值对的数据计算特性,提出了基于MapReduce的SWRL规则分布式推理方法。首先提出了SWRL规则推理的相关解析模型定义。然后提出了基于MapReduce的SWRL规则推理计划生成算法,实现了推理任务数的优化。其次,为保证推理的可判定性,提出了DL-safe限制下SWRL规则在map和reduce函数中的分布式推理算法。最后通过使用LUBM本体数据集和自定义SWRL测试规则,对提出方法与Jess和Pellet推理引擎进行了对比实验和可扩展性实验,证明了在处理大规模OWL本体的SWRL规则推理时,提出方法较传统规则推理引擎具备更好的计算性能和可扩展性。(本文来源于《重庆大学》期刊2013-04-01)
李慧颖,瞿裕忠[10](2011)在《基于关键词的语义网数据查询研究综述》一文中研究指出语义网数据的关键词查询是语义网研究的一个重要问题。首先给出语义网数据关键词查询的相关定义。根据研究目标不同,将已有解决方案分为混合型和非混合型的语义网数据关键词查询,后者又分为K-A和K-Q-A两种查询方法。调研了上述分类中当前常用的解决方案和研究进展。在此基础上,进一步介绍并比较了8个具有代表性的语义网数据关键词查询工作。最后讨论存在的挑战,并指出未来可能的研究方向。(本文来源于《计算机科学》期刊2011年07期)
语义网数据查询论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着大数据时代的来临,如何从大批量的数据中挖掘并利用有价值的信息成为人们重点关注的问题。然而信息本身存在天然的隐蔽性,从数据的查询到结果的展示再到数据观察通常不能最大限度的获取到有价值的信息。尤其对于关系型数据库来说,它存储了大量的领域数据,目前对其访问需要用户掌握诸如SQL一样的查询语言,尽管它可以满足用户查询数据的需求,但却很难掌握。除此之外,由于人类拥有强大的视觉辨识能力,数据可视化这一课题也开始引起越来越多研究者的高度重视,其作用在于帮助人们更好地做决策。尽管在可视化领域技术发展过程中也涌现了不少优秀的可视化系统,但是依然存在诸多挑战尚未攻克。特别是其中对于用户意图分析的部分,大多数解决办法是让用户采用既定的规则去描述查询语言,这无疑降低了用户的体验度。又或者采用服务匹配的方式建立用户描述语言与数据库查询服务之间的联系,但该方法需要采用服务描述语言分别对双方进行描述,这会使得最终结果产生偏差。基于以上原因,本文设计并实现了语义驱动的数据查询与智能可视化技术模型。在该模型中,用户可以通过自然语言查询数据库数据,同时通过识别用户意图进行图表自动化推荐,使得用户不需要在意底层实现。本文的主要贡献如下:(1)学习词嵌入:本文以LSTM神经网络为基础采用Word2Vec词嵌入技术将扩展后的维基百科语料库训练成词向量,作为后续模型的输入。(2)SQL查询语句到依赖关系图的映射:本文利用与SQL语法一致的依赖关系图,将SQL语句的生成问题转换为依赖关系图中槽的填充问题,避免了sequence-to-sequence形式模型导致的顺序问题。(3)语义驱动的natural-language-to-SQL(NL2SQL)模型提出:本文基于SQL语法依赖关系图、Sequence-to-set和表列名注意力机制采用LSTM神经网络分别构建了SELECT子句与WHERE子句的预测模型。(4)高维数据可视化的智能推荐:本文基于数据透视表、表格透镜、表代数、表列名注意力机制实现了图形的自动化推荐过程,其中包括图表类型、可视化编码、不同视觉属性和可视化映射方式。由于本文对WiKiSQL数据集进行了扩展,所以为了验证语义驱动的数据查询与智能可视化研究的有效性,将SDM模型与WiKiSQL数据集的原始模型Seq2SQL进行实验对比,通过执行精度和逻辑形式精度这两项指标来综合评价生成SQL查询的准确率,最后基于NDCG评价指标与应用实例对自动生成的可视化图形进行评估。实验结果表明:本文提出的SDM模型比Seq2SQL模型的准确率提高了15%。同时,推荐生成的可视化图形能够让用户快速找到与问题对应的答案,在不需要重新提问的前提下,还能发现与之相关的信息。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语义网数据查询论文参考文献
[1].洪晓彬.基于语义网的软件工程数据查询处理技术[J].信息与电脑(理论版).2018
[2].杨梦琴.语义驱动的数据查询与智能可视化研究[D].重庆大学.2018
[3].姚宇帆.语义网的软件工程数据查询处理技术研究与分析[J].信息系统工程.2016
[4].胡志刚,景冬梅,陈柏林,杨柳.基于Hadoop平台的语义数据查询策略研究[J].计算机科学与探索.2016
[5].徐芳芳.基于语义缓存的RDF数据查询优化[D].武汉科技大学.2015
[6].陈婧.基于语义网的软件工程数据查询处理技术[J].电子技术与软件工程.2015
[7].熊逵.基于SPAROL的语义网数据查询系统的设计与实现[D].浙江大学.2015
[8].林晓.一种基于语义相似度的P2P数据查询方法[J].电子测试.2014
[9].李韧.基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D].重庆大学.2013
[10].李慧颖,瞿裕忠.基于关键词的语义网数据查询研究综述[J].计算机科学.2011