大规模本体论文-夏红科,蔡英

大规模本体论文-夏红科,蔡英

导读:本文包含了大规模本体论文开题报告文献综述及选题提纲参考文献,主要关键词:本体,本体模块化,叁元组

大规模本体论文文献综述

夏红科,蔡英[1](2019)在《一种带空结点的大规模本体模块化算法》一文中研究指出本体模块化是解决大规模异构本体间知识共享的关键过程。在本体模块化的过程中,忽视空结点的影响会带来模块化性能低,损失语义的问题。研究了本体中的空节点信息,根据分而治之的思想,提出一种容许空结点的大规模本体模块化算法,将本体实体先划分成实体簇,从实体簇中创建本体模块。实验表明,该算法在本体模块化的均匀性、分布性方面均优于现有的算法。(本文来源于《北京信息科技大学学报(自然科学版)》期刊2019年04期)

蒋猛,禹明刚,王智学[2](2019)在《多策略自适应大规模本体映射算法》一文中研究指出大数据背景下大规模本体映射的时间复杂度较高,效率和精度较低。为此,提出一种基于模块化和局部置信度的多策略自适应大规模本体映射算法。对本体内部进行聚类和模块化,基于信息检索策略发现模块间高相似度的相关子本体,计算相关子本体间各映射策略下的局部置信度,在组合映射结果时基于局部置信度对相应策略的权值进行自适应调整。在此基础上,利用启发式贪心策略提取映射结果并基于映射规则矫正结果。实验结果表明,与Falcon、ASMOV方法相比,该算法具有较高的查全率、查准率与F-measure值。(本文来源于《计算机工程》期刊2019年03期)

周张泉[3](2018)在《大规模本体推理方法研究》一文中研究指出本体语言RDFS及OWL被广泛地用于知识库相关的应用中。本体推理作为支撑这些应用的重要服务在查询问答、本体调试、不一致性处理等方面扮演者重要的角色。另一方面,本体推理一般具有较高的复杂度,从而导致在大规模数据场景下难以实用。因此,随着越来越多的大规模真实本体数据集被发布,如何提升大规模本体推理的效率给研究者们带来了挑战。为了提升大规模本体推理的效率,已有的工作更多地采用并行技术设计新的推理算法并且实现高效的推理系统。现有的工作在大量实验的基础上论证了并行技术对大规模本体推理具有较好的效率提升作用。然而,从时间复杂度的角度分析,对于“并行技术是否能提升本体推理效率”这个问题并不能一概而论。本文通过实验证实,存在本体使得并行技术不能有效地提升推理任务的效率。另一方面,诸多着名的数据集,如YAGO,被已有的工作证明:针对其的并行推理具有较高的推理效率;然而,这些数据集却是由非大规模易处理(non-scaling-tractable)的本体语言表示的,即其推理问题在最坏情况是串行的,或者问题复杂度在多项式完全之上。基于以上讨论,为使得并行技术更好地服务于大规模本体推理,本文以本体推理的大规模易处理性(scalable-tractability)为核心展开研究,探讨并寻找对于怎样的本体而言,其推理问题是大规模易处理的,或者是在Nick's Class(NC)复杂度类中的,从而更好地给出大规模本体推理方法。本文将给出一系列性质;基于这些性质,进一步设计和优化推理算法,以适应于大规模数据处理场景;开发者和用户也可以利用这些性质构建领域本体,使得其推理问题在理论上被保证是大规模易处理的。针对以上问题,本文主要进行以下研究:1)研究datalog推理任务(即datalog评估计算)的大规模易处理性,也就是考察满足怎样性质的datalog程序其推理任务在NC复杂度类中。本文以datalog语言作为研究本体推理任务的基础工具。因为现有工作研究给出的datalog推理算法其复杂度都是多项式完全的,为了研究datalog推理任务的大规模易处理性,这一部分研究给出处理datalog推理任务的NC算法。进一步,基于“可达性问题具有NC复杂度”性质,提出利用单源推导路径优化datalog推理算法。针对上述NC算法给出对应的大规模易处理类,即该类中的datalog 程序都可以由上述NC算法完成推理任务。2)探讨两类重要本体推理任务的大规模易处理性以及具体的推理方法:物化任务(materialization)和分类任务(classification)。针对物化任务,研究两个在实际中应用广泛的本体语言DL-Lite和DHL(Description Horn Logic)语言。本文研究给出结论:DL-Lite的两个最核心的子语言DL-Litecore 和DL-LiteR是大规模易处理的。对于DHL语言,存在非大规模易处理的情形。基于对该类情形的分析,提出了 DHL语言使用上的约束条件,使得满足这个约束的DHL本体,其物化任务都可被NC算法处理,也就是满足了大规模易处理性。接着,本文进一步地将对于DHL的研究结论推广到它的一个扩展语言DHL(o),该扩展语言允许复杂角色包含公理(complexrole inclusion axioms)。基于上述约束条件以及DHL(o)大规模易处理性的理论结果,本文给出优化后的物化任务推理算法。3)针对分类任务,研究本体语言OWLEL的核心语言+。该部分首先研究εL+语言的一个子语言,并且证明该子语言的分类任务可在LogSpace复杂度内被规约到DHL(o)语言的物化任务;也就是说,该子语言只要满足针对DHL(o)语言提出的相应约束便可保证其分类任务是大规模易处理的。接着,本文将研究完整的εL+语言,在DHL(o)语言约束上进一步给出针对εL+语言的约束条件,使得其分类任务是大规模易处理的。本文进一步利用上述约束条件以及单源推导路径优化εL+分类任务的推理算法。4)在实验部分,考察诸多知名的基准数据,大型知识库以及从不同数据源收集而来的真实本体。通过考察,本文发现这些本体中有很大一部分满足本文研究中提出的约束,也就是说,针对它们的推理任务是大规模易处理的。本文进一步验证了存在本体使得并行技术无法提升其推理效率。为验证本文给出的大规模推理方法,优化实现了上面两部分提出的物化任务和分类任务推理算法,并将它们分别与目前知名的推理系统(具体为RDFox,CEL和ELK)进行比较;所使用的测试数据也是从不同领域收集而来的真实本体。实验结果表明了,本文的两个系统相较于所对比的推理机,在处理大规模易处理的本体上具有更高的效率。(本文来源于《东南大学》期刊2018-04-17)

王昌龙[4](2016)在《基于描述逻辑的大规模本体推理关键技术研究》一文中研究指出随着语义Web的提出和语义技术的进一步发展,出现了越来越多的大规模本体。由于本体缺乏内在的结构,基于表算法的描述逻辑推理系统总是将本体视为单体对象来处理。在本体规模增大的情况下,推理系统的效率呈下降趋势。尽管出现了一些针对特定子语言的高效推理算法,但这些特定算法在处理强表达力本体时不能保证推理的完备性。另外,标准的描述逻辑系统把本体视为静态的数据对象。即使本体中出现极小的更改,推理系统也要重复整个本体的推理过程,导致不必要的重复计算,降低推理效率。因此,在保证推理完备性和可靠性的前提下,研究大规模本体的逻辑结构和演化特性,进一步优化推理算法,成为是目前亟待解决的一个主要问题。针对大规模本体推理中出现的问题,本文从叁个方面进行创新性研究:(1)针对现有的本体模块化分解方法存在的不足,提出一种混合的本体模块化分解方法。把OWL 2 EL子本体表示为有向超图,根据有向图中的可达性和强联通性计算EL部分的模块化分解,然后利用局部性模块抽取方法将剩余公理添加到前面计算的结构中,得到整个本体的模块化分解。(2)根据本体的模块化结构,将本体分解为若干个相互独立的子本体,依据不同模块的语言特性把它们分配给相应的推理子系统,实现推理的按需分配,进一步优化推理服务。(3)研究演化的OWL2 QL本体的增量推理问题。根据OWL 2 QL本体的有向图可表示性,将OWL 2 QL本体的分类推理问题规约为有向图的传递闭包问题。并将演化的OWL 2 QL本体映射为动态有向图,从而将OWL 2 QL本体的增量分类推理问题转换为动态维护有向图的传递闭包问题。实证研究表明,本文提出的方法能够有效的解决大规模本体推理中存在的部分问题。首先,本文提出混合的本体模块化分解方法能够有效地对强表达力SROIQ本体进行分解,对于所有的测试本体,效率平均提高6.7倍。为大规模本体的模块化管理以及模块化推理提供了技术支持。其次,联合OWL 2推理器和OWL 2 EL推理器的模块化推理方法实现了更优化的推理任务划分,推理效率高于现有标准的表算法系统。最后,对于OWL 2 QL本体,利用有向图识别到的受影响路径总是小于通用增量推理方法中的受影响模块,从而最大化利用前面的计算结果,提高了增量推理的效率,本文提出的方法更适合于动态的OWL 2 QL本体。(本文来源于《天津大学》期刊2016-12-07)

李环宇[5](2016)在《面向大规模本体对齐的SAMBO系统的优化方法设计与实现》一文中研究指出如今的万维网为人们提供了一种方便快速的获取信息的途径,但是万维网并不能够处理语义。换言之,人们可以从众多网页上有效地获取访问数据,但是计算机程序却不能够满足安全有效的数据复用与共享。因此,万维网的创始人Tim Berners-Lee提出了语义网络的概念。语义网络的初衷是在现有万维网的基础上添加新的表达语义的结构。这种知识描述结构经历了从可拓展标记语言XML,到资源描述框架RDF,再到本体论的阶段。越来越多的研究人员利用本体来表达特定领域的概念,关系以及相关语义。然而,不同的研究人员可能对于知识有着不同的理解,在建立本体的过程中就带来了相关,相似本体之间的不一致信息。例如,一些人会将细胞活化(cell activation)定义为T细胞活化(T-cell activation)和B细胞活化(B-cell activation)。与此同时,其他人可能将其定义为“T Cell Activation”和“B Cell Activation”。这种概念的不一致性不利于数据集成。因此,人们提出了本体对齐的概念以解决这一问题。SAMBO本体对齐系统由林雪平大学ADIT实验室在2005年设计实现。在它实现的最初几阶段。SAMBO系统可以解决大多数本体的对齐问题。但是,随着本体规模的日益扩大,SAMBO不再能满足大规模本体的对齐问题。本篇论文的主要内容就是优化SAMBO系统已实现大规模本体的对齐工作。本论文主要包含以下内容:首先,我们分析了如今表现优异的本体对齐系统AML和Log Map,这两个系统具有处理大规模本体的能力,我们分析以得出他们在处理大规模本体上的设计特点。它们的优点主要体现在数据结构的设计上支持索引功能。随后,我们分析了现有SAMBO系统旨在发现系统有哪些功能需要优化,经过分析得出了系统在数据结构,数据库设计,并行化匹配等方面存在优化需求。接下来,我们给出了优化方法的设计方案以及具体实现,主要包括设计新的数据结构已支持索引功能,重新设计数据库存储模式以满足大规模本体对齐数据的存储,优化完善并行化匹配的算法以及对系统业务逻辑的一些优化,缺陷消除等。最后,我们利用大规模本体测试评估了新的SAMBO系统并且获得了预期的结果。(本文来源于《哈尔滨工业大学》期刊2016-09-01)

孙煜飞,马良荔,郭晓明,覃基伟[6](2016)在《基于模块化的大规模本体映射方法》一文中研究指出映射效率对于动态映射的应用至关重要,因此文中提出基于模块化的大规模本体映射方法.通过加权的基于距离和基于信息量的方法计算本体概念的相似度,利用改进的凝聚层次聚类算法对概念进行聚类,并以此抽取子本体,最后设计基于信息检索的技术发现异构本体中的相关子本体.该方法有效缩小候选匹配的搜索空间,达到减少时间复杂度的目的.实验表明,文中方法可在保证映射结果质量的同时提升映射效率.(本文来源于《模式识别与人工智能》期刊2016年05期)

俞敬松,王惠临,杨洁[7](2016)在《大规模地名本体数据库系统的建构技术与方法》一文中研究指出[目的/意义]实用的大规模地名本体数据库系统在自然语言处理、信息检索和情报分析领域具有重要的应用价值。本研究的目的是在减少人工干预的情况下,实现对地名简称、俗名以及随时间变化的复杂地名文本的自动识别与处理。[方法/过程]以多种方法获取大规模名址数据为根基,简化地名元素间复杂关系,在开发名址元素切分、属性与关系分析及推理工具包的基础上,利用Neo4j图数据库工具开发实用地名本体数据库系统。[结果/结论]基于所介绍的技术与方法而构建的系统具有良好的容错性和持续的数据更新能力,其地名分析、地名元素间关系推理达到了期望的精度,并在面向诸如新闻主题追踪、金融征信中的地名匹配等多种自然语言处理任务中取得良好效果。(本文来源于《图书情报工作》期刊2016年08期)

吕刚,胡春玲,陈圣兵[8](2015)在《基于迭代MapReduce的大规模RDF本体传递推理方法研究》一文中研究指出随着Web内容爆炸式增长,基于RDF的开放关联数据越来越多,传统的RDF推理技术难以适应日益增长的大规模RDF数据推理任务.提出基于MapReduce的分布式迭代算法,设计了简洁的去重方法,实现分布式RDF推理,解决了RDF传递推理工程中持续产生单调递增数据集传递闭包问题.实验采用基于Hadhoop的分布式文件系统存储MapReduce算法,实验结果显示方法具有较好的计算性能和可扩展性.(本文来源于《合肥学院学报(自然科学版)》期刊2015年04期)

高阳[9](2015)在《基于图计算的大规模本体结构分析方法研究》一文中研究指出在信息科学领域,本体规范化的描述了共享知识体系中概念名称以及概念之间的关系。由于本体的形式化描述可以被计算机理解,因此本体在人工智能、模式识别、语言翻译等领域成为了热门的研究主题。在大数据时代随着信息量的日益丰富,本体的规模也逐渐增大。大规模本体通常包含上万个概念,概念间的关系表现为复杂的网络结构,这样的结构特点增加了本体操作的难度。为了提高大规模本体的利用效率,如何有效的抽取大规模本体结构中的关键信息成为了当前的研究热点。论文中首先介绍了常用的本体结构描述方法,在大规模本体的背景下,将本体结构特点与图类比,即本体中的概念对应图中的点,本体中的关系对应图中的边。基于这一类比思想,论文给出了基于图论的本体结构描述方法。由于大规模本体结构的同构图不能一次性完成内存计算,所以论文讨论了基于单机多核的图的划分策略,从而通过多次内存与外存的数据交换来完成图计算的过程。接着论文研究了图计算中的vertex-centric模型及分治法思想,并基于PageRank思想、标签传播思想设计了相应的算法分别对大规模本体结构进行关键节点分析,本体分割。最后在分析算法的关键步骤后,对算法进行了优化。为了验证算法的可行性及效率,论文中基于Graphchi图计算框架设计并实现了将图计算方法应用于大规模本体结构分析的系统。在大规模本体的数据集上,实验结果表明,该系统能较快的找到大规模本体结构中的关键节点与合理的本体分割。(本文来源于《华中科技大学》期刊2015-05-01)

薛醒思[10](2014)在《基于NSGA-Ⅱ的大规模本体映射方法》一文中研究指出现有的基于进化算法的本体映射技术在面对大规模本体映射问题时,由于搜索空间太大导致算法效率低下,从而使其无法有效地在实际中得到应用。针对这一问题,提出了基于快速非支配排序的多目标遗传算法(NSGA-Ⅱ)的大规模本体映射方法。该方法通过叁个步骤来映射本体:1)通过基于邻居相似度的划分算法来将源本体划分为不相交的概念块;2)通过相关概念过滤方法来确定目标本体中同源本体概念块相关的概念块;3)使用NSGA-Ⅱ方法来完成概念块之间的映射并通过贪心算法集成最终的结果。使用OAEI 2012的小规模的书目本体测试数据集和大规模的生物医学本体测试数据集对所提出的方法进行测试。同OAEI 2012的参与者的比较结果表明,所基于NSGA-Ⅱ的大规模本体映射方法能够在较短的时间内获取较好的本体映射结果,因此该方法是有效的。(本文来源于《计算机应用》期刊2014年06期)

大规模本体论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

大数据背景下大规模本体映射的时间复杂度较高,效率和精度较低。为此,提出一种基于模块化和局部置信度的多策略自适应大规模本体映射算法。对本体内部进行聚类和模块化,基于信息检索策略发现模块间高相似度的相关子本体,计算相关子本体间各映射策略下的局部置信度,在组合映射结果时基于局部置信度对相应策略的权值进行自适应调整。在此基础上,利用启发式贪心策略提取映射结果并基于映射规则矫正结果。实验结果表明,与Falcon、ASMOV方法相比,该算法具有较高的查全率、查准率与F-measure值。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

大规模本体论文参考文献

[1].夏红科,蔡英.一种带空结点的大规模本体模块化算法[J].北京信息科技大学学报(自然科学版).2019

[2].蒋猛,禹明刚,王智学.多策略自适应大规模本体映射算法[J].计算机工程.2019

[3].周张泉.大规模本体推理方法研究[D].东南大学.2018

[4].王昌龙.基于描述逻辑的大规模本体推理关键技术研究[D].天津大学.2016

[5].李环宇.面向大规模本体对齐的SAMBO系统的优化方法设计与实现[D].哈尔滨工业大学.2016

[6].孙煜飞,马良荔,郭晓明,覃基伟.基于模块化的大规模本体映射方法[J].模式识别与人工智能.2016

[7].俞敬松,王惠临,杨洁.大规模地名本体数据库系统的建构技术与方法[J].图书情报工作.2016

[8].吕刚,胡春玲,陈圣兵.基于迭代MapReduce的大规模RDF本体传递推理方法研究[J].合肥学院学报(自然科学版).2015

[9].高阳.基于图计算的大规模本体结构分析方法研究[D].华中科技大学.2015

[10].薛醒思.基于NSGA-Ⅱ的大规模本体映射方法[J].计算机应用.2014

标签:;  ;  ;  

大规模本体论文-夏红科,蔡英
下载Doc文档

猜你喜欢