导读:本文包含了实体语义信息论文开题报告文献综述及选题提纲参考文献,主要关键词:知识图谱,联合表示学习,协同训练,实体对齐
实体语义信息论文文献综述
苏佳林,王元卓,靳小龙,李曼玲,程学旗[1](2019)在《融合语义和结构信息的知识图谱实体对齐》一文中研究指出实体对齐能够发现不同知识图谱实体间的对齐关系,是多源知识融合的基础。现有的基于知识表示学习的方法依赖大量标注数据,且并未利用知识图谱中属性等结构化信息,限制了实体对齐的效果。针对这个问题,文章提出融合语义和结构信息的实体对齐方法,使用协同训练(Cotraining)框架,将特征分为语义视角和结构视角,在两个视角下分别训练基于两个图谱联合表示学习(Joint Embedding)的实体对齐模型,并不断选出最可信的实体对齐结果用于辅助另一视角下模型的训练,实现语义和结构信息的融合,从而提升实体对齐的效果。同时,提出使用属性强约束,限制协同训练过程中产生的漂移。实验证明,与传统方法相比,该方法在准确率和F1值上都有提升。(本文来源于《山西大学学报(自然科学版)》期刊2019年01期)
马语丹,赵义,金婧,万怀宇[2](2018)在《结合实体共现信息与句子语义特征的关系抽取方法》一文中研究指出实体关系抽取是信息抽取领域的重要任务之一,也是知识图谱构建的一个关键环节.现有的关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征,然后进行关系分类,这忽略了实体在整个语料集中的全局上下文特征.本文提出了一种新颖的结合实体共现信息与句子语义信息的神经网络(CNSSNN)模型,用于实体关系抽取.该模型首先构造整个语料集蕴含的实体共现关系网络,并通过引入注意力机制有侧重地提取实体的网络环境信息,从而为各个实体生成语料级全局上下文特征,同时利用双向门控循环单元网络(bi-GRU)为实体对提取句子级上下文语义特征,最后将语料级特征和句子级特征结合起来,进行实体关系抽取.在公开数据集和人工标注的数据集上的实验结果表明,本文提出的方法其准确率和召回率要明显优于其他现有方法.(本文来源于《中国科学:信息科学》期刊2018年11期)
徐增壮[3](2018)在《基于实体关联性和语义信息的槽填充方法研究》一文中研究指出槽填充(Slot Filling)旨在从大规模语料中抽取目标实体的属性信息。该研究包含两方面关键任务:1)源信息(相关文档)获取,其任务是根据目标实体及给定的参考文档从大规模语料中检索相关文档,这类文档不仅是潜在包含目标实体属性的文字载体,也提供了重要的上下文信息,因此被认定为属性抽取的源信息;2)属性抽取与检验,其任务是从相关文档中抽取目标实体的候选属性值,并对候选值的确切性进行检验,从而形成可靠的结果予以输出。本文针对上述两项任务一并开展研究,将语义信息与实体关联性信息共同应用于源信息获取,并尝试独立应用于属性抽取环节,形成了一套集检索和抽取技术的槽填充模型。总体上,本文研究内容包括如下叁项:1)基于实体监督和主题模型的文档检索方法:本文基于检索框架构建源信息获取模型,侧重解决命名实体歧义性造成的相关文档获取的误差问题。本文提出一种联合了主题语义和实体群落的检索方法,并利用伪相关反馈实现了实体查询表示的重构。在检索过程中,本文利用神经网络模型将主题语义和实体群落特征联合应用于的相关度的计算环节。实验表明,该方法有效地提升文件检索的性能(F1值提升了6.4%)。2)基于注意力机制的卷积神经网络实体关系分类:本文针对相关文档内的句子进行逐条处理,旨在利用分类模型识别其中特定属性的候选值。然而,待分类语句往往存在多种语义关系,误导目标实体与候选属性值的语义关系分类。针对这一问题,本文提出一种基于注意力机制的卷积神经网络实体关系分类模型,利用注意力机制,将紧密相关于目标实体的语义信息给与更高的关注度,借以优化上述关系分类模型。实验表明,该方法获得比目前实体关系分类模型更好的性能(F1值提升了2.94%)。3)基于实体群落的无监督实体属性过滤方法:借助关系分类策略进行目标实体属性的识别,有助于发现属性值的多种文字表示形式,但其中往往包含冗余和错误的属性,现有研究已尝试借助置信度估计进行冗余与错误属性值的过滤,但性能尚存在较大缺口。针对该问题,本文提出基于实体群落的无监督实体属性过滤方法。利用层次聚类生成多个实体属性值群落,然后利用实体图模型挖掘与目标实体相关的群落,以实体群落为依据,过滤错误的实体属性值。实验表明,该方法能够有效提升槽填充系统的性能(F1值提升了6.8%)。(本文来源于《苏州大学》期刊2018-05-01)
徐庆[4](2016)在《基于词汇语义信息的中文命名实体关系抽取研究》一文中研究指出自互联网诞生以来,接入的用户越来越多,直接导致了当今互联网上的信息量呈爆炸式增长,信息量的巨大也带来了巨大的使用价值。然而互联网上的信息大多为无结构或半结构化的文本,要想有效利用其中的信息,就涉及到自然语言处理领域的一个热门课题——信息抽取。命名实体关系抽取是信息抽取的重要任务,其内容为使计算机自动的通过实体所在的文本抽取出实体之间的关系。关系抽取对领域本体和知识图谱的构建、问答系统、信息检索等领域具有重要意义。在四种中文关系抽取的方法中,本文选择基于树核函数的机器学习方法作为研究方向,其关键是构建有效的关系抽取特征。在已有的特征中,很少涉及《同义词词林》、《知网》等语义词典,而这些词典包含的语义信息对关系的识别和抽取非常有研究价值。本文首先提出了一种简易的根据《同义词词林》计算词汇语义相似度的方法,并根据该方法提出了词汇语义相似度树特征。《同义词词林》编码分为5层,从左到右相同的层数越多,词汇在语义上越相近;而树核函数计算相似度的原理为相同的子树越多,相似度越高。针对以上两点,提出了《同义词词林》编码树特征,将5层编码分别放入树形结构的5层节点中。为了探究哪一层编码所代表的语义信息更适合关系抽取,又提出了各个级别的《同义词词林》编码树特征。《知网》中词条的语义信息都包含在常识性知识库中的DEF项里,由此本文提出了一种由DEF项转化而来的《知网》语义树特征。为了缩减特征中节点数量提出了两种简化的《知网》语义树:叁层语义树和无动态角色语义树。经过实验得到了以下结论:在基于《同义词词林》的特征中,完整的《同义词词林》编码树取得了最好的效果;在基于《知网》的特征中,同样是完整的《知网》语义树抽取效果最好;《同义词词林》编码树和《知网》语义树的组合特征取得了非常好的抽取效果,关系大类和关系小类的抽取的TF分别达到了86.6和93.3,而且该组合特征可以不依赖标注语料得到,在未来的开放域关系抽取中很有应用价值。(本文来源于《太原理工大学》期刊2016-06-01)
宋玉玲,王宁[5](2014)在《利用实体语义信息的关键字查询结果多样化》一文中研究指出近年来,可扩展标记语言(extensible markup language,XML)数据的关键字查询受到广泛关注和研究,查询结果的多样化作为提高用户查找效率的有效途径,也成为一个研究热点。已有的方法采用不同的粒度对查询结果进行多样化,但效果并不理想。为解决这个问题,提出了一种新的方法——从查询结果所描述的中心实体出发对其进行多样化。首先分析实体包含的语义信息,根据实体的特征定义实体语义相似性计算公式,然后通过衡量这些实体之间的语义相似性,对其进行语义划分,并给出查询结果所属中心实体的定位规则。基于以上工作,就可以将查询结果依据其所属中心实体的分组情况进行分类。这样得到的查询结果分组可以让用户根据每组的语义标签进行查询导航,有利于提高查找效率。实验结果证明了该方法的有效性。(本文来源于《计算机科学与探索》期刊2014年03期)
刘丹丹,彭成,钱龙华,周国栋[6](2012)在《词汇语义信息对中文实体关系抽取影响的比较》一文中研究指出提出一种将《同义词词林》和《知网》的语义信息融合到基于树核函数的中文关系抽取方法,并比较和分析了两种语义信息对中文实体关系抽取的影响,同时探讨了这两种语义信息与实体类型信息之间的相互关系。实验结果表明,该方法能在一定程度上提高中文关系抽取的性能;同时,《同义词词林》能补充实体类型信息的不足,因而无论是否加入实体类型信息,其语义信息都能大幅度地提高大部分关系类型的抽取性能;而《知网》则和实体类型信息存在冲突,因此在已知实体类型信息的前提下,仅能提高个别关系类型的抽取性能。(本文来源于《计算机应用》期刊2012年08期)
实体语义信息论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
实体关系抽取是信息抽取领域的重要任务之一,也是知识图谱构建的一个关键环节.现有的关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征,然后进行关系分类,这忽略了实体在整个语料集中的全局上下文特征.本文提出了一种新颖的结合实体共现信息与句子语义信息的神经网络(CNSSNN)模型,用于实体关系抽取.该模型首先构造整个语料集蕴含的实体共现关系网络,并通过引入注意力机制有侧重地提取实体的网络环境信息,从而为各个实体生成语料级全局上下文特征,同时利用双向门控循环单元网络(bi-GRU)为实体对提取句子级上下文语义特征,最后将语料级特征和句子级特征结合起来,进行实体关系抽取.在公开数据集和人工标注的数据集上的实验结果表明,本文提出的方法其准确率和召回率要明显优于其他现有方法.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
实体语义信息论文参考文献
[1].苏佳林,王元卓,靳小龙,李曼玲,程学旗.融合语义和结构信息的知识图谱实体对齐[J].山西大学学报(自然科学版).2019
[2].马语丹,赵义,金婧,万怀宇.结合实体共现信息与句子语义特征的关系抽取方法[J].中国科学:信息科学.2018
[3].徐增壮.基于实体关联性和语义信息的槽填充方法研究[D].苏州大学.2018
[4].徐庆.基于词汇语义信息的中文命名实体关系抽取研究[D].太原理工大学.2016
[5].宋玉玲,王宁.利用实体语义信息的关键字查询结果多样化[J].计算机科学与探索.2014
[6].刘丹丹,彭成,钱龙华,周国栋.词汇语义信息对中文实体关系抽取影响的比较[J].计算机应用.2012