语义关系抽取论文-闻畅

语义关系抽取论文-闻畅

导读:本文包含了语义关系抽取论文开题报告文献综述及选题提纲参考文献,主要关键词:突发事件,语义知识库,事件抽取,演化关系抽取

语义关系抽取论文文献综述

闻畅[1](2019)在《面向突发事件语义知识库构建的事件和演化关系抽取研究》一文中研究指出突发事件具有突发性、难可控性,往往会产生严重的灾害后果并对人们的生命财产安全造成巨大威胁。虽然突发事件预案法可以从宏观层面对应急救援进行指导,但无法从微观角度辅助专家针对具体的突发事件进行应急决策,并且现有人工建立的突发事件知识库缺少进一步的信息抽取和扩展。因此,将安全科学领域的知识与计算机技术相结合,构建突发事件语义知识库(Semantic Knowledge Base for Emergency,E-SKB),并进一步丰富语料和完善语义信息,有利于提高应急决策的效率,为应急决策领域的专家学者提供语义信息数据的支持。本文首先基于半结构化数据,依据关联开放数据规则构建基础E-SKB,在此基础上,针对现有聚类算法在识别重复事件时对事件要素抽取不足的问题,运用层级Blocking的方法对不同新闻网站新闻进行事件要素抽取以扩展知识库实例,并识别出重复突发事件以避免数据冗余。为了挖掘出突发事件所含的实体关系以丰富知识库语义信息,并解决现有突发事件因果关系抽取研究中忽略其他演化关系导致的信息缺失的问题,结合安全科学领域建模并采用基于注意力机制的双向长短时记忆网络(Long Short-Term Memory,LSTM)模型对演化关系进行抽取,通过引入注意力机制来突出关键词汇在句中的重要程度,以提高抽取结果的准确性。实验结果表明,本文提出的方法在事件抽取方面,可减少文档比较次数提高抽取效率并且避免多源数据下的事件冗余;在关系抽取方面,可进一步提高演化关系抽取的完备性和准确性,为E-SKB构建的信息抽取环节提供了技术支持,为突发事件应急决策提供了更为有效的信息。(本文来源于《武汉科技大学》期刊2019-05-23)

马语丹[2](2019)在《结合实体共现信息与句子语义特征的关系抽取》一文中研究指出随着信息技术的迅猛发展,互联网的广泛使用降低了信息的生产和传播成本,为群众获取信息带来了极大的便利。但随之而来的信息爆炸等问题,也给有效信息的获取和管理带来了艰巨的挑战。因此,如何从互联网上海量文字信息中,采用信息抽取方法获取信息的本质,服务于后续的信息管理与应用,具有重要意义。关系抽取作为信息抽取领域的重要任务,得到了研究学者的广泛关注。目前主流的关系抽取方法多以实体对所在句子为输入,使用神经网络的方法,为实体对提取语义特征,或加入外部信息作为补充,来进行关系分类。这类方法忽略了语料中可能存在句子长度较短、外部信息获取困难等问题。为了克服这些问题,本文从语料集的角度出发,认为其包含了对关系抽取可能有用的全局信息,并以此为基础提出了新颖的关系抽取方法,通过构建实体共现网络,同时提取全局上下文特征和句子级上下文特征,充分挖掘语料集中的宏观和微观上下文信息,实现关系分类。首先,标注了两个中文关系分类数据集。当前关系分类实验数据集较为匮乏,己有研究中使用的数据集多为英文数据集,如SemEval-2010和NYT-2010。考虑到中文和英文之间存在一定的差异,根据百度百科和新闻语料人工标注了两个用于关系分类的中文数据集,目前己将数据集开源。其次,提出了融合关系影响力与句子级特征的关系抽取模型(RASNN)。考虑到关系与关系之间的相互影响和制约,语料集中任意实体对之间的弱关系都可能成为关系分类的依据,本文提出了关系影响力的概念,通过使用注意力机制为实体共现网络中的共现关系计算影响力权重,并结合句子级上下文特征进行关系分类。该模型能够从宏观和微观两个角度为实体对抽取上下文特征,弥补了可能存在的因句子长度太短而造成的上下文信息不充分的问题。接着,提出了基于实体共现网络与句子语义信息的关系抽取模型(CNSSNN)。鉴于关系有强弱之分,实体的不同共现实体也应该有不同的重要程度,CNSSNN模型采用注意力机制为实体的不同邻居实体和实体对的共同邻居实体计算关系权重,并通过Bi-GRU和自注意力机制提取句子级上下文特征,深度挖掘实体对的宏观语料级上下文特征和微观句子级上下文特征。最后,将本文提出的RASNN模型、CNSSNN模型和当前主流的关系抽取方法在四个数据集上进行了对比实验和分析,结果表明,本文提出的模型能够通过实体共现网络挖掘实体对的语料级上下文特征,为句子级上下文特征提供有效的补充,关系抽取效果明显优于现有的关系抽取方法。(本文来源于《北京交通大学》期刊2019-05-01)

周文烨,刘亮亮,张再跃[3](2019)在《融合多层注意力机制与双向LSTM的语义关系抽取》一文中研究指出关系抽取是构建如知识图谱等上层自然语言处理应用的基础。针对目前大多数关系抽取模型中忽略部分文本局部特征的问题,设计一种结合实体位置特征与多层注意力机制的双向LSTM网络结构。首先根据位置特征扩充字向量特征,并将文本信息向量化,然后将文本向量化信息输入双向LSTM模型,通过多层注意力机制,提高LSTM模型输入与输出之间的相关性,最后通过分类器输出关系获取结果。使用人工标注的百科类语料进行语义关系获取实验,结果表明,改进方法优于传统基于模式匹配的关系获取方法。(本文来源于《软件导刊》期刊2019年07期)

周炀[4](2019)在《基于语义权重和注意力的实体关系抽取研究》一文中研究指出实体关系抽取是信息抽取的一个子任务,能够判别给定文本中实体对之间存在的关系,在自然语言处理领域有着非常重要的地位。完全依赖人工建立实体关系抽取语料费时费力,而利用远程监督可以便捷地建立大型的语料,但是远程监督无法避免的标注错误带来了严重的数据噪声。为了解决这一问题,很多方法应运而生,其中表现最突出的就是基于多示例学习的注意力网络模型。但是目前的大多数方法将所有的实体关系独立看待,无法利用实体关系的内部联系,以及实体关系定义中丰富的语义信息,严重限制了模型的整体性能,特别是对其中缺乏训练数据的长尾实体关系的抽取性能。本文针对当前注意力机制在远程监督实体关系抽取任务的应用中,包级别的注意力计算中的查询向量中缺乏实体关系的层级结构信息与语义信息,导致模型无法学习到合理的注意力权重的问题,提出了实体关系注意力网络(Entity Relation Attention Networks,ERAN)模型。ERAN模型使用双向GRU(Gated Recurrent Unit,GRU)编码实体关系定义生成实体关系的上下文表示,使用自定义的点积注意力机制计算注意力分数,能够充分利用GRU编码得到的所有隐藏状态,从而使得模型能够合理地分配注意力权重。此外,为了强化模型描述实体与文本上下文的相互关系的能力,ERAN模型还将依存树中实体词和单词之间最短路径的长度定义为语义距离,以此为基础使用语义权重对模型的输入向量进行加权处理,生成与实体关系更相关的输入向量,帮助模型减小与实体关系无关的噪声文本片段的影响,进一步提升模型的实体关系抽取效果。实验结果表明,ERAN模型在广为使用的纽约时报远程监督实体关系抽取数据集上取得了当前最好的抽取效果,而且ERAN模型的注意力机制显着提升了模型对长尾实体关系的抽取效果。使用PR曲线的面积AUC(Area Under Curve,AUC)作为评价指标,ERAN模型的AUC达到了0.460,相比NLP-progress中记录的最佳模型RESIDE的AUC值0.416提高了0.044,相比同样采用实体关系定义作为外部监督的PCNN+HATT模型的AUC值0.423提高了0.037。(本文来源于《华南理工大学》期刊2019-04-15)

秦晓慧,侯霞,赵雪[5](2019)在《一种融合语义角色和依存句法的实体关系抽取算法》一文中研究指出针对目前基于语义角色的实体及关系抽取技术效果不理想以及存在无法正确提取多个宾语的缺陷,提出一种基于语义角色和依存关系融合的方法:1)通过语义角色标注的方式抽取主语和核心谓词;2)以核心谓词为切入点,通过依存句法关系分析句子的并列结构(COO)和动宾结构(VOB),抽取其中的宾语实体;3)整合主语、核心谓词和宾语构成[实体关系实体]叁元组。对该算法和单纯依赖语义角色识别的算法进行了对比实验,结果显示该算法的精确率、召回率、F1值3个指标更优,表明这种实体关系抽取的方法可行有效,且在抽取多宾语的任务中效果明显。(本文来源于《北京信息科技大学学报(自然科学版)》期刊2019年01期)

陈金栋,肖仰华[6](2019)在《一种基于语义的上下位关系抽取方法》一文中研究指出分类体系主要由上下位关系组成,传统的基于模板的上下位关系抽取方法分为两类:第一类方法只使用高质量的模板导致低召回率;第二类方法使用所有可用的模板导致低精度。根据模板的质量将其分为更细粒度的强句法模板和弱句法模板。为了提高弱模板的精度,将弱模板和概念/实体结合构建语义模板。结合强句法模板和语义模板,提出一套新颖的框架从语料中抽取上下位关系,具有高精度和召回率的特点。在中英文语料上进行的实验,实验结果证明了框架的有效性。(本文来源于《计算机应用与软件》期刊2019年02期)

武文雅,陈钰枫,徐金安,张玉洁[7](2019)在《基于高层语义注意力机制的中文实体关系抽取》一文中研究指出实体关系抽取在挖掘结构化事实的信息抽取系统中扮演着重要的角色。近年来,深度学习在关系抽取任务中取得了显着的成果,同时,注意力机制也逐步地融入到神经网络中,进一步提高了关系抽取的性能。但是,目前的注意力机制主要关注一些低层次的特征,比如词汇等。本文提出一种基于高层语义注意力机制的分段卷积神经网络模型(PCNN_HSATT,high-level semantic attention-based piecewise convolutional neural networks),该模型将注意力机制设置在分段最大池化层后,动态地关注了高层次的语义信息。除此之外,由于中文实体关系语料稀疏性较大,本文利用同义词词林对COAE2016语料进行增强以扩大数据规模。最后在COAE2016和ACE2005的中文语料上进行实验,F1值分别达到了78.41%和73.94%,与效果最好的SVM方法相比分别提高了10.45%和0.67%,这充分证明了PCNN_HSATT模型在中文关系抽取上的有效性。(本文来源于《广西师范大学学报(自然科学版)》期刊2019年01期)

王海波,王姬卜,黄宗财,牛永勇,吴升[8](2018)在《结合实体词与句子语义的地理实体关系抽取》一文中研究指出地理实体关系抽取是地理知识获取的重要组成部分。规则制定的繁琐和难以发现的隐式关系表达,使得现有规则匹配与机器学习的方法不能有效解决地理实体关系抽取中存在的中文文本语法结构复杂且地理实体关系显式与隐式表达并存的问题。因此,根据上下文反映显式或隐式地理实体关系的特征,提出利用实体词向量和句子语义向量从文本中抽取地理实体关系的方法。实验表明,利用该方法从网络文本中获取显式和隐式表达的地理实体关系具有较好的效果,在测试集中准确率和召回率可以达到75.2%和79.2%。本研究为构建地理知识图谱、地理信息检索以及地理本体学习提供方法支持。(本文来源于《测绘科学技术学报》期刊2018年06期)

柴瑜晗[9](2018)在《基于语义图的中文领域概念及关系抽取方法研究与实现》一文中研究指出随着互联网技术的飞速发展,数据量在不断递增,从海量数据中挖掘有效信息变得越来越重要。在这个过程中知识图谱,特别是领域知识图谱发挥了重要的作用,成为互联网知识驱动智能应用的基础设施。对于领域知识图谱的构建,首先应该构建知识图谱的数据模式。由于领域数据的庞大性,且大部分是非结构化文本,因而自动构建知识图谱的数据模式成为该领域研究的重点。领域术语的抽取、领域概念的抽取以及关系的抽取是构建知识图谱数据模式的重要因素。本文针对知识图谱数据模式的构建进行了以下叁个方面的研究。1)采用了基于混合策略的中文领域术语抽取方法。首先对领域数据集进行词法分析,基于规则进行候选领域术语的抽取;其次使用统计的方法对候选领域术语进行过滤,利用TF-IDF算法进行领域术语的抽取,利用TextRank算法进行单词术语多词术语的抽取。实验结果表明,该方法使得领域术语的抽取较为全面。2)提出了基于语义图的中文领域概念抽取方法。该方法针对领域术语,构建包含语义信息的术语语义图,使用社区发现算法对术语语义图进行分析和划分,从而实现概念抽取。实验结果表明,该方法能够有效利用语义信息获得较好的概念抽取结果。3)提出了一种基于语义特征的概念间关系抽取框架。首先使用基于语义图的概念关系识别方法进行概念间关系识别;然后使用基于依存句法分析的关系标注方法进行概念间关系标注。实验结果表明,充分融入句法和语义信息可以得到较好的抽取结果。(本文来源于《河北科技大学》期刊2018-12-01)

马语丹,赵义,金婧,万怀宇[10](2018)在《结合实体共现信息与句子语义特征的关系抽取方法》一文中研究指出实体关系抽取是信息抽取领域的重要任务之一,也是知识图谱构建的一个关键环节.现有的关系抽取方法大多都是围绕实体对从句子中抽取上下文语义特征,然后进行关系分类,这忽略了实体在整个语料集中的全局上下文特征.本文提出了一种新颖的结合实体共现信息与句子语义信息的神经网络(CNSSNN)模型,用于实体关系抽取.该模型首先构造整个语料集蕴含的实体共现关系网络,并通过引入注意力机制有侧重地提取实体的网络环境信息,从而为各个实体生成语料级全局上下文特征,同时利用双向门控循环单元网络(bi-GRU)为实体对提取句子级上下文语义特征,最后将语料级特征和句子级特征结合起来,进行实体关系抽取.在公开数据集和人工标注的数据集上的实验结果表明,本文提出的方法其准确率和召回率要明显优于其他现有方法.(本文来源于《中国科学:信息科学》期刊2018年11期)

语义关系抽取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着信息技术的迅猛发展,互联网的广泛使用降低了信息的生产和传播成本,为群众获取信息带来了极大的便利。但随之而来的信息爆炸等问题,也给有效信息的获取和管理带来了艰巨的挑战。因此,如何从互联网上海量文字信息中,采用信息抽取方法获取信息的本质,服务于后续的信息管理与应用,具有重要意义。关系抽取作为信息抽取领域的重要任务,得到了研究学者的广泛关注。目前主流的关系抽取方法多以实体对所在句子为输入,使用神经网络的方法,为实体对提取语义特征,或加入外部信息作为补充,来进行关系分类。这类方法忽略了语料中可能存在句子长度较短、外部信息获取困难等问题。为了克服这些问题,本文从语料集的角度出发,认为其包含了对关系抽取可能有用的全局信息,并以此为基础提出了新颖的关系抽取方法,通过构建实体共现网络,同时提取全局上下文特征和句子级上下文特征,充分挖掘语料集中的宏观和微观上下文信息,实现关系分类。首先,标注了两个中文关系分类数据集。当前关系分类实验数据集较为匮乏,己有研究中使用的数据集多为英文数据集,如SemEval-2010和NYT-2010。考虑到中文和英文之间存在一定的差异,根据百度百科和新闻语料人工标注了两个用于关系分类的中文数据集,目前己将数据集开源。其次,提出了融合关系影响力与句子级特征的关系抽取模型(RASNN)。考虑到关系与关系之间的相互影响和制约,语料集中任意实体对之间的弱关系都可能成为关系分类的依据,本文提出了关系影响力的概念,通过使用注意力机制为实体共现网络中的共现关系计算影响力权重,并结合句子级上下文特征进行关系分类。该模型能够从宏观和微观两个角度为实体对抽取上下文特征,弥补了可能存在的因句子长度太短而造成的上下文信息不充分的问题。接着,提出了基于实体共现网络与句子语义信息的关系抽取模型(CNSSNN)。鉴于关系有强弱之分,实体的不同共现实体也应该有不同的重要程度,CNSSNN模型采用注意力机制为实体的不同邻居实体和实体对的共同邻居实体计算关系权重,并通过Bi-GRU和自注意力机制提取句子级上下文特征,深度挖掘实体对的宏观语料级上下文特征和微观句子级上下文特征。最后,将本文提出的RASNN模型、CNSSNN模型和当前主流的关系抽取方法在四个数据集上进行了对比实验和分析,结果表明,本文提出的模型能够通过实体共现网络挖掘实体对的语料级上下文特征,为句子级上下文特征提供有效的补充,关系抽取效果明显优于现有的关系抽取方法。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语义关系抽取论文参考文献

[1].闻畅.面向突发事件语义知识库构建的事件和演化关系抽取研究[D].武汉科技大学.2019

[2].马语丹.结合实体共现信息与句子语义特征的关系抽取[D].北京交通大学.2019

[3].周文烨,刘亮亮,张再跃.融合多层注意力机制与双向LSTM的语义关系抽取[J].软件导刊.2019

[4].周炀.基于语义权重和注意力的实体关系抽取研究[D].华南理工大学.2019

[5].秦晓慧,侯霞,赵雪.一种融合语义角色和依存句法的实体关系抽取算法[J].北京信息科技大学学报(自然科学版).2019

[6].陈金栋,肖仰华.一种基于语义的上下位关系抽取方法[J].计算机应用与软件.2019

[7].武文雅,陈钰枫,徐金安,张玉洁.基于高层语义注意力机制的中文实体关系抽取[J].广西师范大学学报(自然科学版).2019

[8].王海波,王姬卜,黄宗财,牛永勇,吴升.结合实体词与句子语义的地理实体关系抽取[J].测绘科学技术学报.2018

[9].柴瑜晗.基于语义图的中文领域概念及关系抽取方法研究与实现[D].河北科技大学.2018

[10].马语丹,赵义,金婧,万怀宇.结合实体共现信息与句子语义特征的关系抽取方法[J].中国科学:信息科学.2018

标签:;  ;  ;  ;  

语义关系抽取论文-闻畅
下载Doc文档

猜你喜欢