概念关系抽取论文-周洋帆

概念关系抽取论文-周洋帆

导读:本文包含了概念关系抽取论文开题报告文献综述及选题提纲参考文献,主要关键词:图书,领域概念抽取,概念前后序关系挖掘,非监督方法

概念关系抽取论文文献综述

周洋帆[1](2018)在《基于图书的领域概念抽取及其前后序关系挖掘算法研究与应用》一文中研究指出随着科技的日新月异,信息技术的快速发展,图书为人类获取知识提供了便利的途径。图书中含有大量权威的、有价值的信息。在工程科技领域,图书成为人们获取知识,提升专业能力的核心途径之一。但与此同时,图书的种类越来越多,内容也是良莠不齐,人们面临“信息过载”的困扰。如何从海量的信息中获取对个人最有价值的信息,具有迫切的需求。在日益增长的图书所包含的信息中,领域概念以及概念之间的依赖关系具有重大意义。概念是浓缩全书知识的核心要素,通过了解图书中包含的概念,即可了解图书的主要主题,协助理解图书内容。概念之间的依赖关系,则构成了图书的知识网络。通过解析依赖关系,可以更好的掌握知识脉络,加深对于图书内容的理解。与此同时,运用概念之间的依赖关系,对于课程推荐,学习路线规划等场景具有重大意义。概念前后序关系即是描述概念间的依赖关系。因此,基于图书的领域概念抽取及其前后序关系挖掘是一个有广阔应用前景的任务。基于此,本文首先对图书的领域概念进行了自动抽取,然后挖掘概念前后序关系。最后基于上述结果,构建了知识网络,设计并实现了知识空间服务系统。论文的主要工作如下:(1)提出了一种图书领域概念自动抽取方法,首先利用现有算法抽取高质量短语,作为候选结果。再利用图网络进行全局排序,最后根据得分排序结果输出图书领域概念。(2)提出了一种基于非监督学习的图书概念前后序关系挖掘方法。首先针对概念前后序关系的特性提取特征,并选择随机森林作为分类器,构建概念前后序关系分类模块。然后根据概念前后序关系的特点,建立目标函数以及约束公式,并基于目标函数和约束公式构建概念前后序关系发现模块。最后迭代运行概念前后序关系分类模块和概念前后序关系发现模块,直到达到最大迭代次数或者结果收敛,输出概念前后序关系的判别结果。(3)设计并实现了知识空间服务系统。在指定领域内,利用抽取的领域概念和挖掘的概念前后序关系,构建成知识网络,并进行可视化。系统可展示领域内不同概念之间的依赖网络,同时具备概念搜索和路径搜索的功能。(本文来源于《浙江大学》期刊2018-12-18)

柴瑜晗[2](2018)在《基于语义图的中文领域概念及关系抽取方法研究与实现》一文中研究指出随着互联网技术的飞速发展,数据量在不断递增,从海量数据中挖掘有效信息变得越来越重要。在这个过程中知识图谱,特别是领域知识图谱发挥了重要的作用,成为互联网知识驱动智能应用的基础设施。对于领域知识图谱的构建,首先应该构建知识图谱的数据模式。由于领域数据的庞大性,且大部分是非结构化文本,因而自动构建知识图谱的数据模式成为该领域研究的重点。领域术语的抽取、领域概念的抽取以及关系的抽取是构建知识图谱数据模式的重要因素。本文针对知识图谱数据模式的构建进行了以下叁个方面的研究。1)采用了基于混合策略的中文领域术语抽取方法。首先对领域数据集进行词法分析,基于规则进行候选领域术语的抽取;其次使用统计的方法对候选领域术语进行过滤,利用TF-IDF算法进行领域术语的抽取,利用TextRank算法进行单词术语多词术语的抽取。实验结果表明,该方法使得领域术语的抽取较为全面。2)提出了基于语义图的中文领域概念抽取方法。该方法针对领域术语,构建包含语义信息的术语语义图,使用社区发现算法对术语语义图进行分析和划分,从而实现概念抽取。实验结果表明,该方法能够有效利用语义信息获得较好的概念抽取结果。3)提出了一种基于语义特征的概念间关系抽取框架。首先使用基于语义图的概念关系识别方法进行概念间关系识别;然后使用基于依存句法分析的关系标注方法进行概念间关系标注。实验结果表明,充分融入句法和语义信息可以得到较好的抽取结果。(本文来源于《河北科技大学》期刊2018-12-01)

王序文,李姣,吴英杰,李军莲[3](2018)在《基于BiLSTM-CRF的中文生物医学开放式概念关系抽取》一文中研究指出目的:利用深度学习方法自动抽取中文生物医学文本中的开放式概念关系,以增强生物医学文本理解及医学知识网络构建。方法:使用BiLSTM-CRF模型从中文生物医学文献数据中抽取以句子上下文短语描述的开放式概念关系,并与基于条件随机场(Conditional Random Fields,CRF)和基于长短时记忆网络(Long Short-Term Memory,LSTM)的方法进行对比分析。结果:基于BiLSTM-CRF的中文生物医学开放式概念关系抽取方法取得F1值为0.5221,显着高于基于CRF模型的方法(F1值为0.2353)和基于LSTM模型的方法(F1值为0.3355)。结论:与单独使用CRF模型或LSTM模型的方法相比,基于BiLSTM-CRF的开放式概念关系抽取方法具有更好的鲁棒性和泛化性,对于生物医学文本理解、医学知识网络构建等研究具有借鉴意义。(本文来源于《中华医学图书情报杂志》期刊2018年11期)

李志义,李德惠,赵鹏武[4](2018)在《电子商务领域本体概念及概念间关系的自动抽取研究》一文中研究指出【目的/意义】使用人工或常用软件工具获取本体概念及概念间关系已无法满足自媒体环境下大数据的本体构建及维护的要求,本文尝试用自动或半自动方式予以实现。【方法/过程】对电子商务领域原始语料进行分句、分词等预处理,构建领域语料库;使用基于语言学以及统计学的方法提取电子商务领域本体概念,同时提出基于混合策略的本体概念抽取方法;然后使用基于语言学、聚类的方法提取电商领域本体概念与概念之间存在的分类关系,使用基于关联规则挖掘的方法抽取其本体概念与概念之间存在的非分类关系。【结果/结论】将文本挖掘与本体构建结合起来,提出了领域本体概念及概念间关系自动抽取与本体构建方法,实验表明使用本体框架Jena利用此方法可以自动构建电子商务领域本体,并可将其应用到通用的语义检索系统中。(本文来源于《情报科学》期刊2018年07期)

蒋婷,孙建军[5](2017)在《领域学术本体概念等级关系抽取研究》一文中研究指出等级关系抽取是领域本体自动构建的必经阶段,目前研究主要集中在生物医学领域,此外还存在现有方法效率不高的问题。本文提出一种面向领域学术资源的概念等级关系抽取的方法。首先,从概念抽取阶段开始,将学术文献中的概念分为方法/任务/工具/资源类术语,采用层迭条件随机场与C-value和规则相结合的方法分别对各个术语类型进行抽取,得到初始的分类术语;其次,在已有的术语类别限定下,结合外部词库和基于Web的方法抽取等级关系概念对;最后,采用基于图的方法将概念对生成图模型,再利用图剪枝方法生成概念等级关系。实验采用领域学术文献语料集对所提出的方法进行验证,在概念抽取阶段抽取不同类型的术语,得到较高的准确率与召回率,并进行了等级关系概念对的抽取,最终生成了概念等级关系,实验证实了本文提出的方法的可行性与有效性。(本文来源于《情报学报》期刊2017年10期)

赵美玲[6](2017)在《面向动态主题的舆情本体概念及关系的抽取研究》一文中研究指出网络时代飞速发展的今天,舆情信息层数不穷,新的舆情主题随着时间变化而不断地出现。如何更快速、准确地掌握舆情信息,分析舆情倾向是有关政府部门的当前主要任务,舆情本体可以为舆情监测提高良好的语义支撑作用。目前舆情文本形式多样,如新闻报道、微博、贴吧等。本文主要针对新闻报道主题进行舆情本体的研究,这类事件不但格式规范,而且时效性较快。现有的领域本体学习方法层出不穷,但是针对具有动态主题性和跨领域性等特征的舆情本体学习的研究方法不明确,本文试图找到一种合适的分类方法得到动态的舆情主题,然后依据主题进行舆情本体概念以及关系的抽取,从而获得舆情本体的学习方法,为后期舆情监控提供参考价值。本文主要工作如下:(1)针对现有动态主题发现阶段,依据相邻窗口词语增速提取主题词,忽略主题完整性的问题,提出结合舆情周期内词语的前驱和后继变化趋势及周期热度提取主题词的方法。(2)依据改进的主题相关度进行主题词聚类,得到候选主题概念,为了符合舆情的主题性,采用本文定义的舆情本体概念主题隶属度过滤得到概念;接着以概念为种子词寻找复合词形式的舆情本体概念。(3)概念关系抽取时,结合概念对之间的词距以及模式匹配等方法进行分类关系判断,模式匹配方法可以判断词距方法无法判断的概念对;对于剩下的概念对扩大句子窗口,提取句子窗口内符合要求的动词,过滤选取出语义动词,为概念对赋予语义标签得到非分类关系,对已确定的非分类关系使用扩展的语言规则获取一些无法判断的关系对。(4)实验证明,本文提出的方法可以有效地划分舆情主题并抽取与主题相关的舆情本体概念,判断概念之间的关系,为舆情本体的自动构建以及半自动构建提供了参考价值。(本文来源于《新疆大学》期刊2017-05-25)

王娜[7](2017)在《基于迁移学习的基础教育地理领域概念关系抽取》一文中研究指出本文以基础教育地理学科为研究对象,针对地理领域的概念关系抽取进行研究。但是,地理领域目前没有充足的语料支撑概念关系抽取研究。传统的解决方法是人工扩充语料库,但其人力成本高,而迁移学习方法能够迁移源领域的知识帮助目标领域解决仅有少量数据的问题,故本文研究如何基于迁移学习解决地理语料不充足的问题,以提升地理概念关系抽取的准确率。论文的主要研究工作如下:1)针对基础教育地理文本的时序性特征,利用长短期记忆(Long Short-term Memory,LSTM)神经网络,构建了基于词特征和句子特征的概念关系抽取模型。本文将地理概念关系抽取定义为基于给定概念对的关系语句分类问题,词特征是概念对的基本特征,使用Word Embedding进行提取;句子特征能够完整表达语句序列的语义信息,而LSTM因能有效利用序列数据中长距离的依赖信息,被认为适合处理文本序列数据,故使用LSTM提取概念对所在句子的句子特征。在地理概念关系语料不充足的情况下,该方法的准确率较低。2)针对地理概念关系语料缺乏的问题,提出了基于LSTM的迁移学习方法,该方法将开放领域的知识迁移到地理领域,辅助地理领域更准确地完成概念关系抽取。该方法由两部分组成:Sogou词向量经由大量数据训练得到,其特征表示比使用少量地理文本训练得到的词向量更准确,故首先提出了基于Word Embedding的词向量迁移学习方法,将Sogou词向量迁移到地理领域,进行对比实验。由于迁移后词向量的特征空间不一致,导致该方法对准确率的提升不明显。因而,进一步提出了基于网络权重的迁移学习方法,该方法先将使用开放域文本训练得到的LSTM网络权重按层迁移到地理领域;然后地理领域针对迁移的网络权重做了两种处理:保持不变和重训练调整,进行对比实验。实验结果表明,若使用地理文本对迁移的网络权重进行重训练调整,能较显着提升地理概念关系抽取的准确率。但该方法没有解决知识迁移过程中,因数据分布不一致产生的领域适应性(Domain Adaptation)问题。3)为了解决开放领域向地理领域进行知识迁移过程中产生的领域适应性问题,构建了基于多潜在特征空间层的地理领域迁移学习模型。该模型首先利用开放领域和地理领域间的相同概念建立一个共享的潜在空间;然后利用两个领域的特有概念,分别建立叁个特有的潜在空间,并将叁个特有空间和共享空间组成叁个潜在特征空间层,同时用于学习两个领域间的数据分布。此外,该模型采用非负矩阵叁因子分解(Nonnegative Matrix Tri-Factorization,NMTF)技术解决模型优化问题。该方法能初步解决两个领域间的领域适应性问题。(本文来源于《武汉理工大学》期刊2017-03-01)

李丹阳[8](2016)在《本体概念发现及其关系抽取关键技术研究与应用》一文中研究指出随着网络技术的快速发展,互联网为人们创造了一个很好的交互平台。如何有效地在海量的网络大数据中为用户提取出有价值的信息,也面临着巨大的挑战。基于语义的信息处理能有效地解决上述问题。作为一种共享的概念化模型,本体在语义分析中起着至关重要的作用。对本体概念发现及其关系抽取关键技术进行研究,不仅是自然语言处理中重要的研究课题,而且能够有效地抽取相关联的知识数据,相关成果也具有重要的研究价值。本体概念的发现、本体关系的抽取是其中的重要研究内容。本文针对本体概念发现及其关系抽取进行研究,针对电力领域文本数据,采用基于规则与统计相结合的方法完成对本体概念的抽取,通过词法与句法相结合、基于词的相似度的方法完成对本体关系的抽取。主要研究工作如下:1)采用基于词性与统计相结合的方法完成对数据分词结果的处理;采用基于规则与统计相结合的方法完成对电力领域文本数据的概念的抽取。2)基于分词、词性标注、依存句法分析等自然语言处理技术,通过对词法与句法特征的结合,完成规则库的构建;通过对文本中相关模式的分析,利用规则库完成对电力领域数据的本体分类关系的抽取。3)采用基于依存句法分析完成对基本模板的抽取,使用bootstrapping完成对模板的扩充;在此基础上,使用词向量表示概念,完成对叁元组中的概念对相似度的计算,完成对电力领域数据的本体非分类关系的抽取。实验结果表明,本文所提出的方法具有一定的可行性与有效性。本体概念抽取方法能够在一定程度上完成对新概念的抽取;电力数据的本体分类关系的抽取准确率能够达到40%以上;通过对词进行向量化完成对概念相似度的计算。最后,对论文中存在的问题及下一步的研究工作进行了说明。(本文来源于《河北科技大学》期刊2016-12-01)

程春雷,夏家莉,曹重华,李光泉,曹中华[9](2016)在《关系概念的Web文本主题抽取模型研究》一文中研究指出Web文本主题抽取是文本分类与知识发现的研究热点,既有的抽取方法一般存在主题粒度确定、主题语义解释、新网络词汇识别等难题,限制了其在开放应用领域的使用效果.论文借助百度百科词条背景,基于关系概念的概念分层以及主题连通的思想,面向中文文本构建了关系概念主题抽取模型(relational concept topic model,RCTM),RCTM模拟人的概念局部识别,上下文语境理解的并行阅读方式,由此实现中文文本的主题抽取.RCTM中主题的表达相对独立、语义连通灵活,主题的描述具有更好的通用性与可解释性,为Web文本主题抽取提供了新的研究思路.实验表明,RCTM具有良好的主题抽取准确率,文本抽取出的主题词,简洁直观、可解释性好.针对开放的WEB文本,具有更好的通用性、稳定性.(本文来源于《小型微型计算机系统》期刊2016年05期)

张学芳[10](2016)在《面向主题的舆情本体概念及关系的抽取研究》一文中研究指出随着网络的快速发展,舆情信息会以某个或者某些主题形式为中心不断地传播,但传播重点也在不断地更改。快速有效地发现相关迁移的焦点内容,有助于相关部门更好的掌握并分析舆情导向,并且将这些舆情信息按照某种形式存储起来,形成舆情本体,可以很好地支持后期的舆情分析。目前主题识别多数以新闻网页信息作为语料库,因为新闻语料格式规范,有具体的人物、事件发生时间、地点、发生何事这些要素。而舆情信息以各种形式如博客、贴吧等快速地传播着。在基于舆情信息的本体构建时,多数方法采用领域相关度和一致度或者它们的改进方法进行领域本体概念的提取,第一,该方法提取的本体概念具有极强的领域性,且实验语料库都是静态的、规范的。而舆情语料信息是跨领域的、时刻变化的,显然该方法在舆情本体构建时有一定的局限性。第二,将基于主题的舆情语料作为训练语料时,只抽取与主题相关的高频词,过滤低频词。某一概念最终只能属于一个主题。但舆情语料是跨领域知识,一个词可能会出现在多个主题中。本文针对以上问题,采用信息爬取技术收集热点舆情文本信息,基于时间属性结合特征词的一些特点进行文档特征词抽取,建立空间向量,有效地发现内容焦点发生迁移但属于同一主题的网络文本,并将其归类。对识别后的主题文本提取名词性词汇或者短语作为候选概念集;根据语义相似度方法评估候选概念间的相关度,并对各概念的权值进行排序;结合词频变化的方法抽取与主题相关的核心概念。最后根据概念间已有的相关度,直接判断概念间关系。若概念间有直接关联,则这对概念具有一定的关系,结合不同方法划分关系类别以及确定关系名称。实验结果表明,本文方法可有效地抽取与舆情主题相关的核心概念,以及概念间关系,对舆情本体的构建以及后期的知识共享和重用都起到了积极作用。(本文来源于《新疆大学》期刊2016-05-01)

概念关系抽取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着互联网技术的飞速发展,数据量在不断递增,从海量数据中挖掘有效信息变得越来越重要。在这个过程中知识图谱,特别是领域知识图谱发挥了重要的作用,成为互联网知识驱动智能应用的基础设施。对于领域知识图谱的构建,首先应该构建知识图谱的数据模式。由于领域数据的庞大性,且大部分是非结构化文本,因而自动构建知识图谱的数据模式成为该领域研究的重点。领域术语的抽取、领域概念的抽取以及关系的抽取是构建知识图谱数据模式的重要因素。本文针对知识图谱数据模式的构建进行了以下叁个方面的研究。1)采用了基于混合策略的中文领域术语抽取方法。首先对领域数据集进行词法分析,基于规则进行候选领域术语的抽取;其次使用统计的方法对候选领域术语进行过滤,利用TF-IDF算法进行领域术语的抽取,利用TextRank算法进行单词术语多词术语的抽取。实验结果表明,该方法使得领域术语的抽取较为全面。2)提出了基于语义图的中文领域概念抽取方法。该方法针对领域术语,构建包含语义信息的术语语义图,使用社区发现算法对术语语义图进行分析和划分,从而实现概念抽取。实验结果表明,该方法能够有效利用语义信息获得较好的概念抽取结果。3)提出了一种基于语义特征的概念间关系抽取框架。首先使用基于语义图的概念关系识别方法进行概念间关系识别;然后使用基于依存句法分析的关系标注方法进行概念间关系标注。实验结果表明,充分融入句法和语义信息可以得到较好的抽取结果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

概念关系抽取论文参考文献

[1].周洋帆.基于图书的领域概念抽取及其前后序关系挖掘算法研究与应用[D].浙江大学.2018

[2].柴瑜晗.基于语义图的中文领域概念及关系抽取方法研究与实现[D].河北科技大学.2018

[3].王序文,李姣,吴英杰,李军莲.基于BiLSTM-CRF的中文生物医学开放式概念关系抽取[J].中华医学图书情报杂志.2018

[4].李志义,李德惠,赵鹏武.电子商务领域本体概念及概念间关系的自动抽取研究[J].情报科学.2018

[5].蒋婷,孙建军.领域学术本体概念等级关系抽取研究[J].情报学报.2017

[6].赵美玲.面向动态主题的舆情本体概念及关系的抽取研究[D].新疆大学.2017

[7].王娜.基于迁移学习的基础教育地理领域概念关系抽取[D].武汉理工大学.2017

[8].李丹阳.本体概念发现及其关系抽取关键技术研究与应用[D].河北科技大学.2016

[9].程春雷,夏家莉,曹重华,李光泉,曹中华.关系概念的Web文本主题抽取模型研究[J].小型微型计算机系统.2016

[10].张学芳.面向主题的舆情本体概念及关系的抽取研究[D].新疆大学.2016

标签:;  ;  ;  ;  

概念关系抽取论文-周洋帆
下载Doc文档

猜你喜欢