命名实体发现论文-曹依依

命名实体发现论文-曹依依

导读:本文包含了命名实体发现论文开题报告文献综述及选题提纲参考文献,主要关键词:中文电子病历,实体识别,关系抽取,卷积神经网络

命名实体发现论文文献综述

曹依依[1](2019)在《基于命名实体识别的医学术语发现及应用》一文中研究指出随着计算机应用于医疗事业的发展,电子病历逐渐成为我国医生记录患者入院、病史、治疗、出院的主要载体。电子病历的特殊作用决定了其必定包含丰富的医学实体以及复杂的实体关系。医学实体以及实体间的关系是构建医学知识的基础,因此本文提出用机器学习算法对中文电子病历进行命名实体识别以及关系抽取。针对中文电子病历实体识别问题,本文设计了一种基于卷积神经网络结合条件随机场(Convolutional Neural Network-Conditional Random Field,CNN-CRF)的实体识别算法框架。为得到高质量的词向量,本文将标注实体加入词典进行分词,并将已标注和未标注文本作为语料,用word2vec工具对已分词文本进行无监督学习。为避免扩张卷积层数增加导致过拟合,本文采用迭代扩张卷积处理输入向量,并运用dropout随机丢弃一些连接,最后,利用条件随机场对网络的分类结果进行修正。该方法在中文电子病历上进行对比试验,从病历中提取出身体部位、疾病、症状、检查及治疗五类实体。实验结果表明,该方法能有效地辨别病历中的实体,其识别的精确率、召回率和F值分别为90.01%、90.62%、90.31%,相比传统的方法在精确率和速率都有一定提高。对于关系抽取任务,本文采用标注模式联合迭代扩张卷积神经网络结合条件随机场算法(Iterated Dilated Convolutional Neural Network+Conditional Random Field,ID-CNN+CRF)完成。实验将关系抽取问题转化为序列标注任务,并对实验数据进行标注转换、归一化、分句、向量化等预处理。根据数据分布,实验仅对身体部位、症状、检查几类实体存在的关系进行抽取。实验结果表明,相对于其他对比算法,本文提出的解决策略有较好表现,在小量实验数据的情况下,其平均精确率、平均召回率和平均F值分别取得63.93%、63.13%、63.40%。这样的结果一方面是由于实验抽取关系类别较少,另一方面表明实验方案对于解决关系抽取问题是有效的。(本文来源于《重庆邮电大学》期刊2019-03-23)

欧阳恩,李作高,李昱熙,张晓艳[2](2018)在《基于深度学习的电子病历命名实体识别及其在知识发现中的应用》一文中研究指出通过引入医学文本语言和文档类别特征,构建了一个基于深度学习的电子病历命名实体识别系统。识别的实体包括身体部位、症状和体征、疾病和诊断、检查和检验以及治疗5大类。基于模型识别的结果,将其应用在基于共现的临床知识发现中。命名实体识别系统的准确率为93.29%,召回率为93.53%,F1值为93.41%。医学语言特征的引入能够进一步提高基于深度学习的医学实体识别系统的效果,实体识别的结果可以作为电子病历知识发现的基础。(本文来源于《中国卫生信息管理杂志》期刊2018年04期)

杜洋[3](2017)在《基于词向量表征的新词发现及命名实体识别研究》一文中研究指出数据挖掘中结构化数据的挖掘分析相对成熟,但非结构化的数据挖掘分析面临许多挑战。文本数据是一种非常重要的非结构化数据,对于该种数据类型的挖掘分析面临着更多的挑战,主要面临如中文分词、命名实体识别、实体关系抽取、语义理解,情感分析等等一系列的问题。其中,分词技术几乎是绝大多数中文文本数据挖掘分析的基础步骤。然而,由于人们总是在不断地创造新的词汇,这些新词是不可能被人们完全收录,所以会导致分词错误,从而引致命名实体的标记错误。因此,新词识别已经成为文本挖掘的一个难点和瓶颈问题。近几年利用神经网络或深度学习训练语言模型而得到的词向量表征能够很好的表征词与词之间的语义关系,受此启发,本文把这种词向量表征用于中文的新词发现识别中,提出了一个基于词向量表征和n-gram相结合的无监督的新词发现方法。首先,本文通过训练神经网络语言模型把词映射到一个高维空间,并且对比了Skip-gram模型和CBOW模型得到的词向量对新词结果的影响,发现Skip-gram模型能够取得更好效果。其次,考虑到如果几个相邻的词经常的共同出现在不同的词序列中,那么他们一定存在某种关系。本文受关联规则算法的启发,设计了高效的n-gram挖掘算法,把挖掘出的n-gram作为新词候选词串。接着,本文利用训练好的词向量对候选词串进行剪枝,剔除噪音数据,从而得到新词结果。本文还设计了剪枝算法,并且对比了不同向量相似性度量方法对最终结果的影响,发现余弦相似性剪枝效果最好。同时,本文也和其他新词发现方法做了相应对比,证实了本文方法的有效性。最后,本文在新词结果的基础上,进一步利用条件随机场对结果进行分类,从而实现命名实体词的识别。本文的主要贡献为:(1)在中文新词识别领域引入了神经网络训练的词向量,把词向量和n-gram相结合,提出了一种新的无监督的新词识别方法。(2)在新词发现的基础上利用条件随机场对新词进行分类并识别出其中的命名实体词,为命名实体识别提出了一种新的实践。(本文来源于《电子科技大学》期刊2017-04-01)

李晶[4](2006)在《基于网络抱团发现的命名实体关系抽取》一文中研究指出关系抽取是是信息抽取研究领域的一个重要课题。关系抽取的目的是从文本中发现两命名实体间的关系。近年来,该技术得到越来越多的关注,被运用到各个领域中,如:信息抽取,本体构造,问答系统,生物技术等。 自从1995年,第六届信息理解会议(the Sixth Message Understanding Conference MUC-6)提出关系抽取这个概念以来,在命名实体关系抽取方面已经开展了大量的研究工作,但绝大部分研究都是基于有导学习的。有导学习方法最大的问题在于需要花大量的时间去标注足够数量的训练语料,此外系统很难从一个领域移植到另外一个领域中。为了突破有导学习方法中的限制,无导方法被提出来。但是,目前无导方法仍然存在一些问题:(1)命名实体对一般是通过一定范围内的上下文来进行描述地,但是如何设置上下文窗口大小,一直以来都没有一个客观的标准;(2)在命名实体对的聚类过程中,往往存在着很大的噪音,如何能在噪音存在的情况下保证较好的聚类效果:(3)命名实体对之间的语义关系是具有层次结构的,如何描述这种层次结构的关系。 针对以上问题,本文尝试性地提出了一种基于网络化数据挖掘的命名实体对关系抽取的方法。在该方法中,我们采用了如下叁种关键技术:1、利用网络化结构来表示命名实体对;2、基于抱团现象的命名实体对聚类;3、基于语义层次的命名实体关系描述。特别值得一提的是在关键技术1中我们着重解决了实体对上下文窗口大小的设置的问题,在关键技术2中我们创新性的提出了一个如何在带权网络中发现抱团现象的方案。 为了验证提出的命名实体对关系抽取方法的可行性和有效性,我们以半年人民日报为语料进行实验。结果表明,本文提供的方法不但可以以较高的准确率发现命名实体间的语义关系,而且能够恰当地标注命名实体间的语义关系。(本文来源于《华中师范大学》期刊2006-05-01)

庄明,老松杨,吴玲达[5](2004)在《一种统计和词性相结合的命名实体发现方法》一文中研究指出在利用专业文献自动构建知识库的过程中 ,需要正确识别专业文献中的命名实体。文章针对命名实体识别问题 ,提出了一种以统计为主发现命名实体的方法。该方法利用切分标记将原文切分为较短的汉字串 ,采用自增长统计算法从汉字串中生成原始模式集 ,并利用统计信息和词性信息筛选出命名实体。(本文来源于《计算机应用》期刊2004年01期)

命名实体发现论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

通过引入医学文本语言和文档类别特征,构建了一个基于深度学习的电子病历命名实体识别系统。识别的实体包括身体部位、症状和体征、疾病和诊断、检查和检验以及治疗5大类。基于模型识别的结果,将其应用在基于共现的临床知识发现中。命名实体识别系统的准确率为93.29%,召回率为93.53%,F1值为93.41%。医学语言特征的引入能够进一步提高基于深度学习的医学实体识别系统的效果,实体识别的结果可以作为电子病历知识发现的基础。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

命名实体发现论文参考文献

[1].曹依依.基于命名实体识别的医学术语发现及应用[D].重庆邮电大学.2019

[2].欧阳恩,李作高,李昱熙,张晓艳.基于深度学习的电子病历命名实体识别及其在知识发现中的应用[J].中国卫生信息管理杂志.2018

[3].杜洋.基于词向量表征的新词发现及命名实体识别研究[D].电子科技大学.2017

[4].李晶.基于网络抱团发现的命名实体关系抽取[D].华中师范大学.2006

[5].庄明,老松杨,吴玲达.一种统计和词性相结合的命名实体发现方法[J].计算机应用.2004

标签:;  ;  ;  ;  

命名实体发现论文-曹依依
下载Doc文档

猜你喜欢