导读:本文包含了地点实体论文开题报告文献综述及选题提纲参考文献,主要关键词:最长地点实体,实体识别,最大熵模型
地点实体论文文献综述
高燕,张维维,张艳红,谢燕萍,苏凝[1](2012)在《最大熵模型在最长地点实体识别中的应用》一文中研究指出实体识别是自然语言处理领域中一个十分重要的问题,是信息提取的基础,其识别程度直接影响了后续的句法分析、篇章理解等工作的精确程度。"熵"最初是热力学的一个概念,用来表示不确定度,熵越大,不确定性越大。"最大熵"模型是一种融合多种特征于一体,并综合这些特征进行建模,在满足约束的模型中选择熵最大的模型。"最大熵"模型可以综合观察到各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的效果。通过实验分析了在新闻报道领域最长地点实体的特征,并应用了最大熵模型进行了识别研究。(本文来源于《广东石油化工学院学报》期刊2012年04期)
高燕,刘娟[2](2011)在《受限领域中最长地点实体提及的提取研究》一文中研究指出实体是构成事件信息的基本单元,在事件中扮演着重要的角色。在自然语言处理领域,实体识别是信息提取、句法分析、机器翻译、篇章理解等应用领域重要的基础性工具。汉语句法成分特有的套迭现象决定了实体表达的复杂性,增加了识别的难度。这使得已有的用于命名实体识别中的研究方法在长地点实体的识别中不能取得好的效果。为研究自动提取实体方法,文章从事件报道领域出发,以最长地点实体为对象,对325篇新闻语料进行地点实体标注和抽取,分析、研究了地点实体的出现特征,并根据分析结论提出实体提取可行方案。(本文来源于《计算机与数字工程》期刊2011年07期)
高燕[3](2009)在《事件报道中地点实体的提取研究》一文中研究指出实体是构成事件信息的基本单元,在事件中扮演着重要的角色。在自然语言处理领域,实体识别是信息提取、句法分析、机器翻译、面向Semantic Web的元数据标注等应用领域重要的基础性工具。在事件报道类文本中,事件发生的地点、事件中涉及到的人、事件中涉及到的物作为事件发生的叁大要素,是实体在此类文本中充当的叁大角色,若能实现这叁者的自动提取,那么对事件信息的获取、文本的框架结构研究等奠定了基础,对于句法分析、篇章分析也有着重要的意义。本文从事件报道类文本出发,选择其中的地点实体来进行研究。这里说的地点实体,不同于命名实体识别中的地名,而是指在文本中充当事件发生地点角色的实体,从形式上看,是地点在文本中对应的最长名词短语形式。汉语句法成分特有的套迭现象决定了这类实体表达的复杂性。具体表现为:实体表达的长度不受限制,目前在文本中发现的最长的地点实体表达长达35个字长;实体表达内部可能含有逗号、顿号、双引号、小括号等多种标点符号;地点实体的表达形式多样,同一个地点可以以不同的形式在文中反复出现。这些特点增加了地点实体识别的难度,已有的应用于命名实体识别中的研究方法在地点实体的识别中不能取得好的效果。根据任务特点以及对多种提取方法的对比研究,本文选择用规则方法进行地点实体的提取研究。为此,本文做了以下工作:①人工标注地震、火灾、中毒、恐怖袭击、交通事故五类共325篇报道文本(约16万字)。②在人工标注的语料基础上,统计分析地点实体的内部结构特征、边界分布特征以及它们在文中出现上下文环境特征,并根据这些特征建立规则模型。该模型分为四个部分:核心规则模型、分类规则模型、前置及后置规则模型和修正规则模型。③应用规则模型进行地点实体抽取实验,取得了较好的效果:于封闭测试中获得85.8%的精确率,开放测试获得79.7%的精确率。(本文来源于《北京语言大学》期刊2009-06-01)
地点实体论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
实体是构成事件信息的基本单元,在事件中扮演着重要的角色。在自然语言处理领域,实体识别是信息提取、句法分析、机器翻译、篇章理解等应用领域重要的基础性工具。汉语句法成分特有的套迭现象决定了实体表达的复杂性,增加了识别的难度。这使得已有的用于命名实体识别中的研究方法在长地点实体的识别中不能取得好的效果。为研究自动提取实体方法,文章从事件报道领域出发,以最长地点实体为对象,对325篇新闻语料进行地点实体标注和抽取,分析、研究了地点实体的出现特征,并根据分析结论提出实体提取可行方案。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
地点实体论文参考文献
[1].高燕,张维维,张艳红,谢燕萍,苏凝.最大熵模型在最长地点实体识别中的应用[J].广东石油化工学院学报.2012
[2].高燕,刘娟.受限领域中最长地点实体提及的提取研究[J].计算机与数字工程.2011
[3].高燕.事件报道中地点实体的提取研究[D].北京语言大学.2009