汉语框架网论文-张晟

汉语框架网论文-张晟

导读:本文包含了汉语框架网论文开题报告文献综述及选题提纲参考文献,主要关键词:篇章句间关系,汉语框架网,神经网络,概率统计

汉语框架网论文文献综述

张晟[1](2018)在《基于汉语框架网的篇章句间关系发现》一文中研究指出研究篇章句间关系一直是自然语言处理领域非常重要的课题,理解篇章句间关系对篇章整体语义表述和篇章逻辑结构理解有重要意义。随着自然语言处理的发展,对语义的理解逐渐从词汇级或句子级语义向篇章级语义过渡。因此,让计算机自动发现篇章句间关系对自然语言处理的发展有深远意义。本文以国家自然科学基金“汉语篇章框架语义关系网自动抽取及其语义推理”项目为背景,使用汉语框架网知识库,分别基于神经网络和框架关系构建了两种发现隐式篇章句间关系的模型,然后将两种模型融合后进一步提升模型性能。最后依据构建的模型研发了汉语篇章框架语义自动抽取系统。本文的主要工作如下:(1)使用汉语框架网的框架元素和词汇信息联合表示句子语义,用多层感知机分析篇章句间关系,并通过调节神经网络各层参数使得实验结果最佳。(2)对篇章句子激起的框架进行框架排歧后,使得一个句子的语义用一个框架来表示,运用图论相关算法构建篇章框架关系图。使用框架关系和关联规则分析算法挖掘框架关系与篇章句间关系的映射。(3)设计和实现了汉语篇章框架语义自动抽取原型系统,并使用UI相关技术实现了篇章框架关系及篇章句间关系的可视化,验证了本文提出的方法的有效性。同时系统还预留接口方便日后更新维护和二次开发。(本文来源于《山西大学》期刊2018-06-01)

张彦明[2](2015)在《基于XML的汉语框架网的语义表示与实现》一文中研究指出汉语框架网(Chinese FrameNet,CFN)是以Fillmore的框架语义学作为理论基础,以FrameNet为参照,以汉语语料事实为依据的供计算机使用的汉语词汇语义资源。CFN主要是由框架库、句子库和词元库叁部分组成。目前构建了323个汉语框架,涉及3947个词元,标注了20000个句子,为计算机进行汉语框架语义分析及其应用研究提供了宝贵的汉语语义资源。如何有效的对汉语框架网的资源进行知识表示,是实现其应用价值的关键所在。本文使用可扩展标记语(XML)来表示CFN资源数据,通过使用统一的描述策略,使计算机可读,且适合人阅读和理解,并为后续研究及相关语义辅助工具的应用提供帮助。本文的主要研究内容如下:(1)汉语框架网语义资源包含框架库、句子库和篇章库,针对叁个库的结构特点,遵循XML规范,参照FrameNet、语言技术平台(Language Technology Platform,LTP)相关资源的表示,系统地制定了汉语框架网语义资源XML表示体系。(2)框架库、词元库资源均以word文档格式存储,学习并掌握了jacob技术,同时结合微软office的组件,完成了word文档向XML文件的转换。目前现有的资源已全部转换,共计4270篇。(3)针对已经标注好的句子和篇章生成XML文件的特点,设计并实现了汉语框架网语义资源句子库和篇章库的XML文件自动生成系统。目前已生成18000条句子和164个篇章的XML文件。(4)为了让研究人员更直观地分析理解所用资源的语义信息,针对框架库资源的多角度展现角色关系的特点,借鉴FrameNet展示技术,掌握并使用XSL样式表,使资源在web浏览器上展现出来更加美观。同时构建索引对资源进行统一管理,使研究人员更快速的检索资源。本文根据汉语框架网资源的结构特点,建立了一个基于XM[.语言的汉语框架网语义资源表示体系,目前已经实现自动生成XML文件系统,达到机器自动高效读取,以及在web浏览器上展示框架的XML文件,为研究人员直观分析理解框架资源的语义信息提供了便利。同时,该系统可结合自动语义分析系统,将其语义分析结果自动生成XML文件,扩展了CFN的应用范围,为后续相关研究奠定了基础。(本文来源于《山西大学》期刊2015-06-01)

陈学丽,李茹,王赛,王智强[3](2014)在《汉语框架网中未登录词元的框架选择》一文中研究指出汉语框架网的低覆盖率导致汉语句子中存在许多未登录的词元,严重制约着汉语的框架语义分析任务。针对未登录词元的框架识别问题,该文借助同义词词林的词义信息,提出基于平均语义相似度计算及最大熵模型两种方法,采用静态特征与动态特征相结合的特征选择方法。实验证明,这两种方法都能有效地实现未登录词元的框架选择,基于相似度计算的方法(TOP-4)获得78.61%的准确率;基于最大熵的方法结果可达87.29%,同时在新闻语料上达到了75%的准确率。(本文来源于《中文信息学报》期刊2014年03期)

王新磊,韩慧健[4](2014)在《基于汉语框架网的中文FAQ问答系统》一文中研究指出问句相似度计算是中文FAQ问答系统的关键部分,其计算精度决定系统的质量。结合问句分类索引提出了基于汉语框架网的问句相似度计算新方法。该方法在问句自动分类匹配基础上,结合概念语义与问句整体语义进行问句相似度计算,与传统基于关键词和单纯语义的问句相似度计算方法相比,汉语框架语义信息的引入使得中文问句相似度计算精度得到明显提高。实验结果表明该方法能够有效解决中文问答系统的中问题智能匹配等问题。(本文来源于《Proceedings of 2014 3rd International Conference on Information,Business and Education Technology(ICIBET 2014)》期刊2014-02-27)

陈学丽[5](2013)在《汉语框架网中未登录词元的识别技术研究》一文中研究指出目前词汇语义资源在自然语言处理领域的许多应用中都发挥着重要的作用,但是所有的语义资源都面临一个共同的限制——低覆盖率,汉语框架网也不例外。目前汉语框架网的覆盖率较低,对于开放的文本必定会存在许多词元库中未登录的词,严重制约着汉语框架语义分析任务。针对未登录词元的识别问题,本文借助《同义词词林》的词义信息,分别进行了未登录词元的目标词识别与框架选择的研究。本文的主要研究内容及贡献分以下两方面介绍:针对未登录词元目标词识别任务的研究,提出两种方法。(1)基于词元库扩充的方法,利用《同义词词林》词义信息到CFN词元库的映射来获得扩充的CFN词元库,并利用词义信息来进行目标词的识别,实验结果显示利用扩充后的词元库的识别结果比利用原有词元库的召回率得到了明显提高,而词义信息的加入则使准确率得到了提高。(2)基于最大熵模型的方法,实验选取了词、词性、词义作为特征,对于未登录词元的目标词识别最好达到了90.95%的F值。此方法是一种动态的方法比第一种静态的方法获得了更好的结果,同时,可以识别出词典中的未登录词元。针对未登录词元框架选择任务的研究,提出两种方法。(1)基于平均语义相似度计算的方法,算法思想是同一框架下的词元具有高度相似性,最终实验结果(TOP-4)达到了78.61%准确率。(2)基于最大熵模型的方法,特征选择的方法采用静态特征与动态特征相结合的方法。在第一种方法相同的语料(Test1)上实验结果可达到87.29.%的未登录词元框架选择准确率,针对新闻语料(Test2)中完全未登录词元获得75%的准确率,结果显示词义信息是最优静态特征而依存句法特征为最优动态特征。以上方法为汉语的框架语义分析任务中未登录词元的识别任务提供了有效的解决方法,同时也提供了词元库自动扩充的有效途径。本文的贡献主要集中在首次研究汉语框架网中未登录词元的目标词识别与框架选择问题,并借助《同义词词林》语义资源中的词义信息,提出利用语义层面的特征去解决未登录词元的识别问题,为未登录词元识别的进一步研究提供了重要的特征选择依据。(本文来源于《山西大学》期刊2013-06-01)

王文晶,李茹[6](2011)在《基于汉语框架网的问句分析及本体知识库推理》一文中研究指出针对受限领域问答系统中的问句理解,提出一种将汉语框架网(Chinese FrameNet,简称CFN)应用于问句分析中,并且以旅游交通领域问句为例分析方法的有效性。首先利用CFN语义角色标注和问句句型相结合的方式制定模板,根据CFN语义分析得到的框架元素与本体叁元组特点,制定该模板在旅游本体库中答案抽取的规则。该方法在很大程度上提高了问句的语义性,为问句分析提供了一种新的研究方法。(本文来源于《电脑开发与应用》期刊2011年09期)

王文晶,宋小香,李茹[7](2011)在《面向问题分类的汉语框架网特征选择》一文中研究指出特征选择是影响问答系统中问题分类的重要因素。本文充分利用汉语框架网在语义表达方面的特点,提出一种面向问题分类的强类别信息词(SCIW)特征选择方法。首先选择五种汉语框架网特征作为候选特征,然后采用SCIW特征选择方法,根据每一类别的分类精度对单个特征的分类能力进行排序,并通过特征组合实验,选出具有最好分类效果的组合特征,达到特征约简的效果。(本文来源于《计算机与现代化》期刊2011年08期)

赵文娟,闫红梅,王蔚林[8](2011)在《基于汉语框架网的语义角色标注算法》一文中研究指出在汉语框架网(CFN)的基础上,介绍语义角色自动标注的步骤和流程,提出基于文本匹配和最大熵分类器的语义角色自动标注方法。在文本匹配算法中,综合考虑短语类型、短语相对于目标词位置、句法功能叁个因素及其对句子相似度影响的权重;在最大熵算法中,也尝试一些新的特征及其组合,最后利用例子对该方法进行有效性验证。(本文来源于《图书情报工作》期刊2011年06期)

宋小香[9](2010)在《基于汉语框架网的中文问句分类研究》一文中研究指出计算机和网络的出现方便了人们对信息的获取,随着互联网的飞速发展和计算机的迅猛更新,如何从互联网上更快地获取到更准确的有用信息成了人们的关注热点。现有的搜索引擎返回给用户的都只是一些与搜索内容信息相关的网页,这就需要用户自己再从这些网页中进一步寻求所需信息。显然这给人们查询信息带来了许多不便,而且无形中降低了查询效率。而问答系统(Question Answering System, QA)只需用户给出简单的问句,便可以返回给用户简洁、准确的信息,快速而有效地满足了用户对信息的检索需求。因此,问答系统的研究逐渐受到国内外众多学者的广泛关注,并已经取得了一定的研究成果。问句分类即确定问句所属的类型,是问答系统中必不可少的一部分,分类的准确性直接影响问答系统的性能。本文基于汉语框架网(Chinese FrameNet, CFN)提出了一种用于中文问句分类的新方法,该方法通过构建一系列CFN语义特征来表达每个问句的语义信息。首先选择五种汉语框架网特征作为候选特征,根据每一类别的分类精度对单个特征的分类能力进行排序,然后通过特征组合进行实验,选出具有最好分类效果的组合特征。本文的主要工作包括:(1)通过调查问卷的形式收集并整理了山西旅游的相关问句2155条,并参照哈工大信息检索研究室的问句分类标准,结合山西旅游问句的特点,给出适合山西旅游的问句分类体系,分为7大类,73小类,进一步丰富了原有的中文问题分类体系。(2)对CFN标注的问句集进行分析和整理,选出五种CFN语义特征,使用最大熵分类模型进行实验。首先对单个特征的分类能力进行排序,然后分别对这些特征的组合进行实验;通过实验,得到了其中叁种特征的组合可以达到最好的分类效果;进一步从理论上分析了这叁种特征对问句分类的重要性。最后本文还给出了每类问题的准确率、召回率以及F值。(3)采用SVM分类器进行对比实验,实验结果表明,相比较于SVM分类器,最大熵分类模型比较适合于处理问句的分类。问句分类是问答系统对问句进行处理的重要步骤,对后续模块起着很好的指导作用,提高问句分类的准确率可提高整个问答系统的性能。本文针对问句分类方法的尝试与探索进一步丰富和发展了中文问题分类的研究,并为设计高效的问答系统提供了一定的基础。(本文来源于《山西大学》期刊2010-06-01)

彭洪保[10](2010)在《基于汉语框架网的问句语义角色标注研究》一文中研究指出语义分析是自然语言处理领域的重要问题,也是当前研究的热点和难点问题。由于深层语义分析在目前的技术背景下还难以实现,特别是自动句法分析的瓶颈很难逾越,于是很多学者开始将注意力集中在任务相对简单但很实用的“浅层语义分析(Shallow Semantic Parsing)"上。其中,语义角色标注作为浅层语义分析的一种有效方式,越来越受到自然语义处理领域的关注问句的语义理解伴随着搜索引擎的普及和问答系统的广泛应用而越来越受到人们的特别关注。本文针对中文问句的特点,基于汉语框架网(Chinese FrameNet, CFN),提出了一种综合运用词性筛选和层迭条件随机场模型的方法对中文问句进行语义角色自动标注。本文探索性地对中文问句进行了浅层语义分析,研究内容主要包括以下几个方面:首先,分析研究了中文问句的特点,详细介绍了汉语框架网。通过对面向山西旅游的3011条问句和哈工大问句语料库的分析,问句具有其独特的形式特点,如句子长度一般较陈述句短、具有相对确定的疑问词、表达形式上有一定的结构相似性等特点。其次,本文选用了一种将基于统计方法的条件随机场模型与基于规则方法的词性筛选模型相结合的方式对中文问句进行语义角色自动标注。并提出了一种根据问句目标词共现率来判别句子所属框架的方法。通过实验获得了较为理想的效果。最后,通过实验结果分析了问句语义角色标注的有效特征,对比了问句与陈述句标注的不同之处。并探索性的将问句语义角色标注应用于面向山西旅游智能问答系统,在问题理解和答案抽取阶段取得了理想的实验效果。(本文来源于《山西大学》期刊2010-06-01)

汉语框架网论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

汉语框架网(Chinese FrameNet,CFN)是以Fillmore的框架语义学作为理论基础,以FrameNet为参照,以汉语语料事实为依据的供计算机使用的汉语词汇语义资源。CFN主要是由框架库、句子库和词元库叁部分组成。目前构建了323个汉语框架,涉及3947个词元,标注了20000个句子,为计算机进行汉语框架语义分析及其应用研究提供了宝贵的汉语语义资源。如何有效的对汉语框架网的资源进行知识表示,是实现其应用价值的关键所在。本文使用可扩展标记语(XML)来表示CFN资源数据,通过使用统一的描述策略,使计算机可读,且适合人阅读和理解,并为后续研究及相关语义辅助工具的应用提供帮助。本文的主要研究内容如下:(1)汉语框架网语义资源包含框架库、句子库和篇章库,针对叁个库的结构特点,遵循XML规范,参照FrameNet、语言技术平台(Language Technology Platform,LTP)相关资源的表示,系统地制定了汉语框架网语义资源XML表示体系。(2)框架库、词元库资源均以word文档格式存储,学习并掌握了jacob技术,同时结合微软office的组件,完成了word文档向XML文件的转换。目前现有的资源已全部转换,共计4270篇。(3)针对已经标注好的句子和篇章生成XML文件的特点,设计并实现了汉语框架网语义资源句子库和篇章库的XML文件自动生成系统。目前已生成18000条句子和164个篇章的XML文件。(4)为了让研究人员更直观地分析理解所用资源的语义信息,针对框架库资源的多角度展现角色关系的特点,借鉴FrameNet展示技术,掌握并使用XSL样式表,使资源在web浏览器上展现出来更加美观。同时构建索引对资源进行统一管理,使研究人员更快速的检索资源。本文根据汉语框架网资源的结构特点,建立了一个基于XM[.语言的汉语框架网语义资源表示体系,目前已经实现自动生成XML文件系统,达到机器自动高效读取,以及在web浏览器上展示框架的XML文件,为研究人员直观分析理解框架资源的语义信息提供了便利。同时,该系统可结合自动语义分析系统,将其语义分析结果自动生成XML文件,扩展了CFN的应用范围,为后续相关研究奠定了基础。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

汉语框架网论文参考文献

[1].张晟.基于汉语框架网的篇章句间关系发现[D].山西大学.2018

[2].张彦明.基于XML的汉语框架网的语义表示与实现[D].山西大学.2015

[3].陈学丽,李茹,王赛,王智强.汉语框架网中未登录词元的框架选择[J].中文信息学报.2014

[4].王新磊,韩慧健.基于汉语框架网的中文FAQ问答系统[C].Proceedingsof20143rdInternationalConferenceonInformation,BusinessandEducationTechnology(ICIBET2014).2014

[5].陈学丽.汉语框架网中未登录词元的识别技术研究[D].山西大学.2013

[6].王文晶,李茹.基于汉语框架网的问句分析及本体知识库推理[J].电脑开发与应用.2011

[7].王文晶,宋小香,李茹.面向问题分类的汉语框架网特征选择[J].计算机与现代化.2011

[8].赵文娟,闫红梅,王蔚林.基于汉语框架网的语义角色标注算法[J].图书情报工作.2011

[9].宋小香.基于汉语框架网的中文问句分类研究[D].山西大学.2010

[10].彭洪保.基于汉语框架网的问句语义角色标注研究[D].山西大学.2010

标签:;  ;  ;  ;  

汉语框架网论文-张晟
下载Doc文档

猜你喜欢