书读前后语言片段论文-李琼,李志

书读前后语言片段论文-李琼,李志

导读:本文包含了书读前后语言片段论文开题报告文献综述及选题提纲参考文献,主要关键词:书读前后语言片段,非分句,句法,形式标记

书读前后语言片段论文文献综述

李琼,李志[1](2010)在《基于句法信息的书读前后非分句语言片段识别》一文中研究指出基于句法信息的书读前后非分句语言识别和标注是现代汉语复句语料库建设工作的一部分。首先对文章的题目进行了阐释,接着论述了句法知识在中文信息处理中的作用,然后基于有关的句法信息制定了五条可程序化后供计算机执行的规则,最后给出了实验结果及分析。(本文来源于《重庆邮电大学学报(社会科学版)》期刊2010年02期)

李琼,李志[2](2010)在《基于语义知识的书读前后非分句语言片段识别》一文中研究指出这篇论文是现代汉语复句语料库建设中非分句自动识别和标注工作的一部分——基于语义知识的识别和标注。利用语义和搭配知识可以解决一部分复句中书读前后非分句语言片段的自动识别和标注问题。(本文来源于《湖北社会科学》期刊2010年03期)

李琼[3](2010)在《汉语复句书读前后语言片段的非分句识别》一文中研究指出为了建立一个面向中文信息处理的现代汉语复句精加工语料库,我们必须进行非分句语言片段的自动识别工作,目的是把这些语言片段排除在分句层次分析的范围之外。这项工作建立在自动分词和词性标注的基础上,主要分叁个阶段进行。(本文来源于《安庆师范学院学报(社会科学版)》期刊2010年01期)

李琼[4](2008)在《汉语复句书读前后语言片段的非分句识别》一文中研究指出为了满足中文信息处理事业的需要,在字处理和词处理阶段取得了初步成效后。句处理工作已经提上了重要的“议事日程”,因为自然语言理解归根结底还是对语言中一个一个句子的理解。汉语的句子包括单句和复句,其中复句的机器理解又是重难点所在;除了因为复句的机器理解必然要建立在单句理解的基础之上,还有一个重要的原因是复句的机器理解牵涉到分句之间层次和逻辑语义关系的划分。同时,随着计算机软硬件技术的提高,作为对基于规则的理性主义方法的一种补充,基于统计或实例的语料库方法日益得到了计算语言学家们的亲睐。正是在这种背景下,我们尝试建立一个“精加工”的现代汉语复句语料库,以期为复句的计算机理解提供相关语言知识和统计数据。本文只是这项语料库建设工作的一部分,主要目标是在进行语料库中复句语料的分句层次和关系划分以前,首先排除掉那些不参加复句层次和关系划分的书读前后语言片段,即对非分句语言片段进行识别和标注。主要内容如下:第一章首先回顾了前人对单复句纠结问题的研究,分析了单复句纠结的复杂现象,并尝试从认知语言学的“原型”角度看待这一客观事实,用“小句中枢”理论界定非分句(分句)的性质和范围;接着以标点符号为标记让计算机对分句进行了初步识别,排除了其中的一些非分句;最后对计算机不能以标点符号为标记识别的非分句进行了细致的分类描述,有汉语断句的随意性造成的非分句。有由于分句的某个组成成分比较复杂而促成的非分句,还有句子的某些特殊成分单独充当一个语言片段而形成的非分句。第二章首先介绍了词性和非分句的标注说明:接着根据“小句核心词”和“动词中心说”理论,利用标注的词性信息对一部分不包含动词的非分句进行了自动识别,并制定了一系列规则对这部分非分句实现类型的自动标注;最后,本章把一些由形式相对固定的短语充当的语言片段单独放入短语库中,通过制定一系列的短语库规则对它们进行自动识别。第叁章利用句法信息实现了一部分非分句的自动识别和标注。首先简单描述了计算机处理自然语言的工作模式;接着讨论了两种类型的“形式标记”及其对识别和标注非分句的作用:一类是显性形式标记,如介词充当的开头标记,时间词、方位词等充当的结尾标记,另一类是结构助词“的”和表判断义的动词“是”;并在此基础上制定了计算机自动识别和标注非分句的另外一系列规则,添加到规则库中。第四章是基于前两章所编规则的实验及其结果分析。首先建立一个access数据库,把规则中出现的开头标记和结尾标记逐一录入到这个库中。在判断某个语言片段是否为非分句时采用简单的字符串匹配法,把每个语言片段的开头部分或结尾部分跟数据库里录入的开头标记或结尾标记进行匹配。匹配成功的就是非分句。接着通过人工方式逐条检验了规则的识别或标注正确率,并简要分析了产生错误的原因及今后的改进策略。要特别说明的是,第二章和第叁章的规则都是在训练集中制定的,因此我们还要在训练集中统计这些规则的贡献率,然后把这些规则推广应用到整个复句语料库看正确率如何,同时不断改进和完善规则。第五章尝试综合利用句法、语义和搭配知识来识别一部分非分句,这方面的工作目前尚处于试验阶段。本章首先论述了语义知识在自然语言计算机理解中的重要性,接着介绍了国内外面向计算机研究语义的概况,并给出了本文所运用的语义理论。然后针对本项研究的具体情况阐述了工作前提,包括研究语料的选取和限定、解决问题的思路等。接下来就围绕语义角色、语义类别和语义特征等叁要素,试着为108个动词的127个义项建立起动宾语义搭配框架,并提出了判断动词后面两个名词之间有无偏正关系的十八条形式标准,还运用所建立的搭配框架分析了几个子语料库2中的实例,提出了建立“动宾搭配频率表”的设想。末尾对全章内容有个小结。第六章根据邢福义先生的有关论着从理论上制定了一系列识别名词充当核心词的分句即名词谓语句的规则,尽管训练语料库中的实际用例甚少。这部分规则并没有来得及在程序上实现,也未曾针对实际语料进行过人工检验。(本文来源于《华中师范大学》期刊2008-04-01)

书读前后语言片段论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

这篇论文是现代汉语复句语料库建设中非分句自动识别和标注工作的一部分——基于语义知识的识别和标注。利用语义和搭配知识可以解决一部分复句中书读前后非分句语言片段的自动识别和标注问题。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

书读前后语言片段论文参考文献

[1].李琼,李志.基于句法信息的书读前后非分句语言片段识别[J].重庆邮电大学学报(社会科学版).2010

[2].李琼,李志.基于语义知识的书读前后非分句语言片段识别[J].湖北社会科学.2010

[3].李琼.汉语复句书读前后语言片段的非分句识别[J].安庆师范学院学报(社会科学版).2010

[4].李琼.汉语复句书读前后语言片段的非分句识别[D].华中师范大学.2008

标签:;  ;  ;  ;  

书读前后语言片段论文-李琼,李志
下载Doc文档

猜你喜欢