汉语词性标注论文-苏矗

汉语词性标注论文-苏矗

导读:本文包含了汉语词性标注论文开题报告文献综述及选题提纲参考文献,主要关键词:《现代汉语词典》,词性标注,名物化

汉语词性标注论文文献综述

苏矗[1](2018)在《《现代汉语词典》(第7版)词性标注商榷》一文中研究指出《现代汉语词典》是我国的一部汉语规范词典,从第5版开始其对所收条目做了全面的词性标注。第7版的修订使《现代汉语词典》的词性标注已逐步趋于完善。但《现代汉语词典》(第7版)在词性标注方面似乎仍存在一点可商榷之处:一些已标注动词、形容词的条目配例不确,其中出现了"名物化"现象,将这种有争议的现象列入词典会带来误解。(本文来源于《新乡学院学报》期刊2018年02期)

王艺帆,王希杰[2](2016)在《基于双层条件随机场的汉语词性标注方法研究》一文中研究指出针对汉语词性标注中词性类别划分较细、类别较多的问题,提出一种利用双层条件随机场进行汉语词性标注的方法,该方法将汉语词性标注分为两个阶段,每个阶段采用一层条件随机场建模实现。第一阶段底层条件随机场根据上下文产生每个词语的词性粗分结果;第二阶段高层条件随机场将词语及其粗分结果作为上下文特征对每个词语的词性进一步细分,产生最终词性标记。利用CRF++0.53工具包,在国际汉语分词评测Bakeoff2007(国际汉语分词评测)的NCC和CTB语料上进行了实验,结果表明该方法可行且可以获得较好的标注结果。(本文来源于《安阳师范学院学报》期刊2016年05期)

颜湘茹,金仙儿[3](2016)在《《中韩词典》词性标注问题探索——与《现代汉语词典》对比》一文中研究指出《中韩词典》是韩国的汉语学习者们最常用的词典之一,其准确性直接影响着该词典的使用者掌握汉语的准确性。本文通过研究却发现,由于语言系统的不同、汉韩词性划分标准不同等各种原因,《中韩词典》的词性标注存在着一些问题。因此,本文以《现代汉语词典》的词性标注为参照,对《中韩词典》进行了系统全面对比,通过对比研究找出《中韩词典》中词性标注存在的问题,并分析其产生的原因和影响,就如何修订《中韩词典》提出了一些具体建议。(本文来源于《海外华文教育》期刊2016年05期)

王志琴[4](2016)在《李晓琪主编《博雅汉语》的词性标注的针对性研究》一文中研究指出文章的研究对象是李晓琪主编的《博雅汉语》中词语的词性标注,词性判断以《现代汉语词典》(第5版)为标准。找出了书中词性标注不准确的词语,对外汉语教材的词性标注应该只针对词语在课文中出现的词性进行标注,而不是像词典等工具书一样全部进行罗列。词性标注不准确的原因主要有以下几点:汉语词语词性的复杂性、对外汉语教学发展不成熟和编写者的语法知识的有限性。针对这些问题提出了我们的建议,编写教材要注意词性和课文例句之间的配合、词性标注不要面面俱到以及要选择科学的符号进行标注词性。文章一共分成5个部份。第一部份是绪论,具体介绍了本文研究的内容和意义,研究的方法和步骤,相关文献的综述以及语料。第二部份主要列举了教材中词性标注存在的一些问题。例如:缺乏针对性,词性的标注和课文的例子不一致,一个词标注多个词性,没有标注词性,离合词词性标注的针对性分歧以及教材中出现的一些其他问题。这是文章论述的重点。第叁部份探讨出现词性标注问题的原因,并且根据原因提出了一些具体的词性标注的对策,教材词语的词性标注要针对课文中的例子有针对性地进行标注。第四部份是结论。对外汉语教材的词性标注应该要针对课文中的具体例子来进行标注,不是罗列出所有的词性。(本文来源于《湖南师范大学》期刊2016-04-01)

郭利芳[5](2016)在《《现代汉语词典》(第6版)词性标注考察分析》一文中研究指出《现代汉语词典》(以下简称《现汉》)是一部极具权威性的语文辞书,在学术界也有极高的地位。《现汉》第6版坚持与时俱进,以第5版为基础进行修订,分别从收字、收词、配例、释义等几个方面设立研究专题。因此《现汉》具有很强的规范性、科学性和系统性。《现汉》的每一次修订都表明了它在尽力弥补着过去的不足,并酌情反映新的词语现象,克服着词典通常所有的滞后性,并尽可能地服务于现时大众的语文应用需要。尽管如此,每一次修订过后,随着时间的推移人们往往又会发现它的疏漏处或出现的新问题。本文就《现汉》第6版中的词性标注作为研究对象,围绕新版本中存在的相关问题从四个大方面展开讨论:首先在总结前人研究的基础上,探索与词性相关的理论。对现代汉语的词类系统进行了梳理,并对词性标注的意义和原则做了简单说明。另外提出《现汉》的编写人员应选用恰当的词类体系,并保持释义、配例与词性相一致,注意兼类词问题等。第二部分着重比较了《现汉》第6版与第5版的词性标注,主要是对比第5版中旧有词语的词性。经过仔细对比分析后发现部分词语的词性、释义和配例都有所改变。第叁部分主要是对《现汉》第6版中新收的词语进行词性分析。最后一部分是对第6版《现汉》中仍旧存在的一些与词性相关的问题进行讨论,如词性与配例和释义的一致性,惯用语的词性标注等,并试图揭示存在这些问题的可能性原因。本文坚持定量和定性相结合的分析方法,注重发挥理论对具体词性分析认定的指导作用,以《现汉》第6版中69000余条词语为考察对象,尽可能对所有词性标注进行检验。最后得出结论,社会语言运用与词典之间是一种互动过程,特别是权威性的词典,更需要不断地臻于完善,因此《现汉》的修订是永无止境的。(本文来源于《河南师范大学》期刊2016-04-01)

韩霞,黄德根[6](2015)在《基于半监督隐马尔科夫模型的汉语词性标注研究》一文中研究指出提出一种基于词语相似度计算的半监督隐马尔科夫词性标注方法.首先,利用小规模的训练语料进行半监督隐马尔科夫学习,通过反复迭代不断扩充语料,增强隐马尔科夫的标注效果;然后,通过计算词语相似度的方法,给测试语料中每个未登录词都标上候选词性;最后,在隐马尔科夫标注时,不是选取一条最佳路径,而是选取两条最佳路径,通过二次选择,以此得到标注结果.实验结果证明,该方法与传统的隐马尔科夫标注方法相比提高了约2.60%,汉语词性标注准确率达到了95.65%.(本文来源于《小型微型计算机系统》期刊2015年12期)

胡静书[7](2015)在《论《现代汉语词典》(第6版)词性标注与例句不一致问题》一文中研究指出在标注词性的词典中,例句不仅帮助理解词语释义,还应帮助体现所标注词性,《现代汉语词典》(第6版)中有不少例句不能准确说明词性,造成这类现象的根本原因是未能贯彻以语法功能为主要标准来确定词性的原则。(本文来源于《现代语文(学术综合版)》期刊2015年06期)

韩霞[8](2015)在《基于半监督隐马尔科夫的汉语词性标注研究》一文中研究指出随着信息技术和网络技术的不断进步与发展,计算机成为了人类生活必不可少的一种工具。由计算机智能地处理人类语言的技术,即自然语言处理(Natural Language Processing, NLP)技术便应运而生。词性标注(Part-Of-Speech Tagging)作为其中较为基础的一种预处理程序,对后续的工作和课题研究都起着至关重要的作用。本文使用基于隐马尔科夫模型(Hidden Markov Model)的词性标注方法,从如下几个方面进行了改进,以提高标注的准确率。首先,利用小规模训练语料进行半监督学习,通过反复迭代不断扩充语料,增强马尔科夫标注效果,尤其对于不同领域的语料,这种迁移学习也能提高标注准确率;其次,通过词语相似度的方法,给每个高频的未登录词都标上候选词性,对于频率低于10的低频未登录词,则采用相似字符串查找的方式找到相似上下文,用于标记词性;最后,在隐马尔科夫标注时,不仅选取一条路径,而是选两条最佳路径,并通过二次选择,得到最后标注结果。实验证明,该方法与传统隐马尔科夫标注方法相比提高了2.6%,汉语词性标注准确率达到了95.65%。(本文来源于《大连理工大学》期刊2015-05-30)

杓顺祥[9](2015)在《英汉语“副词性名词”词类标注实证研究》一文中研究指出词类是语法研究的基础,而英语和汉语等分析语中“副词性名词”的词类地位一直是一个颇具争议的问题。“副词性名词”这一概念起先由Larson于1985年提出,他认为“副词性名词”是英语中特殊的一类名词,这类词可以在无介词或其他类似标识词共现的情况下作副词性修饰语。实质上,所谓的“副词性名词”是转换生成语言学派在英语句法分析中的命名,这类词在大多数权威英语词典中被标注为名词兼副词的词项。然而在汉语句法分析中,这类词的词类地位和范畴归属素来存在争议,在《现代汉语词典》(第6版)中这类词标注为时间词和方位词的做法也值得商榷。本研究从复杂适应系统语言观视角,探讨英汉语中所谓的“副词性名词”词类标注情况。基于国家语委语料库、当代美语语料库以及自建的《现代汉语词典》(第6版)(以下简称《现汉6》)和《牛津高阶英汉双解词典》(第8版)(以下简称《牛津8》)“副词性名词”数据库,在定量研究的基础上,我们利用分析语双层词类范畴化理论和常规与拓展理论来对《现汉6》中184个“副词性名词”和《牛津8》中33“副词性名词”词类标注进行了统计分析,并对部分词的词类标注和用法做了完整的个案研究。研究表明,“副词性名词”在英语词典中的词类标注基本符合这类词在英语语言社团的使用事实,而部分学者命名这类词为“副词性名词”做法欠妥。而汉语词典中“副词性名词”的词类标注和汉语语言社团中这类词的使用事实存在很大差异。根据研究,我们认为汉语中绝大多数“副词性名词”,应该为兼有名词、副词甚至其他词类属性的兼类词。同时基于相关研究,我们将导致汉语词典中这类词词类标注和词语使用差异的原因归结为:1)词类判断中语义标准的误导;2)对词类判断程序和双层词类范畴存在的忽视;3)简略原则的误导;4)语料库使用的不足。本研究不仅有助于深化英汉语词类研究,有助于改善现代汉语词典词类标注工作,对整个分析语词类研究也有启示作用。(本文来源于《四川外国语大学》期刊2015-04-01)

雷莉,鲜丽霞[10](2014)在《《现代汉语词典》与《现代汉语规范词典》词性标注差异研究》一文中研究指出目前汉语辞书词性标注的具体操作中,歧义较大,随意性较强。通过比较国内影响最大的两部词典——《现代汉语词典》与《现代汉语规范词典》的收词数目、词类体系与标注体例,通过逐条对比、计量统计出两部词典共有的词、语条目中词性标注差异的主要类型及其产生的原因,以期对词典编纂及其规范化有所裨益。(本文来源于《电子科技大学学报(社科版)》期刊2014年06期)

汉语词性标注论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对汉语词性标注中词性类别划分较细、类别较多的问题,提出一种利用双层条件随机场进行汉语词性标注的方法,该方法将汉语词性标注分为两个阶段,每个阶段采用一层条件随机场建模实现。第一阶段底层条件随机场根据上下文产生每个词语的词性粗分结果;第二阶段高层条件随机场将词语及其粗分结果作为上下文特征对每个词语的词性进一步细分,产生最终词性标记。利用CRF++0.53工具包,在国际汉语分词评测Bakeoff2007(国际汉语分词评测)的NCC和CTB语料上进行了实验,结果表明该方法可行且可以获得较好的标注结果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

汉语词性标注论文参考文献

[1].苏矗.《现代汉语词典》(第7版)词性标注商榷[J].新乡学院学报.2018

[2].王艺帆,王希杰.基于双层条件随机场的汉语词性标注方法研究[J].安阳师范学院学报.2016

[3].颜湘茹,金仙儿.《中韩词典》词性标注问题探索——与《现代汉语词典》对比[J].海外华文教育.2016

[4].王志琴.李晓琪主编《博雅汉语》的词性标注的针对性研究[D].湖南师范大学.2016

[5].郭利芳.《现代汉语词典》(第6版)词性标注考察分析[D].河南师范大学.2016

[6].韩霞,黄德根.基于半监督隐马尔科夫模型的汉语词性标注研究[J].小型微型计算机系统.2015

[7].胡静书.论《现代汉语词典》(第6版)词性标注与例句不一致问题[J].现代语文(学术综合版).2015

[8].韩霞.基于半监督隐马尔科夫的汉语词性标注研究[D].大连理工大学.2015

[9].杓顺祥.英汉语“副词性名词”词类标注实证研究[D].四川外国语大学.2015

[10].雷莉,鲜丽霞.《现代汉语词典》与《现代汉语规范词典》词性标注差异研究[J].电子科技大学学报(社科版).2014

标签:;  ;  ;  

汉语词性标注论文-苏矗
下载Doc文档

猜你喜欢