导读:本文包含了词语识别论文开题报告文献综述及选题提纲参考文献,主要关键词:词语识别,情感词语,随机游走模型,隐喻动词
词语识别论文文献综述
程琦[1](2019)在《面向散文体裁的情感词语识别方法研究》一文中研究指出阅读理解是自然语言处理领域的一个重要研究方向,现有阅读理解大多是针对语料格式相对简单,问题形式相对固定的任务,但是高考文学类作品阅读理解问题复杂多样,文学作品以中国现代散文为主,作品取材广泛,语言凝练,意境深邃,理解困难。因此,本文面向散文阅读理解任务,针对散文中的情感词语识别开展研究。从粒度最小的词语单位出发,研究情感词语的识别技术,主要研究工作如下:(1)面向散文的情感词典和语料库构建。通过对散文文本独有特点的分析,发现散文情感大多细腻复杂,结合高考散文阅读理解答题的需要,许多问题涉及原文中的情感分析或修辞方法识别,若能构建散文阅读理解的基础资源,可以提升问题的解答效果。本文建立情感词典,并收集80190篇散文,其中标注1140条词语及其情绪标签、2625条动词隐喻句及其情感类别,最后分别对标注数据语料进行分析、总结。(2)面向散文的低频情感词语抽取与情绪标签确定。散文是一种抒发作者真情实感、写作方式灵活的记叙类文学体裁,其表现形式更加多元化,表达方式更加婉转,情感表达更加细腻等。通过词语之间的共现关系确定词语间的相关性,再利用Word2Vec计算词语间的语义相似度。在此基础上,构建随机游走图,利用一般的词典确定种子集词语,再通过种子集的游走过程判别候选词的情绪标签,与其他方法相比较,本文提出的方法有明显的提升,证明了本文方法的有效性。(3)面向散文的隐喻动词识别及情感判别。散文中常见寄情于景的写作方式,即两个概念体之间存在映射关系。本文根据隐喻动词能够表征两个概念体之间的关系,采用了BiLSTM(Bi-directional Long Short-Term Memory)用于记忆动词前后的两个概念体表示,根据隐喻动词常常有字面意思和隐喻意思两种意思,融合了Hownet中的义原知识,使得每个词包含至少一个义原,将义原的内容嵌入BiLSTM输入层的词向量表示层中,能够同时兼顾动词的语义信息和上下文特征。实验结果表示本文的方法对于隐喻动词识别有较好的效果。结合(2)中情感词语抽取方法,本文对隐喻动词的情感进行了识别,并将其应用到高考散文阅读理解原文中的隐喻动词识别和情感类别判断。(本文来源于《山西大学》期刊2019-06-01)
朱婷婷[2](2018)在《基于谓词相容性的双语词语搭配消歧和识别》一文中研究指出词语搭配是词语组合的习惯性出现,具有一定的共现频率、语法结构和语义透明性。词语搭配是人类自然语言知识的重要组成成分,在自然语言处理的各项任务中占有很关键的位置。词语搭配的研究对机器翻译,信息检索,句法分析和词义消歧等工作都有着促进的作用。现有的词语搭配自动抽取和识别方法主要是基于规则、基于统计和机器学习,以及一些综合策略方法。本文提出两个算法,分别是基于谓词搭配频数矩阵的双语词语搭配消歧方法和基于谓词相容性矩阵的双语词语搭配识别方法。按照所含语义信息粒度的粗细,我们将搭配分为叁种,按信息粒度从细到粗分别是谓词搭配、概念搭配和词语搭配。一个词语搭配能够产生一个或多个概念搭配,同样的,一个概念搭配能够产生一个或多个谓词搭配。在实验中,我们利用这叁种搭配的关系,将词语搭配的粗粒度信息迭加到细粒度的谓词搭配上,从而实现词语搭配的消歧和识别。首先,我们从语料库中抽取出有意义的中英词语搭配,接着使用这些词语搭配借助人工知识库HowNet得到概念搭配和谓词搭配,从而构建谓词搭配矩阵,词语搭配的共现频率在谓词搭配频数矩阵中进行迭加,根据谓词搭配矩阵中的信息就可以计算词语搭配的所有概念搭配的对应的分数,分数最高的就是最终消歧结果。双语词语搭配消歧就是在计算概念搭配的分数时同时使用中文和英文的谓词搭配频数矩阵信息,这种方式有效增加了谓词搭配的信息量,弥补了词语搭配语料库较小时,生成的谓词搭配频数矩阵过于稀疏的缺陷,有利于词语搭配消歧准确率的提高。所有的词语搭配都消歧结束后,我们就能得到一个消歧好的词语搭配库,即每个词语搭配都对应一个概念搭配,通过这个词语搭配库,我们可以构建谓词相容性矩阵,利用这个矩阵判断一个词语搭配是正确的或异常的。实验结果表明基于谓词搭配频数矩阵的消歧算法和基于谓词相容性的词语搭配识别算法的结果均达到了我们的预期,证明了该方法的可行性和有效性。(本文来源于《厦门大学》期刊2018-05-01)
胡凡,李维华,伏思达,覃家鸿,李忠憓[3](2018)在《基于STM32F1的孤立词语语音识别》一文中研究指出语音识别作为人工智能下很火爆的一门学科,是当下研究的一个重要领域。大多数的语音识别是基于市面上已有的语音识别模块,成本较高,本系统是孤立词语语音识别,考虑到成本以及可实现性,笔者选择了STM32F1系列MCU的最小系统,通过TFT彩屏实现人机交互,搭建音频采集模块,从而完成语音识别系统的硬件部分。软件设计采用A/D采样、预加重、加窗、端点检测、MFCC 特征提取、特征匹配几个步骤,技术相对成熟,识别率较高。(本文来源于《数字通信世界》期刊2018年03期)
谭咏梅,王敏达,牛少彰[4](2017)在《使用有序词语移动距离特征进行中文文本蕴含识别》一文中研究指出提出了一种基于有序词语移动距离的中文文本蕴含识别方法,该方法基于word2vec词向量计算有序词语移动距离特征,进而利用有序词语移动距离特征和传统语言学特征通过支持向量机生成分类模型,然后使用分类模型进行蕴含识别,最终得到蕴含结果.该方法在RITE-VAL评测任务的CS数据上的Macro F1为0.629,超过RITEVAL的最优评测结果(BUPTTeam,0.615).实验结果表明,该方法可以提升中文文本蕴含识别系统的性能.(本文来源于《北京邮电大学学报》期刊2017年05期)
赵军民,李芳[5](2017)在《基于现代汉语词典的情感词语识别研究》一文中研究指出基于《现代汉语词典》对词语的释义,提出了一种新的情感词语识别方法。该方法结合多特征线性融合和多次循环策略,利用现有的情感词典识别并构建适用于跨领域的通用情感词典。首先基于已有情感词典资源构建候选的通用情感词表,然后使用多特征线性融合的方法计算候选通用情感词表在《现代汉语词典》中的情感倾向性,并利用多次循环的策略获得最终的通用情感词表。实验结果表明,本文提出的情感词语识别方法是有效的,在Precision、Recall及F-measure等方面都取得了较好的效果。(本文来源于《河南城建学院学报》期刊2017年04期)
贾玉祥,昝红英,范明,俞士汶,王治敏[6](2017)在《面向隐喻识别的词语抽象性度量》一文中研究指出隐喻通常借助具体的概念来表达抽象的概念。如果能判断出文本中词语所指的概念是具体还是抽象的,即度量出词语的抽象程度,那么这将为隐喻的机器识别提供重要的依据。该文提出基于跨语言知识迁移的汉语词语抽象性度量方法,把英语中的词语抽象性知识迁移到汉语中来。提出基于词语抽象性知识的隐喻识别方法,并详细分析了词语抽象性与隐喻之间的关系。实验表明,知识迁移是可行的,基于抽象性知识的隐喻识别有较高的准确率,可以有效提高从真实文本中抽取隐喻的效率。(本文来源于《中文信息学报》期刊2017年03期)
刘冰洋,伍大勇,刘欣然,程学旗[7](2017)在《融合全局词语边界特征的中文命名实体识别方法》一文中研究指出目前在中文命名实体识别的任务中经常采用有监督的字序列标注模型。我们在实际应用中发现,基于字序列标注模型的中文命名实体识别模型对于词语边界的识别错误是影响识别效果的主要因素之一,边界错误平均占错误结果中的47.5%。该文通过在平均感知机模型中引入全局的词语边界特征,使得人名、地名、机构名识别的F值平均提升了0.04并降低了边界错误占错误结果的比例。(本文来源于《中文信息学报》期刊2017年02期)
张晨[8](2016)在《基于语义角色和句法标注的新词语语义类识别研究》一文中研究指出对语义的理解能帮助我们更好地理解某个词语、整句话乃至整个篇章或整个对话的含义,而找出语义识别则就是帮助计算机"理解"词语、句子和篇章含义的前提性工作。其中,词语的语义识别是基础。新词语的增长早已是一个不可忽视的趋势,中文信息处理作为应用语言学的一大触手,面对这样的形势当然也要迈出自己的步伐。本文以语料的句法成分和语义角色的标注为基础,研究满足某句法成分和语义角色条件的词语的义类倾向,以期能够将研究成果用于中文信息处理中新词语义类的推测研究,来帮助推进中文信息处理早日实现"智能化"。(本文来源于《安徽文学(下半月)》期刊2016年03期)
陈鑫,王素格,廖健[9](2016)在《基于词语相关度的微博新情感词自动识别》一文中研究指出针对微博中新情感词的识别问题,提出了一种基于词语相关度的微博新情感词自动识别方法。首先,对于分词软件把一个新词错分成几个词的问题,利用组合思想将相邻词进行合并作为新词的候选词;其次,为了充分利用词语上下文的语义信息,采用神经网络训练语料获得候选新词的空间表示向量;最后,利用已有的情感词典作为指导,融合基于词表集合的关联度排序和最大关联度排序算法,在候选词上筛选,获得最终的情感新词。在COAE2014(第六届中文倾向性分析评测)任务3语料上,提出的融合算法与点互信息(PMI)、增强互信息(EMI)、多词表达距离(MED)、新词语概率(NWP)以及基于词向量的新词识别方法相比,准确率至少提高了22%,说明该方法自动识别微博新情感词效果优于其他五种方法。(本文来源于《计算机应用》期刊2016年02期)
闻彬,饶彬,赵君喆,焦翠珍,戴文华[10](2016)在《融合直推式学习和语义理解的词语倾向性识别》一文中研究指出目前词语情感倾向性识别研究主要分为机器学习和语义理解,机器学习不能很好地识别通用领域词语,语义理解又存在准确率和召回率不够高的问题,因此文中提出了一种融合直推式学习和语义理解的词语倾向性识别方法。首先对HowNet知识库体系进行改进,在已有的四种义原的基础上,提出第五义原—情感义原;然后将第五义原手工融入到HowNet知识库中,再在此基础上提出词语情感相似度计算方法计算词语的情感值;最后将该方法融合直推式学习以判定词语情感倾向性。通过实验结果表明,与支持向量机和原语义理解方法相比,该方法在识别情感词上取得了较好的效果。(本文来源于《计算机技术与发展》期刊2016年01期)
词语识别论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
词语搭配是词语组合的习惯性出现,具有一定的共现频率、语法结构和语义透明性。词语搭配是人类自然语言知识的重要组成成分,在自然语言处理的各项任务中占有很关键的位置。词语搭配的研究对机器翻译,信息检索,句法分析和词义消歧等工作都有着促进的作用。现有的词语搭配自动抽取和识别方法主要是基于规则、基于统计和机器学习,以及一些综合策略方法。本文提出两个算法,分别是基于谓词搭配频数矩阵的双语词语搭配消歧方法和基于谓词相容性矩阵的双语词语搭配识别方法。按照所含语义信息粒度的粗细,我们将搭配分为叁种,按信息粒度从细到粗分别是谓词搭配、概念搭配和词语搭配。一个词语搭配能够产生一个或多个概念搭配,同样的,一个概念搭配能够产生一个或多个谓词搭配。在实验中,我们利用这叁种搭配的关系,将词语搭配的粗粒度信息迭加到细粒度的谓词搭配上,从而实现词语搭配的消歧和识别。首先,我们从语料库中抽取出有意义的中英词语搭配,接着使用这些词语搭配借助人工知识库HowNet得到概念搭配和谓词搭配,从而构建谓词搭配矩阵,词语搭配的共现频率在谓词搭配频数矩阵中进行迭加,根据谓词搭配矩阵中的信息就可以计算词语搭配的所有概念搭配的对应的分数,分数最高的就是最终消歧结果。双语词语搭配消歧就是在计算概念搭配的分数时同时使用中文和英文的谓词搭配频数矩阵信息,这种方式有效增加了谓词搭配的信息量,弥补了词语搭配语料库较小时,生成的谓词搭配频数矩阵过于稀疏的缺陷,有利于词语搭配消歧准确率的提高。所有的词语搭配都消歧结束后,我们就能得到一个消歧好的词语搭配库,即每个词语搭配都对应一个概念搭配,通过这个词语搭配库,我们可以构建谓词相容性矩阵,利用这个矩阵判断一个词语搭配是正确的或异常的。实验结果表明基于谓词搭配频数矩阵的消歧算法和基于谓词相容性的词语搭配识别算法的结果均达到了我们的预期,证明了该方法的可行性和有效性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
词语识别论文参考文献
[1].程琦.面向散文体裁的情感词语识别方法研究[D].山西大学.2019
[2].朱婷婷.基于谓词相容性的双语词语搭配消歧和识别[D].厦门大学.2018
[3].胡凡,李维华,伏思达,覃家鸿,李忠憓.基于STM32F1的孤立词语语音识别[J].数字通信世界.2018
[4].谭咏梅,王敏达,牛少彰.使用有序词语移动距离特征进行中文文本蕴含识别[J].北京邮电大学学报.2017
[5].赵军民,李芳.基于现代汉语词典的情感词语识别研究[J].河南城建学院学报.2017
[6].贾玉祥,昝红英,范明,俞士汶,王治敏.面向隐喻识别的词语抽象性度量[J].中文信息学报.2017
[7].刘冰洋,伍大勇,刘欣然,程学旗.融合全局词语边界特征的中文命名实体识别方法[J].中文信息学报.2017
[8].张晨.基于语义角色和句法标注的新词语语义类识别研究[J].安徽文学(下半月).2016
[9].陈鑫,王素格,廖健.基于词语相关度的微博新情感词自动识别[J].计算机应用.2016
[10].闻彬,饶彬,赵君喆,焦翠珍,戴文华.融合直推式学习和语义理解的词语倾向性识别[J].计算机技术与发展.2016