句法树论文-王彬菁

句法树论文-王彬菁

导读:本文包含了句法树论文开题报告文献综述及选题提纲参考文献,主要关键词:微博文本,依存句法树方法,情感分析,LTP-Cloud(语言技术平台云)

句法树论文文献综述

王彬菁[1](2019)在《基于依存句法树方法的微博文本的情感分析研究》一文中研究指出随着移动互联技术的发展,微博作为一种新媒体形式日益成为国内主流的移动社交媒体平台。微博包含海量的信息数据且数据种类多样,即有文档文本数据,也有图片、表情符号、视频动画等非结构化的数据。因此,对各政府部门和企业单位的网络舆情监管提出了艰巨的挑战,有关中文微博文本的情感分析的研究也成为近几年数据挖掘领域的关注方向之一,情感分析研究主要围绕着信息的抽取和情感倾向的判定,均离不开对微博文本的分词工作。本文提出了一种基于依存句法树的情感分析方法。根据不同的词汇间的依存关系,制定了相应的情感短语削减规则。通过分析不同程度词和否定词对情感词的修饰和组合关系,制定了不同的汇聚规则。使用LTP-Cloud(语言技术平台云)进行句法分析,构建依存句法树,通过对句法树的后序遍历逐步汇聚情感向量。使用了为情感值取绝对值的情感判别方法,得到最终的情感类别。(本文来源于《电脑知识与技术》期刊2019年24期)

杨润琦[2](2019)在《用于语义相似度评估的基于句法树的神经网络研究》一文中研究指出基于深度神经网络的模型在语义相似度评估的任务上取得了优异的效果。深度神经网络中的基于句法树的神经网络通过语言内在的句法树树形结构对语言进行建模,建模得到的句子向量表示进一步运用在语义相似度评估网络中进行语义相似度的预测。基于句法树的神经网络相比其他用于建模句子级别的表示的神经网络而言,在建模长距离依赖上更具优势,并且可以利用外部树形结构的标记增强模型的性能,拥有良好的应用前景。然而,已有的用于建模句法树树形结构的神经网络中也存在着一些问题,比如递归神经网络难以建模跨越多层的依赖关系,循环递归网络建模句子整体表示的能力较弱,使用有序元方法建模树形结构时对于外部的树形结构标记无法直接利用等等,这些存在的问题限制了基于句法树的神经网络在语义相似度评估任务中的应用。本文从用于语义相似度评估任务的基于句法树的神经网络中存在的问题入手,对已有的基于句法树的神经网络进行了若干改进,并通过实验验证并分析了本文提出的改进的效果。针对使用递归神经网络建模树形结构的过程中存在的难以建模跨越多层的依赖的问题,本文借鉴了在循环神经网络中用于增强对长距离依赖的建模的门限结构设计,对门限循环网络的结构进行了改造并将其引入递归神经网络中,给出了针对依存关系句法树和成分分析句法树的两种版本的实现:总和门限递归结构和密连接门限递归结构,实验分析表明该方法在语义相似度评估的任务上在拥有良好的预测性能的同时,对比其他基于门限结构来优化跨越多层的依赖建模的模型而言,拥有更高计算效率。针对使用循环递归网络在建模句法树树形结构并用于语义相似度评估的任务的过程中,存在的对句子整体表示建模能力不足的问题,本文借鉴了递归神经网络中对整体表示建模的设计,将递归单元引入循环递归网络中作为其合并单元的实现,并给出了从两个方向对文本进行建模的扩展版本,实验分析表明该方法在语义相似度评估的任务上对于句法树的树形结构拥有出色的建模能力和预测性能。针对使用有序元方法建模树形结构的过程中存在的无法直接利用外部树形结构资源的问题,本文基于门限循环网络对有序元方法进行了更高效的重新设计,并在这个更高效的模型的基础上探索了对海量无标记数据的利用,利用语言模型的无监督预训练增强模型的性能,弥补了有序元方法无法直接利用外部树形结构资源的不足,实验表明该方法在语义相似度评估的任务上可以利用无标记数据上的无监督预训练显着增强模型的性能,分析表明经过预训练的有序元方法可以通过有序元的异步更新进行树形结构的迁移,该方法拥有良好的应用前景。(本文来源于《南京大学》期刊2019-05-24)

龙从军,刘汇丹,周毛克[3](2019)在《基于句法树的藏语最长名词短语识别》一文中研究指出最长名词短语携带着丰富的句法和语义信息,经常与句法成分对应,在句子中充当一定的语义角色。最长名词短语识别在自然语言处理中占重要地位,是分析和理解句子结构、意义的基础。该文通过梳理不同概念的最长名词短语的含义,从句法树角度界定了藏语最长名词短语的基本概念;从句法树库中抽取6 038个句子,分析了最长名词短语的结构类型、边界特征和出现频次,最后采用序列标注模型和句法分析模型对最长名词短语进行识别。序列标注模型识别结果的正确率、召回率和F1值分别为87.14%、84.72%、85.92%。句法分析模型识别结果的正确率、召回率、F1值分别为85.02%、84.51%、84.76%。(本文来源于《中文信息学报》期刊2019年02期)

郭丽娟,彭雪,李正华,张民[4](2019)在《面向多领域多来源文本的汉语依存句法树库构建》一文中研究指出为了支持汉语句法分析研究,目前句法分析领域已经标注了多个汉语依存句法树库。然而,已有树库主要针对较规范文本,而对各种网络文本如博客、微博、微信等考虑较少。为此,该文基于近期研制的标注规范及可视化在线标注系统,开展了大规模数据标注。聘请了15名兼职标注者,并采用严格的标注流程保证标注质量,目前,已经标注了约3万句的汉语依存句法树库,其中包含约1万句淘宝头条文本。该文重点介绍了数据选取、标注流程等问题,并详细分析了标注准确率、一致性和标注数据的分布情况。未来将继续对多领域多来源文本进行标注,扩大树库规模,并以合适的方式公开相应的标注数据。(本文来源于《中文信息学报》期刊2019年02期)

霍欢,张薇,刘亮,李洋[5](2017)在《一种针对句法树的混合神经网络模型》一文中研究指出在多数神经网络模型仍然将目光放在顺序结构上时,近期出现的两种基于句法树的模型TreeLSTMs和TBCNNs由于加入了结构信息而在多个自然语言处理任务上表现出色。考虑到TreeLSTMs因计算空间关联性使其训练效率不高,该文提出一种针对句法树的混合神经网络模型,借助TBCNNs的树卷积和池化方法实现了类似TreeLSTMs的计算,故将此模型命名为Quasi-TreeLSTMs。该文在依存树和支持树上分别构建了模型的两种版本Dependency Quasi-TreeLSTMs和Constituency Quasi-TreeLSTMs,实验结果表明,在情感分类和语义相似性两类任务上Quasi-TreeLSTMs表现优异。(本文来源于《中文信息学报》期刊2017年06期)

刘金路[6](2017)在《基于句法树库的英语从句句法复杂性研究》一文中研究指出英语从句具有句法复杂性,这种复杂性可以通过平均依存距离体现出来。当前,除关系从句外,学界对名词性从句及状语从句句法复杂性的研究尚未涉及,这使得对英语从句句法复杂性的研究缺乏系统性及整体性。本研究以依存语法为理论依据,以英语从句为研究对象,以平均依存距离的测量为研究手段,以2016年1月至4月间的《纽约时报》中所选取的300句英语复合句以及其中所包含的关系从句、名词性从句及状语从句各100句为研究语料,运用Excel 2013对其进行了句法标注并构建树库,对树库中英语从句的平均依存距离进行了定量计算,利用SPSS16.0对所得数据进行了差异显着性检验,并结合英语从句已有的研究成果对句法复杂性进行了定性分析。最后,依据平均依存距离,对其句法复杂度分别进行了比较,绘出了英语从句句法复杂性的连续统图表。研究发现,(1)状语从句的句法复杂性显着高于名词性从句与关系从句,名词性从句与关系从句无显着性差异,叁者句法复杂性层级关系为:AC>NC=RC;(2)关系从句子类的句法复杂性层级关系为:SO=OO>SS;OO>OS;SO=OS;名词性从句子类的句法复杂性层级关系为:SC>OC=CA;SC=PC;PC=OC=CA;ESC=PC=OC=CA;OSC>ESC;状语从句子类的句法复杂性层级关系为:FAC>BAC;(3)纵观英语从句句法复杂性的连续统图表,SS的句法复杂性最低,而FAC则属最高。(本文来源于《浙江工商大学》期刊2017-01-01)

张红斌,姬东鸿,尹兰,任亚峰,牛正雨[7](2016)在《基于关键词精化和句法树的商品图像句子标注》一文中研究指出商品图像句子标注是图像标注中一项既有趣又富有挑战的研究任务.噪声单词干扰和句法结构错误是该项研究的制约因素,针对噪声单词干扰,提出关键词精化思想:用绝对排序特征强化关键词权重,完成第1次关键词精化;计算单词的语义相关度评分,进一步优选能准确刻画图像内容的单词,完成第2次关键词精化.设计词序列"拼积木"算法,把关键词拼装成N元词序列.针对句法结构错误,提出句法树思想:基于N元词序列和句法子树递归地构建一棵完整的句法树,遍历该树叶子结点输出句子,标注商品图像.实验结果表明:关键词精化和句法树均有助于改善标注性能,句中的语义信息兼容性和句法模式兼容性得以保持,句子内容更连贯、流畅.(本文来源于《计算机研究与发展》期刊2016年11期)

相若晨,孙美凤[8](2016)在《基于词向量与句法树的中文句子情感分析》一文中研究指出随着互联网的快速发展,网络中充斥着海量主观性文本,如何对这些主观性语句进行情感倾向性判断是文本情感分析的关键。本文提出一种基于词向量和句法树的中文句子情感分析方法。针对目前大量网络新词的使用所带来的问题,以已有标注的情感词典为基础,采用词向量的方法判断词语之间的语义相似度,从而得到未知词语的情感极性。针对情感极性转移现象,定义相应的情感判断规则。在此基础上,利用句子的句法树结构,对句子进行情感倾向性分析。实验证明,该方法在一定程度上解决了网络新词的问题,有效提高了句子情感分析的准确率和召回率,且具有领域适用性。(本文来源于《计算机与现代化》期刊2016年08期)

刘金路,柴改英[9](2016)在《基于句法树库的英语时态加工难度对比研究》一文中研究指出在依存语法的理论框架下,利用计量方法,运用句法标注建立的树库对英语时态及其对应的被动语态的平均依存距离进行了测量分析并对它们的加工难度进行了排序。研究发现:(1)英语时态及其被动语态存在加工难度差异;(2)常用的十类英语时态比剩余六类时态加工难度小;(3)常用的六类英语时态的主动语态比对应的被动语态加工难度小。(本文来源于《广西科技师范学院学报》期刊2016年03期)

谢聪娇[10](2016)在《基于汉蒙依存句法树转换的蒙古文依存句法分析》一文中研究指出句法分析是自然语言处理的关键技术之一,其主要任务是消除句子中由词法和词组结构引入的歧义问题。句法分析对自然语言处理起着至关重要的作用。一方面,句法分析能够有效地验证树库构建体系的正确性和完备性;另一方面,句法分析能够直接服务于某种上层的应用,比如关键词的识别和搜索引擎用户日志分析等。近年来,依存结构句法分析凭借其结构简单、易于标注、便于应用等特点逐渐成为自然语言处理领域的研究热点。然而,针对蒙古文的依存句法分析的研究却相对较少。本文在结合了短语结构句法树优点和依存结构句法树优点的基础上,提出一种基于汉蒙依存句法树转换的蒙古文依存句法分析方法。首先,使用基于词汇化概率的上下文无关文法的斯坦福句法分析器对输入的汉文句子进行基于短语结构的句法分析,生成汉文短语结构树,并结合蒙古文语序和汉文语序的特点构建蒙古文调序模型,依据调序规则重新调整汉文语序,使得汉文语序与蒙古文语序保持一致;接着,制定短语结构树向依存结构树转换的转换规则,利用中心节点转换法实现短语结构树向依存结构树的转换,并对其进行剪枝后处理,从而生成汉文依存结构树;最后,利用联合概率模型实现汉蒙双语的词对齐,并对蒙古文中一些特殊的语法现象进行后处理,最终得到蒙古文依存句法树。实验结果表明,结合短语结构树和依存结构树的特点进行蒙古文依存句法分析能够有效地利用短语结构内部特征和短语外部关系进行蒙古文依存句法分析。该方法得到的蒙古文依存句法分析的准确率可达77.31%。(本文来源于《内蒙古大学》期刊2016-04-26)

句法树论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基于深度神经网络的模型在语义相似度评估的任务上取得了优异的效果。深度神经网络中的基于句法树的神经网络通过语言内在的句法树树形结构对语言进行建模,建模得到的句子向量表示进一步运用在语义相似度评估网络中进行语义相似度的预测。基于句法树的神经网络相比其他用于建模句子级别的表示的神经网络而言,在建模长距离依赖上更具优势,并且可以利用外部树形结构的标记增强模型的性能,拥有良好的应用前景。然而,已有的用于建模句法树树形结构的神经网络中也存在着一些问题,比如递归神经网络难以建模跨越多层的依赖关系,循环递归网络建模句子整体表示的能力较弱,使用有序元方法建模树形结构时对于外部的树形结构标记无法直接利用等等,这些存在的问题限制了基于句法树的神经网络在语义相似度评估任务中的应用。本文从用于语义相似度评估任务的基于句法树的神经网络中存在的问题入手,对已有的基于句法树的神经网络进行了若干改进,并通过实验验证并分析了本文提出的改进的效果。针对使用递归神经网络建模树形结构的过程中存在的难以建模跨越多层的依赖的问题,本文借鉴了在循环神经网络中用于增强对长距离依赖的建模的门限结构设计,对门限循环网络的结构进行了改造并将其引入递归神经网络中,给出了针对依存关系句法树和成分分析句法树的两种版本的实现:总和门限递归结构和密连接门限递归结构,实验分析表明该方法在语义相似度评估的任务上在拥有良好的预测性能的同时,对比其他基于门限结构来优化跨越多层的依赖建模的模型而言,拥有更高计算效率。针对使用循环递归网络在建模句法树树形结构并用于语义相似度评估的任务的过程中,存在的对句子整体表示建模能力不足的问题,本文借鉴了递归神经网络中对整体表示建模的设计,将递归单元引入循环递归网络中作为其合并单元的实现,并给出了从两个方向对文本进行建模的扩展版本,实验分析表明该方法在语义相似度评估的任务上对于句法树的树形结构拥有出色的建模能力和预测性能。针对使用有序元方法建模树形结构的过程中存在的无法直接利用外部树形结构资源的问题,本文基于门限循环网络对有序元方法进行了更高效的重新设计,并在这个更高效的模型的基础上探索了对海量无标记数据的利用,利用语言模型的无监督预训练增强模型的性能,弥补了有序元方法无法直接利用外部树形结构资源的不足,实验表明该方法在语义相似度评估的任务上可以利用无标记数据上的无监督预训练显着增强模型的性能,分析表明经过预训练的有序元方法可以通过有序元的异步更新进行树形结构的迁移,该方法拥有良好的应用前景。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

句法树论文参考文献

[1].王彬菁.基于依存句法树方法的微博文本的情感分析研究[J].电脑知识与技术.2019

[2].杨润琦.用于语义相似度评估的基于句法树的神经网络研究[D].南京大学.2019

[3].龙从军,刘汇丹,周毛克.基于句法树的藏语最长名词短语识别[J].中文信息学报.2019

[4].郭丽娟,彭雪,李正华,张民.面向多领域多来源文本的汉语依存句法树库构建[J].中文信息学报.2019

[5].霍欢,张薇,刘亮,李洋.一种针对句法树的混合神经网络模型[J].中文信息学报.2017

[6].刘金路.基于句法树库的英语从句句法复杂性研究[D].浙江工商大学.2017

[7].张红斌,姬东鸿,尹兰,任亚峰,牛正雨.基于关键词精化和句法树的商品图像句子标注[J].计算机研究与发展.2016

[8].相若晨,孙美凤.基于词向量与句法树的中文句子情感分析[J].计算机与现代化.2016

[9].刘金路,柴改英.基于句法树库的英语时态加工难度对比研究[J].广西科技师范学院学报.2016

[10].谢聪娇.基于汉蒙依存句法树转换的蒙古文依存句法分析[D].内蒙古大学.2016

标签:;  ;  ;  ;  

句法树论文-王彬菁
下载Doc文档

猜你喜欢