导读:本文包含了句子情感分类论文开题报告文献综述及选题提纲参考文献,主要关键词:深度学习,属性情感分类,注意力,依存树
句子情感分类论文文献综述
苏锦钿,欧阳志凡,余珊珊[1](2019)在《基于依存树及距离注意力的句子属性情感分类》一文中研究指出目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency tree and distance attention, DTDA).首先根据句子的依存树得到包含属性的依存子树,并利用双向GRU学习句子及属性的上下文特征表示;根据句子中单词和属性在依存树中的最短路径确定相应的语法距离及位置权重,同时结合相对距离构造包含语义信息和距离信息的句子特征表示,并进一步利用注意力机制生成属性相关的句子情感特征表示;最后,将句子的上下文信息与属性相关的情感特征表示合并后并通过softmax进行分类输出.实验结果表明:DTDA在国际语义评测SemEval2014的2个基准数据集Laptop和Restaurant上取得与目前最好方法相当的结果.当使用相关领域训练的词向量时,DTDA在Laptop上的精确率为77.01%,在Restaurant上的准确率为81.68%.(本文来源于《计算机研究与发展》期刊2019年08期)
苏锦钿,余珊珊,李鹏飞[2](2019)在《一种结合词性及注意力的句子情感分类方法》一文中研究指出针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工具分别给出句子中词的语义词向量和词性词向量表示,并作为LSTM的输入用于学习词在内容和词性方面的长期依赖关系,有效地弥补了一般LSTM单纯依赖预训练词向量中词的共现信息的不足;接着,利用自注意力机制学习句子中词的位置信息和权重向量,并构造句子的最终语义表示;最后由多层感知器进行分类和输出.实验结果表明,PALSTM在公开语料库Movie Reviews、Internet Movie Database和Stanford Sentiment Treebank二元分类及五元情感上的准确率均比一般的LSTM和注意力LSTM模型有一定的提升.(本文来源于《华南理工大学学报(自然科学版)》期刊2019年06期)
张林[3](2019)在《基于短文本(句子级)的情感分类研究》一文中研究指出文本情感分类,也称为意见挖掘或情感定向分析。自21世纪初以来,情感分类已发展为自然语言处理领域的研究热点。在该领域,根据处理文本的不同粒度,大致分为叁个级别:篇章级,句子级,方面级。本文着重研究短文本,即句子层面的情感分类研究与分析。当今社会,随着互联网技术的不断发展,各电商平台和社交网络也得到了飞速发展,人们越来越多的喜欢在互联网上发表自己的观点,或针对某一社会热点,或针对网购产品的使用体验等。其中,微博便以其简单,便捷,信息分享的高实时性等特点,迅速成为了国内网络舆情的发源地和集中地。网络舆情与公众的生活息息相关,同时也关系着社会的稳定与发展。通过对网络舆情进行分析和研究,可以防范重大事件的发生,帮助政府准确快速地做出决策。因此,本文对微博进行情感倾向性分析,以便更好地监控网络舆情,为政府决策提供支持。本文选取了长度不超过140个字节的微博数据集,对传统的小批量梯度下降算法进行改进,提出了一种基于热重启与余弦退火的训练批量周期变化策略SGDR,该方法不是单调的或者随机的改变batch_size,而是使batch_size在合理的边界值之间循环变化。使用循环batch_size而不是固定值进行训练,可以用于加速模型收敛,提高模型精度。然后基于已有的激活函数,提出了一种新的激活函数——SReLU函数,缓解梯度弥散,解决输出偏移问题。最后基于TextCNN,采用SGDR算法以及SReLU函数对微博短文本进行了研究,并对比多种神经网络模型和激活函数进行实验验证,得到了最终的实验结果。首先,本文使用Google提供的word2vec来构建和提取本文中使用的词向量模型。首先,本文采用基本神经网络模型,设置卷积核心信道数,卷积核宽度,学习速率等文本卷积神经网络参数。得到关于本数据集的最佳模型,在此模型的基础上验证本文提出的基于热重启与余弦退火的训练批量周期变化策略SGDR进行验证,然后对比其他激活函数验证本文提出的激活函数的有效性,最后结合本文所提出的方法和激活函数进行综合实验,并与其他神经网络模型进行对比实验,得到了宏查准率91.66%、宏查全率96.24%、准确率97.41%以及宏F1值93.21%的实验结果。(本文来源于《吉林大学》期刊2019-05-01)
汪冉[4](2018)在《基于深度学习的句子情感分类》一文中研究指出随着现代化网络的普及,个人对产品、服务或事件生成的评论可以使组织和企业改善市场营销、沟通、生产和采购。基于此,对句子情感分类便于从用户生成的评论或叙述中提取主观信息,一般是判断句子情感极性。传统情感分析方法仅统计单词或短语的频数获得句子表示,基于深度学习的序列模型虽被广泛应用到句子情感分类中,但其也不能体现句子语法和句法结构,直接影响后续句子情感分类性能。本文对循环神经网络和树结构网络进行改善以得到更好展现句子语义特征的句子表示,以网络用户评论数据为对象进行情感分类,主要工作如下:(1)提出融合极性转移和长短期记忆网络(Long Short Term Memory,LSTM)的树结构网络模型。基于树结构的LSTM网络可以获取句子的语法结构特征信息,但是忽略了单词的情感极性转移信息。针对这个问题,本文提出了融合极性转移和LSTM网络的树结构网络模型,首先构建依存句法结构树和短语结构树网络,在网络节点中添加LSTM的记忆模块来长期保存节点的语义信息,然后本文在LSTM的记忆模块中添加了情感极性转移向量以获取节点的极性转移信息。与已有的深度学习模型相比,本文模型在SST数据集上句子情感分类效果的准确率有所提高。(2)提出基于修辞结构理论、门控循环单元(Gated recurrent units,GRU)和注意机制的树结构网络模型。利用短语结构树和依存句法结构树能够获取语法结构信息,很好地丰富句子的语义表达,但是不能着重处理句子重要片段;而且GRU网络记忆模块相比LSTM更加简单有效。针对这些问题,本文提出了基于修辞理论结构解析树的GRU网络模型,利用修辞理论解析树区别子树重要性,并使用GRU记忆模块保存此信息,使句子表示更加准确;在树结构网络中句子表示依赖于根节点的固定维度向量,为了不局限于此,本文在模型中添加注意机制,该模型综合树结构中所有节点表示获取句子表示,增强了模型的核心信息和句子特征表达,在句子情感分类的实验中表现突出。(本文来源于《南京理工大学》期刊2018-03-01)
闫晓东,黄涛[5](2018)在《基于情感词典的藏语文本句子情感分类》一文中研究指出该文通过借鉴中文及英文情感分析中基于极性词典的方法来对藏文句子文本进行情感分析。首先我们通过人工的方法构建了一个全面、高效的极性词典,包括基础词词典、否定词词典、双重否定词词典、程度副词词典以及转折词词典,将极性词与修饰词组合成极性短语作为极性计算的基本单元,并研究了转折词对句子情感极性的影响,提出了一种基于极性词典的藏语文本句子情感分析方法。实验结果表明,利用该文构建的词典进行的倾向性分析效果良好。(本文来源于《中文信息学报》期刊2018年02期)
徐莹莹[6](2016)在《基于深度神经网络模型的句子级文本情感分类研究》一文中研究指出随着Web2.0应用的普及,用户从以前单纯的“读”网页转变为更多的参与“撰写”网页。用户通过在网络上分享、评论产生海量非结构化的数据,充分挖掘这些数据继而可以产生非常有价值的信息。传统的机器学习方法主要基于词袋向量,不能表达复杂的语言关系。近期,词嵌入表示由于连续、稠密、能表示“距离”概念并能捕获词语的语义和语法信息,而被广泛关注并用于自然语言处理任务中。但是,由于词嵌入仅能表示单独的词,所以在进行短语和句子的特征表达时,需要考虑语义组合问题,句子级在线用户评论的情感分析仍然面临着挑战。近年来,递归自动编码(Recursive Autoencoder)和循环神经网络(Recurrent Neural Network)两类深度学习模型被提出,进行语义组合,用于句子级情感分类任务中并取得了很好的效果,但都存在一定的缺陷,针对这些问题,本文以网络用户主观评论文本数据为研究对象,主要工作包括以下两个部分:(1)提出结合HowNet词典的双向短语递归自动编码模型(简称为CHL-Bi-PRAE)。先前的方法往往会产生比较深的解析树,训练复杂度较高;并且在训练过程中每个结点都需要标签;此外,采用贪婪策略的自动编码主要组合相邻的词或短语,导致不能捕获长距离的语义关系。针对这些问题,本文提出首先构建短语递归自动编码(PRAE),然后结合HowNet词典得到树中结点的情感值代替手工标注作为标签对softmax分类器进行训练。并且我们的模型采用双向传播,捕获整个句子的信息,使学习到的特征更充分。与先前的递归自动编码和一些监督学习的方法(如支持向量机SVM、贝叶斯)在中英文数据集上的分类效果相比,本文提出的方法获得了更高的句子级情感分类准确率。(2)提出基于修辞结构理论的长短记忆网络(简称为RST-LSTM)。先前的LSTM网络虽然解决了RNN中存在的梯度消失问题,但都是线性链式结构,而后来提出的Tree-LSTM利用LSTM的忘记门机制,可以跳过对结果影响不大的子树,取得较好的结果,说明了基于序列的LSTM对文本结构依赖更强,但是,先前的树结构并不能清晰的指出哪颗子树重要,哪颗子树影响不大,所以并不能充分发挥LSTM的特点。基于此,本文提出引入修辞结构理论(RST)对文本进行解析,在RST解析结构上构建长短记忆网络,充分利用LSTM结构特点,使模型能够自动增强文本核心信息,过滤外围信息,并进一步添加关系特征,使特征表达更充分。(本文来源于《深圳大学》期刊2016-06-30)
王伟,韩立新,夏建华[7](2016)在《基于上下文语义的句子情感分类》一文中研究指出针对现有机器学习方法在情感分析时,需要大量的训练数据和复杂的语言模型结构,但难以获取全文的情感问题,文中提出了一种在有限数据集的情况下,兼顾局部和全局的上下文信息情感模型结构。首先把词汇和语篇知识进行整合约束,然后通过后验正则化应用在条件随机场模型,最后得到句子的情感倾向。通过多组实验分析,本文使用的方法与CRF模型对情感句分类相比有明显的提升。(本文来源于《信息技术》期刊2016年04期)
王波,刘玉娇[8](2016)在《基于深度特征的句子级文本情感分类》一文中研究指出研究词深度特征池化法的句子级情感分类特征表示,在进行词向量学习时,首先利用中科院分词器对语料进行分词,通过word2vec中的CBOW模型计算语料中词的深度特征词向量;在情感分类过程中,首先对词深度特征采用均值、最值等池化方法获得整句话的特征,并以此作为神经网络模型的输入,通过一个线性层、Sigmoid激活层以及线性分类标注层,来判决得到该句的情感倾向。通过在当当书评语料上进行实验,结果表明均值与最值池化拼接的特征方法取得较好的分类效果,能够更好地表征句子级情感特征。(本文来源于《现代计算机(专业版)》期刊2016年09期)
于斯音·于苏普,艾斯卡尔·艾木都拉[9](2014)在《基于情感词典的维吾尔语文本句子情感分类》一文中研究指出该文主要是针对维吾尔语中生气,高兴,难过及惊讶等四大类情感分别进行基于情感词词典的句子情感分类。首先,结合维吾尔句子中的情感特点,通过人工抽取的方法收集了维吾尔句子中能表达情感的关键词和情感短语,并建立了包含情感关键词和情感短语的情感词词典。然后,利用关键词匹配算法实现了具有分类速度快、分类正确率较高的维吾尔语句子情感分类应用系统。最后,给出了实验结果,并且分析了所存在的问题及提出了相应的解决策略。(本文来源于《电脑知识与技术》期刊2014年10期)
王洪伟,郑丽娟,尹裴,何绍义[10](2013)在《基于句子级情感的中文网络评论的情感极性分类》一文中研究指出为提高网络评论段落的情感极性分类准确率,在考虑人们表达习惯和语料粒度的基础上,提出一种基于句子情感的段落情感极性分类方法.该方法通过句子的情感极性和句子的情感极性贡献度来对段落进行情感分类,采用传统分类方法预测句子的情感极性,提出等权重、相关度、情感条件假设3种方法,能够根据训练语料的统计数据动态地确定段落中不同位置句子的情感极性贡献度.最后,以超过2个句子的手机和酒店网络评论为对象进行实验分析,实验结果显示,与传统方法相比,考虑了人们表达习惯的相关度和情感条件假设方法显着提高了段落分类的准确率,且具有一定的自适应性.(本文来源于《管理科学学报》期刊2013年09期)
句子情感分类论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工具分别给出句子中词的语义词向量和词性词向量表示,并作为LSTM的输入用于学习词在内容和词性方面的长期依赖关系,有效地弥补了一般LSTM单纯依赖预训练词向量中词的共现信息的不足;接着,利用自注意力机制学习句子中词的位置信息和权重向量,并构造句子的最终语义表示;最后由多层感知器进行分类和输出.实验结果表明,PALSTM在公开语料库Movie Reviews、Internet Movie Database和Stanford Sentiment Treebank二元分类及五元情感上的准确率均比一般的LSTM和注意力LSTM模型有一定的提升.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
句子情感分类论文参考文献
[1].苏锦钿,欧阳志凡,余珊珊.基于依存树及距离注意力的句子属性情感分类[J].计算机研究与发展.2019
[2].苏锦钿,余珊珊,李鹏飞.一种结合词性及注意力的句子情感分类方法[J].华南理工大学学报(自然科学版).2019
[3].张林.基于短文本(句子级)的情感分类研究[D].吉林大学.2019
[4].汪冉.基于深度学习的句子情感分类[D].南京理工大学.2018
[5].闫晓东,黄涛.基于情感词典的藏语文本句子情感分类[J].中文信息学报.2018
[6].徐莹莹.基于深度神经网络模型的句子级文本情感分类研究[D].深圳大学.2016
[7].王伟,韩立新,夏建华.基于上下文语义的句子情感分类[J].信息技术.2016
[8].王波,刘玉娇.基于深度特征的句子级文本情感分类[J].现代计算机(专业版).2016
[9].于斯音·于苏普,艾斯卡尔·艾木都拉.基于情感词典的维吾尔语文本句子情感分类[J].电脑知识与技术.2014
[10].王洪伟,郑丽娟,尹裴,何绍义.基于句子级情感的中文网络评论的情感极性分类[J].管理科学学报.2013