情感极性分类论文-杜梦豪,黄文明,孙晓洁,邓珍荣

情感极性分类论文-杜梦豪,黄文明,孙晓洁,邓珍荣

导读:本文包含了情感极性分类论文开题报告文献综述及选题提纲参考文献,主要关键词:句法向量,情感向量,动态池化,注意力模型

情感极性分类论文文献综述

杜梦豪,黄文明,孙晓洁,邓珍荣[1](2019)在《基于动态池化和注意力的文本情感极性分类》一文中研究指出为提取到评论文本的深层次特征和关联特征,设计一种基于动态池化和注意力机制的情感极性分类方法。学习评论文本的两种表示向量,即情感向量和句法向量;将基于滑动窗口的注意力机制和卷积层相结合,采用该模型获取到包含文本上下文的关联特征向量,实现向量之间的信息融合,解决向量特征表示无关的问题;基于动态池化层和注意力机制对特征重新加权,提取文本更高层次的抽象特征,其中,多次的动态池化操作学习到文本的深层次特征;采用softmax分类方法进行情感极性分类。实验结果表明,根据准确率、召回率和F值等衡量指标,基于动态池化和注意力机制的特征提取模型性能比普通的卷积神经网络和基于单注意力机制的卷积神经网络有明显的提高。(本文来源于《计算机工程与设计》期刊2019年04期)

朱军,刘嘉勇,张腾飞,邱利茂[2](2018)在《基于情感词典和集成学习的情感极性分类方法》一文中研究指出当前情感极性分析时使用机器学习方法进行褒贬分析需要完备的语料库,但对特定领域的语料库构建困难,而只使用情感词典的分类方法准确率低。针对以上缺点提出了一种改进的机器学习方法和情感词典结合的集成学习情感极性分类方法。首先,使用Word2Vec特征提取方法将每条评论表示成固定维度向量,使用常见的机器学习分类方法进行分类,找出效果最好的分类方法;然后使用基于情感词典的朴素贝叶斯分类方法进行情感极性分类。最后将基于情感词典和集成学习的方法相结合,使用谭松波公开的数据集酒店评论数据进行实验。理论分析和实验表明,使用Word2Vec作为特征提取方法的支持向量机(SVM)分类方法结合基于情感词典的朴素贝叶斯分类方法的集成学习方法可以将积极类的准确率和宏平均分别提高6. 9个百分点和3个百分点,将消极类的召回率和宏平均分别提高8. 8个百分点和5. 1个百分点,有效提升了情感极性分类效果。(本文来源于《计算机应用》期刊2018年S1期)

田竹[3](2017)在《基于深度特征提取的文本情感极性分类研究》一文中研究指出随着微博、论坛、知乎、豆瓣等社交媒体的发展,人们在网络上行为往往已经不再局限于信息的浏览,越来越多的人开始在社交网络上表达自己的观点、分享知识、创作内容,这也成为了互联网资源的一部分。网友发布的海量内容中既包括很多对热点事件的评论,也包括对特定商品的评价,它们中的大部分文字都带有明显情感倾向的信息。如何从这些海量的、非结构化的数据中挖掘出有效的、易于分析的结构性信息,就是情感分析的主要任务。情感分析在业界广泛被应用于产品分析、商品推荐等方面,甚至可以应用股票价格趋势的预测,具有很大的商业价值。而对于政府部门来说,情感分析更是舆情监测、民意调研、危机管理的重要基础技术。传统的文本情感分析方法依靠复杂的特征工程,需要耗费大量的人力进行特征构建和筛选,应用领域或者随着时间的推移,如果语言习惯发生变化,则又需要重新选择特征,不具有普适性。近年来,深度学习在自然语言处理的各种应用中得到了广泛的关注,本文在总结传统基于情感词典的情感分析方法和目前已有的可用于情感分析的深度学习方法的基础上,针对存在的问题,建立了两种深度学习模型:一是结合了空间递归网络(RecursiveNeuralNetworks,RSNN)和具有记忆能力的GRU单元(Gated Recurrent Units)的RSGRU网络,模型不仅能够表示文本的上下文信息,也能利用语法结构信息。将RSGRU 网络模型应用在语句级情感分析任务上,相较于目前应用比较多的长短时记忆神经网络模型(Long-ShortTermMemory,LSTM)和卷积神经网络等模型,在文本情感极性分类任务上有了一定的性能的提升。二是结合了卷积神经网络和双向GRU网络的CNN-BGRU模型,并将该模型应用于篇章级的文本情感分析中。卷积神经网络在局部特征提取方面表现更好、更适合于对句子进行建模,而双向GRU更实用于表达序列信息进行,本文将这两种模型结合,在情感极性分类问题上相对于普通的卷积神经网络等其他模型取得了较好的效果,且与传统方法相比不需人工进行特征提取,在实际应用中可以节约大量人力,且更加容易维护。(本文来源于《山东大学》期刊2017-05-14)

牟兴[4](2017)在《基于中文微博的电影评论情感极性分类及舆论演化分析》一文中研究指出随着Web2.0时代的到来,互联网技术得到了飞速的发展,在这过程中出现了许多网络社交平台,例如国内外的新浪微博、腾讯微博、Twitter、FaceBook等,然而正是由于这些社交网络的出现,不仅丰富了人们的生活并且也改变了人们的生活方式。微博由于其强大的影响力和渗透力,越来越多的人喜欢在微博上发表电影评论。微博中的电影评论是用户对电影好坏的一种实时的表达方式,以此来展示自己对于该电影的整体感受,对这些评论信息进行情感极性分类和整体评价的舆论演化分析,不仅有助于人们对于电影的整体把握,以此来选择自己喜欢的符合自己口味的电影,同时也有利于制片商及时获取大众关于电影的整体舆论倾向,从而去调整相应的营销策略以此引导电影舆论的走向,建立好的口碑,以此能提高电影的票房成绩。并且微博中的电影评论每天更新量大,及时性强,对于电影营销来说,具有重要的价值。微博中的电影评论与传统的电影评论有很大的不同,微博中的电影评论主题比较多,字数少,数据稀疏,而且语言比较随意,情感表达也多样化,与传统的电影评论有很大的不同。因此,本文根据微博电影评论的这些特点,对其情感极性分类以及评价主题进行了相关研究,研究内容如下:(1)本文提出了一种改进的PMI-IR模型来对中文微博的电影评论进行情感极性分类,这种改进的模型本文称为PMI-IR-II。本文主要从以下叁个方面进行了改进:首先,在对短语模式的提取上,本文提出了一种新模式的短语提取,来更加适应微博文本的特点。然后,在对参考词的选取上,本文人工选择了6个在电影评论领域出现频率较高且具有明显的情感倾向的词作为情感参考词,选多个参考词是为了消除单一参考词可能带来的误差。最后,本文考虑到微博的特点以及中文语言的特点,探索了在程度副词、否定句、转折连词、比较句、疑问句等中文语言环境下,对短语的情感值进行了修正,最后利用计算评论文本的修正后的平均情感值来判断电影评论的情感极性。(2)微博电影评论的舆论演化分析,本章节主要是从全局分析微博电影评论的情感极性及主题,针对的是一部电影的不同时间段的评论。文章首先提出了一种改进的情感主题模型,本文称为BJST(Biterm joint sentiment/topic),该模型是对情感主题模型JST(Joint sentiment/topic)的改进,在JST的基础上引入了词对的概念,来缓解短文本的稀疏性以及加强了对一词多义的理解。然后对不同时间段的微博电影评论进行BJST建模,对提取出的主题计算主题强度和主题相似度,最后做出主题强度和主题情感在不同时间片上的变化图。该方法能在不同时间序列上同时分析出主题和情感,并可以根据时间预测各个主题在时间上的主题强度和情感的变化趋势,以此来判断电影的舆论演化趋势。(本文来源于《西华大学》期刊2017-05-01)

宋佳颖[5](2016)在《基于机器学习的汉语情感极性分类方法研究》一文中研究指出随着Web2.0逐渐走向成熟,网络中出现了大量的用户生成意见文本,意见挖掘因此而成为自然语言处理领域的一个研究热点。作为意见挖掘研究的关键问题之一,情感极性分类的目的是判定意见文本表达的情感倾向性为正向或负向。本文面向产品评论,在机器学习框架下从情感词典扩展、意见复述生成以及情感极性分类特征选择与表示等叁个方面探索汉语情感极性分类问题。具体如下:1.领域相关的汉语情感词典扩展:鉴于意见本文中广泛存在动态极性评价表达,本文以属性-评价对作为领域情感词典的基本词条。首先,根据有标注文本中的意见要素构建种子词典。然后,有监督地抽取未标注文本中的意见要素信息,通过统计得到的共现频率和词间距离将意见要素匹配为属性-评价对。最后,利用改进的PolarityRank算法预测词条的极性完成词典扩展。实验结果在领域文本的情感分类中验证了情感词典的适用性。2.基于多标准评估的情感复述生成:针对大规模意见标注文本比较缺乏的问题,本文提出通过意见复述生成的方法缓解数据稀疏。首先利用语序调整、复述评价短语替换和隐含属性替换生成大量的复述候选。然后,从不同角度设定评估机制对候选进行筛选得到扩展语料。最后,利用复述生成方法同时扩展训练数据和测试数据完成情感极性分类。实验得到的情感分类结果好于复述生成基线方法的情感分类结果,验证了我们提出的复述生成及过滤策略的有效性。3.汉语情感极性分类的特征选择与表示:以特征的选择和表示方法为重点来提高意见文本的情感极性分类性能。本文对多种特征选择方法得到的词语特征、短语特征进行比较,并探究多种特征表示方法。通过多组特征选择方法、特征表示和不同分类模型的结合完成情感极性分类,对比实验结果得到适合意见评论文本情感分类的n-gram特征与特征表示。(本文来源于《黑龙江大学》期刊2016-05-20)

蔡启煌[6](2016)在《细粒度中文网络消费评论情感极性分类方法研究》一文中研究指出近年来,随着电子商务和各种类型互联网互动社区的同步快速发展,网络消费评论信息,形成了具有重要商业价值的大数据集。网络商品评论的情感分析技术能够从主观性文本中识别、抽取相关的倾向性信息,通过特定算法以量化形式描述出文本所表达的主观意见,借此推测出评论者对所购买商品或服务的喜好程度,能够影响消费者的决策行为,对于改进商品特性、精准推送商品信息也具有重要的指导意义。为使情感分析的效用更加精准的作用于某一属性之上,以最大发挥消费评论的商业价值,本文开展网络消费评论分析中情感词与属性词的自动提取算法,以及基于情感词与属性词分析的细粒度网络消费评论情感极性分类方法研究。本文首先利用网络爬虫技术抓取了网络餐饮消费评论作为语料库,借助机器学习、自然语言处理等领域的理论知识,结合中文网络评价语言表达方式的特点,提出一种基于语料的领域情感词库自动构建方法;结合了餐饮评论中情感词与属性词之间的特征分析,提出基于名词+LDA(Latent Dirichlet Allocation)和基于字词间距+LDA+情感词库两种属性词搜寻策略,并对方法和策略的有效性进行了实验验证和实验结果分析;构建情感评价单元,根据情感评价单元进行情感计算,依据计算得分实现细粒度的文本情感分析,将细粒度情感分析结果以图形化层次结构进行了输入显不。通过本文的研究能够进一步提高用户评论情感分析的精确性,并使其在产品或服务改进、消费决策过程中发挥更大的指导作用。(本文来源于《大连海事大学》期刊2016-03-01)

宋佳颖,黄旭,付国宏[7](2016)在《基于词语情感隶属度特征的情感极性分类》一文中研究指出在模糊集合论框架下探索基于词语情感隶属度的情感极性分类特征表示方法。以TF-IDF为权重分别构建情感特征词语的正向、负向极性隶属度,并以隶属度对数比作为分类特征值构建基于支持向量机的情感极性分类系统。在产品评论、NLPCC2014情感分类评测数据和IMDB英文影评等数据上的实验结果表明,基于情感隶属度特征的系统优于基于布尔、频度和词向量等特征表示的系统,验证了所提出的基于情感隶属度特征表示的有效性。(本文来源于《北京大学学报(自然科学版)》期刊2016年01期)

张朝龙,许源平,郑皎凌[8](2015)在《基于协同过滤和文本相似性的Web文本情感极性分类算法》一文中研究指出Web文本情感极性分类算法在网络舆情监控方面具有重要的研究价值。针对传统文本分类算法依赖于情感词典的弊端,以及不能很好的应用于不规则的Web文本分类的局限性,提出基于协同过滤和文本相似度的Web文本情感极性分类算法。先统计分析网络文本高频词汇覆盖情况,进而根据统计结果,基于协同过滤和余弦相似度计算提出一种新的Web文本情感极性分类算法,其利用余弦相似度方法计算出Web文本的相似性,判断文本的情感极性。对于无法直接判断情感极性的文本,该算法设计了协同过滤中的情感词评分以及Top-N情感词推荐机制,且通过对情感词的评分与推荐输出进行多次迭代相似度计算来判断未知Web文本情感极性。最后使用中文情感挖掘语料(Chn Senti Corp)进行实验。结果表明,算法具有较高的查全率和查准率,在不规则的Web文本下也表现出较好的分类效果,可较实用地解决Web文本情感极性分类问题并应用于网络舆情监控。(本文来源于《成都信息工程学院学报》期刊2015年04期)

卢伟胜[9](2015)在《微博意见领袖识别与情感极性分类技术研究》一文中研究指出在短短几年内,微博呈爆炸式发展,越来越多的公众舆论因为微博平台得以快速传播。微博意见领袖在舆情导向上发挥比较大的影响作用,而微博的内容决定着舆情的导向。微博意见领袖识别技术以及情感极性分类技术可以有效地对微博进行舆情监控。本文研究工作主要与这两方面的技术有关,具体工作内容如下:(1)针对目前已有的微博意见领袖识别模型存在的不足以及意见领袖在线检测方法研究的缺乏,本文提出了一种基于特定话题的微博意见领袖在线检测方法。对某一话题进行了约一周的微博意见领袖在线检测实验,实验结果表明该方法能够在线收集与指定话题有关的微博信息并且能够动态计算出参与该话题讨论的用户的影响力,从而检测出其中的意见领袖。(2)传统的n-gram文本特征向量提取方法往往会产生很高的维度,高维数据不但增大了分类的难度,同时也会增加数据处理的时间。为了减少特征维度,本文提出了一种基于词性序列的特征提取方法,它基于词性序列能够代表一类文本的这一个特点,利用词性序列组来作为文本的特征表示以达到降低特征表示维度的效果。该方法在保证分类精度的情况下,能够提取出较少的特征,并将该方法应用于微博情感分类。在实验中,通过两种分类器对分类效果进行评估并且验证了该方法的有效性。(3)为了进一步细化微博情感极性分类的研究任务,提出了微博子空间分类思想以及情感词子空间,并用情感词子空间对基于词典的情感分类算法进行改进。该方法首先将微博划分到不同的情感词子空间中,然后再使用相应子空间中的分类方法对微博进行情感极性分类。经过实验对比,本文提出的方法不但提高了分类准确率,同时召回率也得到了较大的提高。(本文来源于《福建师范大学》期刊2015-06-01)

廖健,王素格,李德玉,张鹏[10](2015)在《基于观点袋模型的汽车评论情感极性分类》一文中研究指出该文针对网络评论倾向分级问题,提出了一种基于观点袋模型和语言学规则的多级情感分类方法。通过分析句子中的词性搭配关系,设计了12种抽取特征-观点搭配模式,并对存在问题给出了解决策略。依据汉语用词特点和词汇在汽车领域的特殊用法,提出搭配四元组的情感倾向极性值计算方法。在此基础上,利用获取的搭配四元组及其情感倾向极性,建立文本的向量化表示,并构造了权重计算公式。最后,利用文本余弦相似度计算方法实现对评论文本的五级情感极性分类。通过在COAE2012任务3的汽车数据集上进行的测试,取得了较好的分类结果。(本文来源于《中文信息学报》期刊2015年03期)

情感极性分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

当前情感极性分析时使用机器学习方法进行褒贬分析需要完备的语料库,但对特定领域的语料库构建困难,而只使用情感词典的分类方法准确率低。针对以上缺点提出了一种改进的机器学习方法和情感词典结合的集成学习情感极性分类方法。首先,使用Word2Vec特征提取方法将每条评论表示成固定维度向量,使用常见的机器学习分类方法进行分类,找出效果最好的分类方法;然后使用基于情感词典的朴素贝叶斯分类方法进行情感极性分类。最后将基于情感词典和集成学习的方法相结合,使用谭松波公开的数据集酒店评论数据进行实验。理论分析和实验表明,使用Word2Vec作为特征提取方法的支持向量机(SVM)分类方法结合基于情感词典的朴素贝叶斯分类方法的集成学习方法可以将积极类的准确率和宏平均分别提高6. 9个百分点和3个百分点,将消极类的召回率和宏平均分别提高8. 8个百分点和5. 1个百分点,有效提升了情感极性分类效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

情感极性分类论文参考文献

[1].杜梦豪,黄文明,孙晓洁,邓珍荣.基于动态池化和注意力的文本情感极性分类[J].计算机工程与设计.2019

[2].朱军,刘嘉勇,张腾飞,邱利茂.基于情感词典和集成学习的情感极性分类方法[J].计算机应用.2018

[3].田竹.基于深度特征提取的文本情感极性分类研究[D].山东大学.2017

[4].牟兴.基于中文微博的电影评论情感极性分类及舆论演化分析[D].西华大学.2017

[5].宋佳颖.基于机器学习的汉语情感极性分类方法研究[D].黑龙江大学.2016

[6].蔡启煌.细粒度中文网络消费评论情感极性分类方法研究[D].大连海事大学.2016

[7].宋佳颖,黄旭,付国宏.基于词语情感隶属度特征的情感极性分类[J].北京大学学报(自然科学版).2016

[8].张朝龙,许源平,郑皎凌.基于协同过滤和文本相似性的Web文本情感极性分类算法[J].成都信息工程学院学报.2015

[9].卢伟胜.微博意见领袖识别与情感极性分类技术研究[D].福建师范大学.2015

[10].廖健,王素格,李德玉,张鹏.基于观点袋模型的汽车评论情感极性分类[J].中文信息学报.2015

标签:;  ;  ;  ;  

情感极性分类论文-杜梦豪,黄文明,孙晓洁,邓珍荣
下载Doc文档

猜你喜欢