导读:本文包含了极性话题论文开题报告文献综述及选题提纲参考文献,主要关键词:话题发现,文本聚类,热度评估,极性分析
极性话题论文文献综述
王琦[1](2016)在《面向网络新闻的热点话题发现与极性分析》一文中研究指出随着网络媒体的迅猛发展以及互联网普及率的提高,互联网中随时都有大量的新闻报道产生。通常,关于同一新闻话题的众多报道分散地显示在各大新闻网站中,而且并非所有的新闻话题都会被人们关注。此外,由于互联网更加强调交互性,人们更倾向于在网络新闻平台上表达自己的看法和态度。面对网络中海量的新闻报道以及评论信息,如何将新闻网站中大量且分散的新闻报道归为各个话题,以较为集中的方式展示关于同一话题的所有新闻报道,然后筛选出热点话题并分析其极性,具有十分重要的意义。本文以真实的新闻数据为研究对象,进行热点话题发现与极性分析的研究。为了从抓取的海量新闻报道中检测出当前的热点新闻话题,本文提出了一种热点话题发现算法。由于文本聚类是话题发现的关键步骤,本文重点对文本聚类算法进行了改进,通过批处理、多向量、二次聚类等改进措施提高了话题发现的准确性。获取到各个话题之后,本文提出了一种评估话题热度的方法,用于计算各个话题的热度值并排序,从而筛选出热点话题。在热点话题发现的基础上,为了获取人们对热点话题的观点和态度,本文提出了一种基于极性词典与语义规则的极性分析方法。本文在开源情感词典的基础上,人工构建了本文的极性词典,在构建过程中考虑了修饰词、网络用语及评价对象对极性分析结果的影响。此外,本文对极性分析过程中用到的语义规则进行了归纳。之后采用极性词典与语义规则相结合的特征项抽取方法抽取评论文本中的情感特征项,并根据本文提出的极性值计算方法,得到各个热点话题的极性。最后通过应用实例对本文提出的话题发现算法和极性分析方法进行了验证,实验结果表明本文提出的改进算法是可行有效的。(本文来源于《大连海事大学》期刊2016-11-01)
尹兰,雷霈,周竞[2](2016)在《基于关键词图的社交话题抽取及情感极性判别》一文中研究指出研究结合社交媒体特点,充分考虑标签文本和内容文本信息,融合了传统的LDA话题模型对社交文本信息进行话题聚类,从而实现了对社交数据的话题发现,与此同时,文章提出了基于关键词图模型构建话题特征,并结合支持向量机模型进行文本情感极性判别。研究在开放微博数据集和COAE2014公开评测数据上进行了相关实验,实验证明了有效的关键词图模型能进一步克服中文语义的模糊性和歧义性。(本文来源于《贵州师范大学学报(自然科学版)》期刊2016年02期)
黄军[3](2015)在《社交网络热点话题公众情感极性实时计算研究》一文中研究指出随着互联网不断发展,如今数以亿计的网民可以通过微博、论坛、贴吧等社交平台对热点问题发表意见和建议,时刻都在产生海量的数据。这些数据具有增长迅速、结构多样、动态更新、范围广泛等特点,蕴含着社会各个阶层的公众情感信息。进行公众情感信息数据挖掘研究,对于信息检索、电子商务、舆情监控等领域具有重要意义。社交网络公众情感信息挖掘已经进入海量数据处理阶段,并且实时性需求越来越迫切。目前针对海量公众情感信息挖掘通常采用非实时性的批处理计算方式,且挖掘研究较少涉及到实时计算业务及互联网短文本情感极性特征。因此针对社交网络公众情感极性实时计算课题,本文分别从文本情感计算和流式实时计算两个方面展开研究:(1)文本情感计算的准确性将直接影响社交网络公众情感挖掘效果。由于社交网络公众信息,通常具有语句结构不规整、上下文语境复杂多变、网络词汇及情感符号丰富等特征,于是文本情感计算容易发生较大偏差。通过研究文本情感计算构建情感词典及模板匹配方法,本文提出一种综合两者特征且结合其它情感极性影响因素的规则匹配方式短文本情感极性计算方法。首先,将情感本体词语区分为单极性词语与多极性词语。接着,单极性词语根据相应的情感词典进行情感极性及强度标注,而多极性词语则运用结构规则匹配与关键词规则匹配进行词语情感极性计算。在完成词语级别的情感极性值计算之后,然后结合修饰词、句子语气及表情符号情感影响因素,最后进行语句及短文本层面的情感极性值计算。(2)针对社交网络中公众情感信息实时挖掘的业务需求,且结合社交网络中流式短文本数据的特征,本文提出关于流式短文本数据的一种通用实时计算模型,即RUBP模型。其中RUBP模型的核心实时计算模块是依托于Twitter Storm框架实现,因此RUBP计算特征与Storm框架计算特征类似。基于通用实时计算模型,研究与业务挖掘相关的流式计算方法,其中包括顺序计算方法和趋势计算方法,并对于RUBP模型进行性能优化,提出基于拓扑结构和基于通信量的两种不同调度改进方式。(3)结合上述研究内容,本文进行了社交网络公众情感极性实时计算实验与分析。针对某一热点事件的微博数据,运用RUBP模型与基于规则匹配的短文本情感极性计算方法,进行模拟实时计算实验,并通过批处理实验进行比对。实验结果表明RUBP模型与基于规则匹配的短文本情感极性计算方法具有较好的可行性,且两者结合可以进行社交网络公众情感极性实时计算研究工作。(本文来源于《杭州电子科技大学》期刊2015-03-01)
庞俊[4](2010)在《基于确定话题和情感极性的博客文本聚类研究》一文中研究指出随着互联网的发展,人们获取信息的需求不断增加,而面对庞大的网络信息量,同时也给人们获得需要的信息带来极大的困难。网络信息中极为典型的是博客文本,或简称博客。博客中常包含大量评论,包含了博客作者对人,事物,事件等的情感和态度(统称为观点)。这些情感和态度包含着大量有价值的信息。了解这些“观点”、“情感极性”或“态度”可以帮助人们获得更有价值的信息,从而进行有效的抉择,如告诉人们应当购买何种商品,帮助商家制定市场策略,帮助政府掌握网络舆情。分析和挖掘博客中蕴含的博客作者的观点成为当前数据挖掘领域研究热点之一。观点挖掘是一种从论坛、讨论组等内容中挖掘所表达的观点的技术。一般观点挖掘有四个子任务:(1)话题抽取(Topic Extraction)(2)观点持有者识别(Holder Identification)(3)陈述的选择(Claim Selection)(4)情感分析(Sentiment Analysis)。观点挖掘的研究国外起步早,主要针对英文文本;国内针对中文文本的观点挖掘研究起步晚,很多基础性工作尚在进行中。目前,绝大部分的研究把情感极性(或者称为情感倾向,即人对客观事物的好、恶,褒、贬,支持、反对等态度)分为2类(正向和负向)或3类(正向、中立和负向)。众所周之,人的情感是丰富的,仅仅使用这2、3种,不足以表达蕴含在博客文本中的作者的情感,需要用更多类的情感极性来表达。目前,基于作者,日期和话题等对博客文本进行聚类研究已有先例,而基于情感极性对中文博客文本聚类研究仍鲜见报道。本文主要根据博客文本中的作者的情感极性,采用聚类技术,将中文博客文本进行分组处理,使组内文本的情感极性相近,组间文本具有不同情感极性,并达到细分情感极性的目的。经研究发现,尽管博客文本中包含了丰富的情感,不过这些情感可能很分散,而博客搜索引擎搜索到的博客搜索结果项(指标题和摘要部分)虽然包含的情感比较少,但是这些情感倾向性相对集中。所以,本次研究使用博客搜索结果来作为博客文本的精练表达,从而以此为研究对象。本文首先设计一个“爬虫”,用它来获取Google博客由此得到确定话题(本文实验部分选用了两个话题“建国大业”与“刘翔”)相关的结果。然后,使用人工标注的方法根据情感极性把采集到的数据集标注成3类(正向,中立和负向)。接着,使用中科院ICTCLA分词工具对搜索结果数据集进行分词预处理,并使用基于词典的方法提取情感词(文中采用了Hownet和NTUSD两部中文情感词词典)。紧接着,使用Adam Schenker, Horst Bunke等提出的“标准的基于图的文本表示模型”(简称为GBR模型)和本文作者设计的“整合图文本表示模型”(简称为SoB-graph模型)分别表示数据集文本;在此基础上使用Adam Schenker, Horst Bunke等使用的基于图文本表示模型的K-Medoids算法,进行情感聚类分析。最后,使用簇中心方法表示了聚类情感簇,所谓簇中心即同类情感词的折衷情感词,并使用"Ground Truth"方法的叁个常用度量:精度(Precision),熵(Entropy)和边缘索引(Rand Index)对聚类结果进行评介。实验结果表明:使用作者提出的SoB-graph模型进行的聚类分析性能较好。(本文来源于《武汉理工大学》期刊2010-04-01)
极性话题论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
研究结合社交媒体特点,充分考虑标签文本和内容文本信息,融合了传统的LDA话题模型对社交文本信息进行话题聚类,从而实现了对社交数据的话题发现,与此同时,文章提出了基于关键词图模型构建话题特征,并结合支持向量机模型进行文本情感极性判别。研究在开放微博数据集和COAE2014公开评测数据上进行了相关实验,实验证明了有效的关键词图模型能进一步克服中文语义的模糊性和歧义性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
极性话题论文参考文献
[1].王琦.面向网络新闻的热点话题发现与极性分析[D].大连海事大学.2016
[2].尹兰,雷霈,周竞.基于关键词图的社交话题抽取及情感极性判别[J].贵州师范大学学报(自然科学版).2016
[3].黄军.社交网络热点话题公众情感极性实时计算研究[D].杭州电子科技大学.2015
[4].庞俊.基于确定话题和情感极性的博客文本聚类研究[D].武汉理工大学.2010