话题模型论文-程克非,邓先均,周科,罗昭,陈旭东

话题模型论文-程克非,邓先均,周科,罗昭,陈旭东

导读:本文包含了话题模型论文开题报告文献综述及选题提纲参考文献,主要关键词:网络舆情,微博,热点话题,综合权值

话题模型论文文献综述

程克非,邓先均,周科,罗昭,陈旭东[1](2019)在《基于微博多维度及综合权值的热点话题检测模型》一文中研究指出传统热点检测算法仅从单一的某个维度衡量话题的热度,导致热点话题检测精度低,在对突发性热点话题进行检测时尤为明显。针对此问题,提出一种多维度热点话题度量模型。该模型对话题进行筛选,得到一个热点话题初始集,再融入话题热度的影响力因子,计算各个话题的综合权值,将话题的综合权值按照一定的权重与多维度热点话题度量模型进行有效融合,得到一种基于微博多维度及综合权值的热点话题检测模型。通过使用真实的微博数据进行实验对比分析,实验结果表明,提出的多维度热点话题度量模型在对突发性热点话题的检测中,其准确率(Precision)、召回率(Recall rate)和F1值(F-measure) 3个评估指标相比传统算法有了较大提高;利用该模型对突发性热点话题进行跟踪,通过与官方指数进行对比,该模型能有效跟踪其发展趋势。(本文来源于《重庆邮电大学学报(自然科学版)》期刊2019年04期)

黄畅,郭文忠,郭昆[2](2019)在《基于双向量模型的自适应微博话题追踪方法》一文中研究指出针对微博文本篇幅短小、网络新词层出不穷等特点以及在话题发展过程中产生的漂移问题,提出了基于双向量模型的自适应微博话题追踪方法.该方法首先提出双向量模型,将文本用词嵌入和VSM向量空间模型两种方法分别向量化,保留文本语义的同时也解决了微博新词问题.其次,将话题和微博分别用双向量模型表示,计算话题双向量模型和微博双向量模型的余弦相似度作为话题与微博的相似度.接着,将话题与微博的相似度与自适应学习获得的相似度阈值进行比较,判定微博是否为话题相关微博.最后,自适应更新话题模型,能够有效地应对微博话题发展所产生的漂移.实验结果表明,该方法能够实时地跟踪话题并降低了话题相关微博的漏检率和误检率.(本文来源于《小型微型计算机系统》期刊2019年06期)

董静[3](2019)在《基于主题模型和聚类算法的网络热点话题发现》一文中研究指出社交媒体的快速发展引发的网络复杂性问题给网络的研究带来了很大挑战,网络中出现的舆情问题此起彼伏,用户可以随时随地发表自己的看法,这就积累了大量用户产生的数据。如:图片、文本、视频等。这些数据中隐藏着很有价值的信息,它反映了当前网民关注的热点话题,但是网络的错综复杂使人们不能及时有效地获取信息,如何准确发现网络中的热点话题成了学者们研究的重点问题。本文采集新浪微博数据,通过对微博文本内容、用户转发、评论等信息以及用户特点相关属性深入分析,主要工作如下:(1)针对传统词对主题模型在短文本处理时对所有词采取同一处理,忽略用户个性化问题,提出基于词对主题模型的话题特征提取方法。首先,主题建模时引入用户因素,将同一用户产生的所有文本作为一个文档;其次考虑背景词和主题词,删掉无关背景词,引入用户的吉布斯采样对模型参数推导;最后使用JS和余弦相似度联合判断话题是否为同一个分类,从而保证特征提取的准确度。(2)针对萤火虫算法易陷入局部最优,迭代过程中容易跳过最优解的问题,提出动态自适应步长萤火虫算法。迭代初期较大步长保证以较快的速度定位在接近全局最优解的范围内,迭代后期以较小步长在最优解附近寻优,从而增强算法的寻优能力。(3)针对模糊聚类算法(Fuzzy c-means algorithm,FCM)对初始中心点敏感,单纯对距离的聚类不能准确发现网络热点话题的问题,提出基于改进萤火虫算法的模糊聚类方法。通过改进萤火虫算法优化聚类中心,此过程中,话题影响力作为萤火虫相互吸引度,并将其应用到FCM算法中改善适应度函数寻优,依据文本相似度建立萤火虫个体的联系,得到初始中心后使用FCM算法再聚类。对聚类得到的话题根据影响力值高低排序,从而获得准确度高的热点话题。采集新浪微博真实数据,对上述工作进行实验,比较不同条件下各算法性能,实验结果表明本文所提算法的性能要优于其它算法。(本文来源于《河北大学》期刊2019-06-01)

王凯,潘玮,杨宝华[4](2019)在《基于OTSRM模型的话题情感演化分析》一文中研究指出舆情话题检测与情感演化分析在舆情监控中起着非常重要的作用,但当前方法存在着情感话题含义不明确、情感态势评估不精确等问题。在OLDA (Online Latent Dirichlet Allocation)模型的基础上引入情感强度,并提出一种情感迭代思想,构建在线话题情感识别模型OTSRM(Online Topic and Sentiment Recognition Mode)。该模型通过增加基于β先验的情感遗传度,建立情感演化通道,获取特征词、情感词2个分布矩阵,最后使用相对熵方法计算话题焦点在相邻时间片段上的最大情感值,从而高效地识别不同文本的话题情感。在5个网络事件数据集上对OTSRM模型进行有效性验证,并与主流模型进行了对比,实验表明OTSRM模型在舆情话题识别与话题情感演化分析方面实现了良好效果。(本文来源于《情报学报》期刊2019年05期)

李净桦[5](2019)在《基于神经网络的社交话题热度预测模型研究》一文中研究指出随着社交软件的不断普及和运用,当今时代逐渐变成一个互联网的时代,为人们的沟通和生活方式带来了巨大的改变。通过研究热点话题的热度趋势,便于获得热点话题的产生和传播规律,一方面有效了解了用户转发行为,另一方面能够分析和监督网络舆情,是一个极其具有价值的理论探究内容。本文基于社交网络的热点话题,考虑到话题下多消息对用户参与行为具有重要作用。将用户的基本特征和多消息的交互影响因素结合,分别从微观用户转发行为和宏观热点话题热度趋势进行了研究。下面是本文的主要研究工作和贡献:1.关于话题多消息之间复杂的交互作用对用户转发行为的影响,提出并设计了多消息交互影响下用户转发行为的预测模型。首先,围绕多消息相互作用对用户转发行为的影响,在用户行为内部驱动机制的基础上,提出多消息交互影响驱动机制。其次,由于BP(Back Propagation)神经网络结构简单且能完好响应由于多消息交互机制的加入导致的非线性关系更加繁复,用其构建用户转发行为预测模型。最后,由于多消息交互影响机制对用户行为具有迭代引导作用,使BP神经网络很容易陷入过拟合的情况,所以引入模拟退火算法对传统神经网络进行优化,得到最优参数,从而提高算法的准确性。2.关于热点话题的热度趋势,采用卷积神经网络以及指数平滑法对每一时间段的话题热度值进行预测,可以准确客观地描述微博话题的热度趋势。首先,本文将话题划分成合适的时间段。然后,微观方面采用卷积神经网络预测用户行为,对预测结果进行相加操作,近似代表话题的热度值;宏观方面采用指数平滑法对下一时段话题的热度值进行预测。最后,综合两方面来感知话题的整体热度趋势。最后,实验采用新浪微博的实际数据集去检验。实验表明,本文不仅能更真实地依据多消息相互影响的实际情况对用户转发行为进行预测,还能够从宏观角度分析出话题的传播规律,从而预测热点话题的热度趋势。有助于解析热点话题中网民群体行为变化中的科学规律,同时对网络舆情引导以及复杂的营销管理决策提供理论依据。(本文来源于《重庆邮电大学》期刊2019-05-17)

周芮[6](2019)在《基于RS模型的男女多人对话话题共振研究》一文中研究指出在日常交往过程中,由于性别和价值观的差异,男性和女性在多人对话中往往呈现出不同的话题选择倾向。“性别语言”一直是社会语言学的研究热点,许多学者从传统语法学、社会语言学、心理语言学、系统功能语言学等角度分析了两性言语的共性、差异及语用效果等,但尚未见学者基于对话句法学研究性别语言的话题选择倾向,鲜有学者探索多人对话时的话题选择倾向,更未见用具体语料做出详细认证。作为认知语言学的最前沿成果,对话句法学认为传统句法只研究了词语横向关系,而忘却了对话时纵向间的结构关系。且以往研究仅分析了两人对话,而未能涉及多人对话,据此笔者尝试基于“认知参照点链”,“激活扩散模型”与对话句法学的“语义共振”建构RS模型。在此模型中,笔者提出了共振循环,多向共振等观点,并以此作为理论框架较为详细地分析了2018年《非诚勿扰》中的多人对话语料(共395段,2082共振点),最终得出话题共振频率的蕴涵等级。本文的主要贡献如下:第一:将对话句法学的研究范围从两人对话拓展到多人对话。因为,在现实交往中,日常对话往往是多人参与。第二:认知参照点链模型及语义共振很好地解释了两人对话时话题的延伸及话语连贯,但多人对话时,话题的延伸不再单向延伸,而是呈现出多主体参与的多向性、交错性等特点。基于过往理论之不足,笔者尝试建构RS模型,用于分析多人对话中的话题共振频率。第叁:本文对2082共振点进行详细分析统计后得出如下结论(详见第四至第五章)。在男女多人对话中男性的话题共振倾向具体表现为:休闲活动(35%)>择偶标准(32%)>人际关系(25%)>基本信息(12%)>恋爱经历(5%);而女性的话题共振倾向则具体表现为:休闲活动(37%)>基本信息(29%)>恋爱经历(20%)>择偶标准(9%)>人际关系(6%)。其中男女双方在各类共振频率中还有以下几点特征:(1)男女双方都明显呈现出部分共振的趋势。(2)相较于女性,男性在完全共振和零位共振方面更为显着。(3)相较于男性,女性在冗余共振方面更为显着。因此,在男女交往中,男性的语言表达较为直接,倾向于展示其真实个性;女性则更为委婉,偏向于维持良好的形象。而话题的恰当选择以及对谈话双方话题共振程度的正确解读,对男女恋爱关系的建立有着重要的推动作用。(本文来源于《四川外国语大学》期刊2019-04-01)

何志强[7](2019)在《基于微博话题的情感分析模型的研究》一文中研究指出中文微博情感分析旨在提取网民对于热点时事的倾向、观点和看法。对社交平台文本进行的情感分析任务可以获得国内网民的情感状态,因此在政府舆情控制、公司产品营销、民意调查等许多方面发挥着重要作用。现如今随着互联网技术的发展,网民对于微博、微信为代表的社交平台变得愈发依赖,中文微博情感分析的现实意义也变得愈发重要。但在现在的网络大环境下,人们表达自己观点和情绪的新生网络词语越来越多,方式越来越丰富。可能一句话里面就同时包含了汉语、英语、网络流行语与表情符号。加之,网络流行语常常以反讽的语气居多。传统的情感分析模型已经不再能满足现微博环境下的情感分析需求了。本文将基于现微博环境,对传统情感分析模型做以改进,提出了一个基于微博话题的细粒度情感分析模型。本论文现有的工作主要有以下叁个部分:1.基于传统中文微博情感分析模型,结合对象级情感分析思想,在原有模型基础上做了改进并提出了新模型。使其能够胜任针对微博话题词的情感分析任务。2.在文中提出新模型的基础之上,通过改进注意力机制策略和加入语言学知识两种方式对模型进行改进,提高模型的正确率。3.以文中提出的新模型为核心,结合现实应用环境,运用前后端编程技术完成模型的系统设计与实现。针对第一和第二部分的研究主题,设计有相应的对比实验。通过实验结果表明,本文所提出的模型,在手动获取以及公开评测数据集上有着良好的表现,在基于微博话题词的情感分析任务中有着较高的性能。(本文来源于《北京邮电大学》期刊2019-02-20)

王晰巍,张柳,文晴,王楠阿雪[8](2018)在《基于贝叶斯模型的移动环境下网络舆情用户情感演化研究——以新浪微博“里约奥运会中国女排夺冠”话题为例》一文中研究指出了解和掌握移动环境下网络舆情用户情感演化规律及构建情感演化模型,对相关部门加强移动环境下网络舆情信息监管和正确引导网络舆情走向具有重要意义。本文基于朴素贝叶斯模型,以训练词向量、文本预处理、训练朴素贝叶斯、性能测评为处理过程,从词频、地域和时间叁个可视化维度构建基于移动环境下网络舆情用户评论情感分析模型;以新浪微博"里约奥运会中国女排夺冠"话题为例进行可视化分析情感演化过程研究。本文所构建的情感分析模型能有效运用于移动环境下网络舆情用户情感演化研究,实证研究结果表明新浪微博用户对"里约奥运会中国女排夺冠"话题主要呈现正向情感,同时直辖市、沿海省份等经济发达地区相比西南地区、东北地区等经济欠发达省份对话题态度更加乐观。(本文来源于《情报学报》期刊2018年12期)

屈庆涛,刘其成,牟春晓[9](2018)在《基于N-Gram语言模型的并行自适应新闻话题追踪算法》一文中研究指出针对传统的向量空间模型及一元语法模型表示话题的文本特征时忽略词语之间语序关系的问题,提出一种基于NGram语言模型的并行自适应新闻话题追踪算法。使用N-Gram语言模型,利用新闻报道中词语间的语序关系进行文本表示,根据贝叶斯分类算法进行话题追踪,利用最小特征平均可信度阈值更新策略,采用测试新闻报道更新训练集,完善话题模型,并在MapReduce分布式计算模型上予以实现。试验表明,该算法不仅有效地提高了话题追踪效果,而且具有良好的并行加速比和可扩展性。(本文来源于《山东大学学报(工学版)》期刊2018年06期)

黄畅,郭文忠,郭昆[10](2019)在《面向微博热点话题发现的改进BBTM模型研究》一文中研究指出针对目前基于主题模型的微博短文本热点话题发现存在特征稀疏、高维度以及需要人工指定主题数目等问题,提出一种基于改进突发词对主题模型(bursty biterm topic model,BBTM)的热点话题发现方法(hot topic-hot biterm topic model,H-HBTM)。首先,利用词的突发概率进行特征选择,过滤非突发词。其次,结合微博文本的突发特性和传播特性计算微博词对的热值突发概率,将热值突发概率作为BBTM的先验概率。最后,利用基于密度的方法自适应选择BBTM的最优话题数目,确定最优BBTM,实现热点话题发现。在真实微博数据集上的实验表明,H-HBTM可以在不需要预先设定主题数目的情况下,自动发现最优话题模型,并且H-HBTM发现的热点话题的质量高于基于BBTM、词对主题模型以及潜在狄立克雷分配的方法。(本文来源于《计算机科学与探索》期刊2019年07期)

话题模型论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对微博文本篇幅短小、网络新词层出不穷等特点以及在话题发展过程中产生的漂移问题,提出了基于双向量模型的自适应微博话题追踪方法.该方法首先提出双向量模型,将文本用词嵌入和VSM向量空间模型两种方法分别向量化,保留文本语义的同时也解决了微博新词问题.其次,将话题和微博分别用双向量模型表示,计算话题双向量模型和微博双向量模型的余弦相似度作为话题与微博的相似度.接着,将话题与微博的相似度与自适应学习获得的相似度阈值进行比较,判定微博是否为话题相关微博.最后,自适应更新话题模型,能够有效地应对微博话题发展所产生的漂移.实验结果表明,该方法能够实时地跟踪话题并降低了话题相关微博的漏检率和误检率.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

话题模型论文参考文献

[1].程克非,邓先均,周科,罗昭,陈旭东.基于微博多维度及综合权值的热点话题检测模型[J].重庆邮电大学学报(自然科学版).2019

[2].黄畅,郭文忠,郭昆.基于双向量模型的自适应微博话题追踪方法[J].小型微型计算机系统.2019

[3].董静.基于主题模型和聚类算法的网络热点话题发现[D].河北大学.2019

[4].王凯,潘玮,杨宝华.基于OTSRM模型的话题情感演化分析[J].情报学报.2019

[5].李净桦.基于神经网络的社交话题热度预测模型研究[D].重庆邮电大学.2019

[6].周芮.基于RS模型的男女多人对话话题共振研究[D].四川外国语大学.2019

[7].何志强.基于微博话题的情感分析模型的研究[D].北京邮电大学.2019

[8].王晰巍,张柳,文晴,王楠阿雪.基于贝叶斯模型的移动环境下网络舆情用户情感演化研究——以新浪微博“里约奥运会中国女排夺冠”话题为例[J].情报学报.2018

[9].屈庆涛,刘其成,牟春晓.基于N-Gram语言模型的并行自适应新闻话题追踪算法[J].山东大学学报(工学版).2018

[10].黄畅,郭文忠,郭昆.面向微博热点话题发现的改进BBTM模型研究[J].计算机科学与探索.2019

标签:;  ;  ;  ;  

话题模型论文-程克非,邓先均,周科,罗昭,陈旭东
下载Doc文档

猜你喜欢