话题发现论文-绿门

话题发现论文-绿门

导读:本文包含了话题发现论文开题报告文献综述及选题提纲参考文献,主要关键词:初中,中学

话题发现论文文献综述

绿门[1](2019)在《本期话题:哪个瞬间你发现自己长大了》一文中研究指出从小学升入初中,意味着一个新阶段的开始。有没有哪个瞬间让你突然觉得自己长大了?欢迎围绕我们的话题,说出你的看法与故事。可将内容发送到"今日中学生"微信公众号,分享给大家。一起来听听下面的同学是怎么说的吧。(本文来源于《今日中学生》期刊2019年31期)

李想,倪丽萍,夏千姿,彭晨,高九洲[2](2019)在《在线新闻话题发现技术研究及应用综述》一文中研究指出在线新闻话题发现是目前话题检测与追踪(TDT)领域的研究热门方向之一,在线新闻话题发现研究可以帮助公众更加清晰全面地了解网络热点事件,有助于有关部门开展相关工作,对舆情监控、个性化推荐等具有重要意义。本文从在线话题发现技术和应用两个方面对在线新闻话题发现研究现状展开综述,总结了基于传统方法和基于多模态信息融合方法的在线新闻话题发现技术的研究现状,展示了在线新闻话题发现的应用成果,归纳目前存在的不足,探讨研究中的重难点,找寻未来可以深入研究和改进的方向。(本文来源于《第十四届(2019)中国管理学年会论文集》期刊2019-11-01)

李海明[3](2019)在《基于SSDKmeans算法的微博热点话题发现研究》一文中研究指出为及时从海量微博信息中迅捷有效提取出微博热点话题、事件,提出基于频繁集的聚类SSDKmeans算法,在有限空间下统计分词的近似频数,并在此基础上构建文本向量空间模型,在聚类生成的每个话题簇中提炼话题关键词。通过对2万条微博数据进行有效性验证,结果表明,基于SSDKmeans算法的话题发现有较高的召回率和精准率,分别为91.3%、92.1%。SSDKmeans算法能够有效提高微博热点话题发现率,进而及时了解社会热点话题与舆论趋势。(本文来源于《软件导刊》期刊2019年09期)

陈凤,蒙祖强[4](2019)在《基于BTM和加权K-Means的微博话题发现》一文中研究指出为适应微博数据的短文本、低词频、缺乏语义表达等特殊性,提高话题发现的准确性,利于用户从大量微博数据中获取有用信息,本文提出一种基于BTM和加权K-Means方法实现微博话题发现。首先,针对微博数据稀疏性的问题,采用BTM模型对微博中的短文本进行建模,获得话题词;然后针对传统K-Means算法本身的缺陷,提出加权K-Means算法实现微博话题发现;最后实验验证本文的方法,实验结果表明,BTM和加权K-Means方法解决了微博数据高维度和稀疏性的问题,提高了热点话题发现的准确性和有效性。(本文来源于《广西师范大学学报(自然科学版)》期刊2019年03期)

周箫[5](2019)在《基于话题检测的网络安全威胁发现与跟踪技术研究》一文中研究指出恶意软件和高级持续性攻击(APTs)的出现要求安全专家从开源数据中实时分析、检测网络威胁,并将其转换成可读的威胁情报以帮助安全分析员尽早的快速响应及抵御新兴网络威胁。然而通过人力从大量开源无结构文本数据中识别网络威胁是不可能的。由于这些原因,我们需要多维度的知识发现和数据挖掘方法帮助我们系统的提高和理解网络数据威胁。网络威胁检测首先从多源安全数据中抽取威胁相关信息,然后通过数据关联方法综合这些信息碎片,创造更高层次的概念来描述潜在威胁。其具体可以描述为从开源的威胁信息碎片中实时识别即将到来的安全话题,形成威胁情报,帮助安全相关人员快速响应新兴网络威胁。之前的学者很少对开源威胁信息进行研究,现有的安全平台(security week,微步在线)也只是发现开源威胁信息的一般类别标签(病毒,漏洞),不能识别威胁信息具体所属的话题或者威胁标签(APTs)。因此,我们提出一个新颖的FAC-CTI(基于领域特征提取方法与改进层次聚类的网络威胁情报检测)方法分析开源威胁数据,实时识别新兴威胁话题。本文的威胁话题检测FAC-CTI方法主要由叁部分组成,分别是数据采集及预处理,关键特征抽取,话题聚类与跟踪。第一部分,首先数据采集模块收集安全论坛、安全资讯网站等所有安全类别数据,提取其中的标题、正文、时间和标签类别等信息,存入数据库。其次本文对爬虫工具抽取的文章进行预处理,去除噪声信息。本文预处理阶段对文章进行停用词删除、标点符号去除、词性标注及去除、大小写转换和词形还原等操作,最终生成的词语作为关键特征抽取的候选词,提高特征提取效率及效果。第二部分本文提出叁种特征提取方法:①在TF-IDF(Term Frequency-Inverse Document Frequency)方法基础上,本文提出考虑词位置、词性的增量TF-IDF方法计算词权重,提取关键词特征;②通过迁移学习的词向量模型训练词向量,本文提出结合特征词向量相似度的主题词特征提取方法识别文章主题词特征;③实体识别方法识别地名、人名和安全组织机构领域实体特征。第一部分生成的文章关键特征抽取的候选词作为输入,本文利用提出的叁种特征抽取方法提取文章叁种互补的特征。另外本文利用特征融合技术融合上述特征,构建文章特征向量。与之前特征提取方法不同,上述特征提取方法充分利用安全领域知识,提取出包含领域特性的特征。第叁部分,上述特征提取方法构建的文章特征向量作为输入,本文在HAC(层次聚类)算法基础上,提出改进的层次聚类算法对每段时间内的文章特征向量聚类,挖掘安全话题,实时识别新兴话题或者跟踪历史话题的事件延续。实验数据来自于开源wiki数据集,开源TDT5话题检测与跟踪英文数据集,以及爬虫收集的8个安全网站、论坛的安全数据集。FAC-CTI方法在安全数据集上的召回率,精确率,F值均达到0.98以上,且实验效果均高于其它常见的话题检测方法,实验结果证明FAC-CTI方法性能显着,能够很好的识别威胁话题。在TDT5数据集上进行话题发现与跟踪实验,本文提出的方法不仅能够进行威胁话题发现,进行调整后同样适用于其它领域话题检测与跟踪,证明本文提出的方法扩展性好。(本文来源于《北京邮电大学》期刊2019-06-05)

王丽华[6](2019)在《“发现”话题作文示例与简评》一文中研究指出文题呈现作为一名中学生,只要你拥有一双充满智慧的眼睛,主动去观察生活,思考生活,就能在成长之路上发现许多东西,比如大自然的奥秘,比如真善美、假恶丑等。请以"发现"为话题写一篇作文,题目自拟,文体不限,不少于600字。写作指导所谓"发现",就是指人们经过研究、探索等,看到或找到前人没有看到或找到的事物或规律。发现既可以指向人的内心,也可以指向(本文来源于《作文》期刊2019年06期)

管灵玥[7](2019)在《基于话题演化的潜在意见领袖发现方法研究》一文中研究指出随着web2.0时代的到来,互联网的飞速发展,传统的媒体逐渐被互联网时代下生成的新媒体取代。通过互联网,信息的传播速度更快,传播途径更多,用户在面对互联网中的繁杂信息难以选择和决策。因此,用户倾向于选择意见领袖提供的信息。意见领袖在信息传播和舆论演变的过程中发挥着极其重要的作用。现在很多学者都通过计算意见领袖的影响力来判断意见领袖的实际作用。本文将话题和回答者观点对于用户的影响力的影响加入到模型中,用回答者之间的文本相似度度量回答者之间的转移概率,用评论文本的情感倾向度量评论者转向回答者的转移概率,以此构造转移矩阵,根据PageRank算法进行迭代后即可得到用户的影响力得分。通过建立DTM话题演化模型,将每个话题按照时间戳根据话题的热度变化趋势将时间线分成十一个时间窗口。根据创建好的时间窗口,对话题的文本信息进行处理,判断话题文本在该时间窗口下的主题分布,再通过回答者的回答判断该回答的主题分布,通过判断两个分布的区分度来识别符合话题演化趋势的意见领袖,并对发现的意见领袖进行评价。实验结果显示基于PageRank算法改进的潜在意见领袖发现算法可以更准确地识别出意见领袖,可以覆盖更多的人群,更广泛的话题,更贴合话题主题。而且DTM模型可以提取更符合话题演化趋势的意见领袖。(本文来源于《哈尔滨工业大学》期刊2019-06-01)

董静[8](2019)在《基于主题模型和聚类算法的网络热点话题发现》一文中研究指出社交媒体的快速发展引发的网络复杂性问题给网络的研究带来了很大挑战,网络中出现的舆情问题此起彼伏,用户可以随时随地发表自己的看法,这就积累了大量用户产生的数据。如:图片、文本、视频等。这些数据中隐藏着很有价值的信息,它反映了当前网民关注的热点话题,但是网络的错综复杂使人们不能及时有效地获取信息,如何准确发现网络中的热点话题成了学者们研究的重点问题。本文采集新浪微博数据,通过对微博文本内容、用户转发、评论等信息以及用户特点相关属性深入分析,主要工作如下:(1)针对传统词对主题模型在短文本处理时对所有词采取同一处理,忽略用户个性化问题,提出基于词对主题模型的话题特征提取方法。首先,主题建模时引入用户因素,将同一用户产生的所有文本作为一个文档;其次考虑背景词和主题词,删掉无关背景词,引入用户的吉布斯采样对模型参数推导;最后使用JS和余弦相似度联合判断话题是否为同一个分类,从而保证特征提取的准确度。(2)针对萤火虫算法易陷入局部最优,迭代过程中容易跳过最优解的问题,提出动态自适应步长萤火虫算法。迭代初期较大步长保证以较快的速度定位在接近全局最优解的范围内,迭代后期以较小步长在最优解附近寻优,从而增强算法的寻优能力。(3)针对模糊聚类算法(Fuzzy c-means algorithm,FCM)对初始中心点敏感,单纯对距离的聚类不能准确发现网络热点话题的问题,提出基于改进萤火虫算法的模糊聚类方法。通过改进萤火虫算法优化聚类中心,此过程中,话题影响力作为萤火虫相互吸引度,并将其应用到FCM算法中改善适应度函数寻优,依据文本相似度建立萤火虫个体的联系,得到初始中心后使用FCM算法再聚类。对聚类得到的话题根据影响力值高低排序,从而获得准确度高的热点话题。采集新浪微博真实数据,对上述工作进行实验,比较不同条件下各算法性能,实验结果表明本文所提算法的性能要优于其它算法。(本文来源于《河北大学》期刊2019-06-01)

杨波[9](2019)在《新浪微博热点话题发现研究》一文中研究指出近年来,随着微博等社交网络媒体的快速普及,越来越多的用户使用微博获取和发布信息,因此微博中蕴含着海量的信息,这些信息不仅改变了人们的生活方式,还促进了社会的发展,是网络舆情的重要来源。因此,对微博数据进行分析,发现微博中的热点话题,将有助于政府部门发现当前的舆论导向并及时进行预警引导,同时有助于用户搜索热点,也有助于企业更加准确的获取用户需求和产品建议。针对传统话题检测方法在处理微博文本时文本表示不准确、聚类效果较差的问题,本文对文本表示、聚类算法以及热点评估等方面进行改进,提出一种有效的微博热点话题发现方法。该方法主要工作包括以下叁个方面:(1)针对传统方法对微博进行文本表示时存在的高维稀疏问题,结合CNN和自编码器的优势,构建文本卷积自编码器模型(Text Convolution Auto-Encoder,TCAE),对文本的词向量矩阵进行无监督学习,得到文本的高级特征表示。(2)针对传统Single-Pass算法对输入时序敏感的不足,提出一种改进的多阈值Single-Pass算法(MTSP),通过设置较高阈值来提高划分类簇的准确性,并在聚类过程中对相似类簇进行合并,避免数据输入顺序对结果的影响,最后对文本孤立点进行处理来减少话题聚类的误差。(3)结合微博数据特点对聚类检测到的话题进行分析,先发现话题中具有代表性的微博,然后利用评论转发和用户粉丝等信息,提出话题热度估计方法进行话题热度估计,最后对比话题热度得到热点话题结果。实验结果表明,TCAE使微博文本的文本表示更加准确,MTSP提高了微博话题检测的准确度,话题热度估计结果体现了热点话题的情况。(本文来源于《新疆大学》期刊2019-05-27)

伊秀娟[10](2019)在《基于LDA主题模型的高校新闻话题发现研究》一文中研究指出“互联网+”时代,网络新媒体得到了迅速发展,网络新闻逐渐成为人们获取信息的主要来源。高校学生作为网民中的主力军,对于新闻信息的获取更加依赖于网络。因此,如何从高校学生浏览的社会新闻中挖掘出不同的话题类型,及时掌握高校学生对于社会新闻话题的关注度及异常关注情况,引导学生正确看待社会新闻事件,对于高校思想教育工作的开展具有十分重要的意义。本文以学生浏览的社会新闻为研究对象,采用能够进行语义挖掘的LDA主题模型来对新闻文本进行表示,在对现阶段话题发现流程中涉及到的技术进行深入研究后,针对高校新闻话题发现技术中存在的问题提出了改进方案,使高校新闻话题发现的结果更为准确,具体工作开展如下:(1)针对标准LDA对新闻文本建模存在主题分布向高频词倾斜的问题,本文在优化了数据预处理流程的基础上提出一种基于标题加权的LDA主题模型。首先,通过整合停用词表及权值过滤的方式对文本建模的预处理流程进行优化,达到文本特征降维的目的,并在一定程度上降低无效高频词在主题中的分布概率。其次,由于新闻标题对新闻内容具有高度概括的作用,利用这一特点在LDA模型中引入了标题加权策略,建立标题-权值索引表对模型训练过程中的Gibbs采样算法进行改进。最后,通过实验结果表明,本文提出的文本建模方案不仅提高了模型训练的效率,还提高了标题词在主题中的分布概率,使得主题的描述更加准确,不同主题之间的区分度增强,因此对于文本的表示更加合理,能够在一定程度上提高话题发现结果的准确率。(2)在高校新闻话题发现阶段,本文提出了一种改进相似度计算方式的双层Single-Pass算法来提取新闻话题的类型,解决了传统Single-Pass聚类对于文档输入顺序敏感的问题。通过对比实验发现,改进的文本聚类算法在召回率、准确率和F值上都有明显的提升,使得高校新闻话题发现的结果更为准确。(3)采用本文提出的话题发现方法对采集到的高校新闻数据进行分析,得到学生关注的话题类型以及关注度。由结果可知,高校新闻话题发现研究对于高校学生工作的开展具有一定的指导作用。(本文来源于《北京交通大学》期刊2019-05-01)

话题发现论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在线新闻话题发现是目前话题检测与追踪(TDT)领域的研究热门方向之一,在线新闻话题发现研究可以帮助公众更加清晰全面地了解网络热点事件,有助于有关部门开展相关工作,对舆情监控、个性化推荐等具有重要意义。本文从在线话题发现技术和应用两个方面对在线新闻话题发现研究现状展开综述,总结了基于传统方法和基于多模态信息融合方法的在线新闻话题发现技术的研究现状,展示了在线新闻话题发现的应用成果,归纳目前存在的不足,探讨研究中的重难点,找寻未来可以深入研究和改进的方向。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

话题发现论文参考文献

[1].绿门.本期话题:哪个瞬间你发现自己长大了[J].今日中学生.2019

[2].李想,倪丽萍,夏千姿,彭晨,高九洲.在线新闻话题发现技术研究及应用综述[C].第十四届(2019)中国管理学年会论文集.2019

[3].李海明.基于SSDKmeans算法的微博热点话题发现研究[J].软件导刊.2019

[4].陈凤,蒙祖强.基于BTM和加权K-Means的微博话题发现[J].广西师范大学学报(自然科学版).2019

[5].周箫.基于话题检测的网络安全威胁发现与跟踪技术研究[D].北京邮电大学.2019

[6].王丽华.“发现”话题作文示例与简评[J].作文.2019

[7].管灵玥.基于话题演化的潜在意见领袖发现方法研究[D].哈尔滨工业大学.2019

[8].董静.基于主题模型和聚类算法的网络热点话题发现[D].河北大学.2019

[9].杨波.新浪微博热点话题发现研究[D].新疆大学.2019

[10].伊秀娟.基于LDA主题模型的高校新闻话题发现研究[D].北京交通大学.2019

标签:;  ;  

话题发现论文-绿门
下载Doc文档

猜你喜欢