导读:本文包含了主题数据模型论文开题报告文献综述及选题提纲参考文献,主要关键词:关联规则,Apriori算法,LDA主题模型,专利
主题数据模型论文文献综述
艾楚涵,姜迪,吴建德[1](2019)在《基于主题模型和关联规则的专利文本数据挖掘研究》一文中研究指出如何从海量的专利信息中挖掘出不同专利之间隐含的关联关系是很多专利管理系统迫切需要解决的问题.本文从专利文本的摘要出发,提出一种基于Apriori和引入LDA主题模型的专利文本分析方法.首先,采用Apriori算法对数据降维,挖掘关键词和主题词之间的关联规则并根据规则绘制共享主题网络图,然后使用LDA主题模型对离散化的专利-主题词矩阵进一步线性降维,并将主题聚类,得到主题细分下的高频词主题,最后结合两种分析方法的结果对专利文本进一步挖掘分析.本文所使用的方法能够有效地挖掘出专利文本数据间的关联,可以为专利间的关联推荐提供思路和应用参考.(本文来源于《中北大学学报(自然科学版)》期刊2019年06期)
曾祥坤,张俊辉,石拓,邵可佳[2](2019)在《基于主题提取模型的交通违法行为文本数据的挖掘》一文中研究指出长期以来,各类交通事故严重影响了人们生命财产安全和社会经济发展。交通事故分析是对交通事故资料进行调查研究,发现事故动向和各种影响因素对事故总体的作用和相互关系,以便定量地认识事故现象的本质和内在规律。通过对交通事故中记录驾驶员违法行为的文本数据进行分析,提出了一种文本主题提取模型和技术,来挖掘交通事故中驾驶员风险驾驶因素,解决以往交通事故统计中交通违法行为难以挖掘的问题,计算出影响交通事故的最大支配因素。最后以北京地区一般程序处理的交通事故为例,结合北京市交通管理专家经验,验证该模型可应用于交通事故中违法行为的主题提取,结论与长期治理经验相吻合。(本文来源于《电子技术应用》期刊2019年06期)
万红新[3](2019)在《基于动态主题模型的大数据网络舆情热点抽取》一文中研究指出随着互联网的发展和普及,在网络上产生了大量的评论数据,形成舆情热点话题。舆情热点是一个动态的变化过程。提出的动态主题模型可以从舆情文本中发现动态变化的热点词,通过词语间的主题聚类来提取舆情热点词语,实现从海里文本数据中提取网络舆情热点。(本文来源于《电脑知识与技术》期刊2019年08期)
余本功,陈杨楠,杨颖[4](2019)在《基于主题模型和专利数据的技术创新评价研究》一文中研究指出[目的/意义]专利是企业技术创新活动的重要成果,对专利数据进行分析,有利于客观评价企业技术创新能力。[方法/过程]从计量的角度对企业专利数据进行分析的同时,结合机器学习的方法,通过LDA模型对专利摘要文本进行内容挖掘,构建基于专利文本内容的评价指标,建立由专利数量、专利趋势和专利内容叁方面指标组成的技术创新评价体系。[结果/结论]采用熵值法确定各项指标对企业技术创新的影响权重,并通过实验对国内自主品牌制造企业进行技术创新评价,说明了评价方法的现实意义。(本文来源于《现代情报》期刊2019年01期)
李锐,张伟彬[5](2018)在《基于TF-IDF算法和LDA主题模型数据挖掘技术在电力客户抱怨文本中的应用》一文中研究指出随着大数据时代的到来,数据挖掘涉及的领域愈发广泛,语意丰富的非结构化文本中的价值也越发增加,文本挖掘技术显得尤为重要,客户抱怨的文本数据成为审视自己产品与服务的关键所在。本文对文本挖掘技术进行梳理,采用TF-IDF算法有效处理词频信息,并将词频信息通过LDA主题模型有效的分类,采用电力客户抱怨文本数据库,得到了有意义的结果。最后通过实验验证了理论的可行性,实验结果表明,基于TF-IDF算法和LDA主题模型挖掘技术在电力客户抱怨文本中能够有效的呈现客户抱怨的问题。(本文来源于《自动化技术与应用》期刊2018年11期)
郎玫[6](2018)在《大数据视野下中央与地方政府职能演变中的匹配度研究——基于甘肃省14市(州)政策文本主题模型(LDA)》一文中研究指出[目的/意义]中央和地方职能之间的匹配性、对应性是职能研究的重要内容,其能够深入揭示中央—地方政策实施的匹配性效率,并间接反映职能变迁的内在逻辑,该问题对进一步细化地方政府职能研究具有重要意义。[方法/过程]收集甘肃省14个市(州)政策文本的大数据,运用主题模型LDA算法来处理2006至2016年间公开公布的336万余字政策文本,从主题模型聚合中得出市级政府主题模型并与中央职能进行匹配性分析。[结果/结论]研究表明甘肃省各市州职能供给匹配存在完整性与零散性并存,职能供给匹配的结构上一致性与特殊性并存的结论,从大数据的角度佐证了甘肃省政府职能演变中地方职能供给结构性不足与核心政府行政职能弱化等问题。(本文来源于《情报杂志》期刊2018年09期)
许杨子[7](2018)在《电力交易运营数据仓库主题模型建立的研究及应用》一文中研究指出在电力体制改革不断深入推进的背景下,为提升电力交易运营业务的多级管控能力,通过多视角、多维度的灵活分析,满足电力交易运营对决策分析的更高要求。本文研究建立电力交易运营数据仓库技术,支撑电力交易运营的灵活统计与精准分析,实现交易运营技术从管理支撑到分析决策的跨越。本文首先研究国内外最新的研究成果,结合电力交易运营领域,进行分析、吸呐,并在此基础上通过系列研究,建立了面向电力交易运营的数据仓库模型。(本文来源于《信息记录材料》期刊2018年07期)
张婷[8](2018)在《基于LDA主题模型的食品安全舆情数据分析》一文中研究指出随着网络时代的快速发展,人们可以通过网络上各种公众的平台得到很多信息,巨大的信息量也已经成为当今时代大数据网络的一个发展趋势。食品安全的问题是一个值得关注的重要话题,所以要想从大量的信息中找到跟食品安全相关的重要问题是十分有意义的。Latent Dirichlet Allocation(LDA)作为一种潜在的语义主题模型,能够实现对于相同词语的语义之间的主题词汇之间的关联,以此去实现对文本中隐含词汇的分析和聚类,可以使得文档或者是文档集中每一篇文档的主题采用概率分布这种形式将其列出,比较适合我们研究食品安全舆情数据的分析。本文主要工作如下:(1)首先是获取数据,这里用到是爬虫技术。网络爬虫技术有几种爬取策略,所以针对每一种策略和规则进行比较,选出一种最适合做这个课题研究的。(2)对获取到的数据进行处理,数据的处理是为了保证数据的质量,所以这一过程也是很重要的,分为两步,第一步是对数据进行去杂,就是去掉无用的信息;第二步就是对数据进行分词处理,通过对数据分词处理的技术进行研究,发现使用最多的是结巴分词和NLPIR分词技术,本文选择的是结巴分词来进行操作的。(3)通过对处理好的数据利用LDA进行模型分析,它是无监督的学习技术,所以在此基础上再通过对LDA加上标签成为半监督的模型来进行对比分析,其中的模型参数利用Gibbs Sampling进行求解。最后通过几种模型与LDA以及半监督LDA的分析比较可以得出在对食品安全进行舆情数据分析的问题上是非常有帮助的,鉴于食品安全的重要性,所以这个研究是很有价值的,基于这种理论就可以对有关食品安全的问题进行舆情分析研究。(本文来源于《武汉轻工大学》期刊2018-06-01)
曹奔,夏勉,任志洪,林秀彬,徐升[9](2018)在《大数据时代心理学文本分析技术——“主题模型”的应用》一文中研究指出主题模型(Topic Model)作为一种计算机化文本分析方法,目前被研究人员应用于心理学文本分析领域的诸多研究中。在心理咨询研究领域中,主题模型可以用于探索咨询过程中咨询师和当事人之间谈话的主题,比较不同治疗类别的相似性,以及进行行为编码;在社交媒体与心理健康上,利用主题模型可识别和预测各种心理障碍以及进行人格计算。未来需要关注主题模型在算法和操作上的改善,并将其应用到中文语言环境之中,探索中文文本的心理学内涵。(本文来源于《心理科学进展》期刊2018年05期)
余宏,洪如霞,史文津[10](2018)在《基于大数据的企业主题网络舆情分析系统模型研究》一文中研究指出随着网络技术的发展,特别是移动网络应用的普及,普通民众通过网络对社会热点事件进行关注、评论与监督变得前所未有的便利,互联网已成为社会舆论传播的主渠道。同时,互联网上每天海量增长的舆情数据也给舆情管理部门带来挑战,特别是企业重要的舆情信息如果不能及时掌控,极易给企业发展带来重大负面影响。因此,在分析大数据及企业网络舆情相关概念、原理的基础上,根据企业网络舆情的特点构建了基于大数据的企业主题网络舆情分析系统模型,描述系统各个组成部分的功能。并将基于Hadoop平台的分布式存储和并行计算技术引入到企业网络舆情分析中,借助本体技术提高舆情的语义分析能力,对大数据环境下企业网络舆情数据的处理分析作初步探索。(本文来源于《现代计算机(专业版)》期刊2018年13期)
主题数据模型论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
长期以来,各类交通事故严重影响了人们生命财产安全和社会经济发展。交通事故分析是对交通事故资料进行调查研究,发现事故动向和各种影响因素对事故总体的作用和相互关系,以便定量地认识事故现象的本质和内在规律。通过对交通事故中记录驾驶员违法行为的文本数据进行分析,提出了一种文本主题提取模型和技术,来挖掘交通事故中驾驶员风险驾驶因素,解决以往交通事故统计中交通违法行为难以挖掘的问题,计算出影响交通事故的最大支配因素。最后以北京地区一般程序处理的交通事故为例,结合北京市交通管理专家经验,验证该模型可应用于交通事故中违法行为的主题提取,结论与长期治理经验相吻合。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
主题数据模型论文参考文献
[1].艾楚涵,姜迪,吴建德.基于主题模型和关联规则的专利文本数据挖掘研究[J].中北大学学报(自然科学版).2019
[2].曾祥坤,张俊辉,石拓,邵可佳.基于主题提取模型的交通违法行为文本数据的挖掘[J].电子技术应用.2019
[3].万红新.基于动态主题模型的大数据网络舆情热点抽取[J].电脑知识与技术.2019
[4].余本功,陈杨楠,杨颖.基于主题模型和专利数据的技术创新评价研究[J].现代情报.2019
[5].李锐,张伟彬.基于TF-IDF算法和LDA主题模型数据挖掘技术在电力客户抱怨文本中的应用[J].自动化技术与应用.2018
[6].郎玫.大数据视野下中央与地方政府职能演变中的匹配度研究——基于甘肃省14市(州)政策文本主题模型(LDA)[J].情报杂志.2018
[7].许杨子.电力交易运营数据仓库主题模型建立的研究及应用[J].信息记录材料.2018
[8].张婷.基于LDA主题模型的食品安全舆情数据分析[D].武汉轻工大学.2018
[9].曹奔,夏勉,任志洪,林秀彬,徐升.大数据时代心理学文本分析技术——“主题模型”的应用[J].心理科学进展.2018
[10].余宏,洪如霞,史文津.基于大数据的企业主题网络舆情分析系统模型研究[J].现代计算机(专业版).2018