导读:本文包含了警情数据分析论文开题报告文献综述及选题提纲参考文献,主要关键词:警情数据,关联规则,Apriori算法,压缩矩阵
警情数据分析论文文献综述
王云,李丛[1](2019)在《基于改进关联规则算法的警情数据分析》一文中研究指出针对传统Apriori算法挖掘警情数据的缺点,提出一种改进的Apriori算法。该算法首先在关联规则发现阶段引入权值参数,设计支持度阈值函数,以挖掘不常发生的重大案情发生规律;然后提出一种压缩矩阵优化算法,将数据压缩存储在只有0或1的矩阵中,并用2个数组来记录矩阵中每一行及每一列1的总数,可多次压缩矩阵,提升挖掘效率;最后将改进的算法用于实际的警情数据挖掘分析,给出关联规则挖掘结果。实验表明,改进算法不仅执行效率较传统算法有所提升,且针对警情数据的挖掘结果准确性也有所提高。(本文来源于《计算机与现代化》期刊2019年12期)
张翰垠[2](2019)在《股市舆情数据的挖掘与分析研究》一文中研究指出随着计算机科技的高速发展与网络数据信息的激增,数据挖据技术已经逐步成为信息时代下推动金融股票市场创新发展的核心力量。在股票市场中越来越多的股民投资者热衷于在网络论坛中交流股市投资心得,由此产生的非结构化股评舆情数据成为了影响股票市场健康发展的重要因素。在有关网络舆情数据与股票市场关系的各类研究中,传统的股市交易指标已经无法满足投资者把握股票市场运行规律的需求。本文基于机器学习和深度学习技术对股市舆情数据进行了挖掘与分析,力求解决股市舆情潜藏情感倾向挖掘能力不足以及相关交易指标预测结果不佳的问题,相关研究工作如下:1.使用爬虫抓取器,按照特定规则遍历解析东方财富网股吧网页评论信息及其它特定属性列表信息作为股市舆情数据源。借助多个处理工具对原始数据进行去噪声、去干扰以及分词、停用词过滤等预处理工作,在中文分词和特征矩阵构建的结构化过程中引入TF-IDF加权技术和Word2vec表达技术实现非结构文本的量化表示,以提高后续分类预测模型的输入质量与学习效果。2.以挖掘股市舆情数据的情感倾向作为研究目标,基于朴素贝叶斯和卷积神经网络两种思想构建股评舆情数据情感倾向分类器,根据分类器评测指标对比分析了两种分类器的分类效果,结果表明,基于卷积神经网络的股评舆情数据情感倾向分类准确率高于朴素贝叶斯情感分类器,进一步证明了卷积神经网络在股市领域对股评舆情情感倾向分类的准确性。3.研究了股评舆情数据中潜藏情感信息结构化权值强度对股票交易指标成交量的影响,研究结果表明,通过情感词典匹配计算得到的交易日股评舆情情感值在某种程度上可以对相应股市交易日的成交量指标进行行为预测,并较为真实地反应一定时间内股市成交量的走势情况。4.基于支持向量回归机和BP神经网络两种方法,研究了股市舆情数据对股票收益率的影响,并对两种方法的性能评价指标进行了对比分析,结果表明,两种模型的学习结果均能预测股市收益率及其走势情况,且支持向量回归机模型的预测误差小于BP神经网络,进一步验证了支持向量回归机模型在预测股市收益率时可以产生优于BP神经网络的预测结果。(本文来源于《兰州理工大学》期刊2019-05-23)
李倩茹[3](2019)在《基于短文本聚类的网络舆情数据分析》一文中研究指出互联网舆论是指公众通过互联网平台发布、表达自己对社会热点事件的看法和评论。随着“互联网+”的迅速发展,社交媒体巧妙地改变了人们在社会中的互动方式。越来越多的人通过社交网络平台如微博、微信和论坛交流,而短文本数据被广泛使用,并且存在于这些社交媒体中。短文本数据承载大量的用户信息,同时传输公共信息,各式各样的短文本数据充斥着网络,进而形成网络舆情。如何更好地处理短文本数据和发现舆情数据隐藏的主题词已经成为网络舆情数据分析的一个重要研究内容。本文针对短文本聚类和网络舆情主题词挖掘过程中存在的局限性,减少短文本特征稀疏对网络舆情数据分析的影响。因此,借助于机器学习聚类算法,改进了传统的K均值聚类算法。中心思想是优化第一阶段的Canopy算法预处理。把每次Canopy算法形成的重迭子集称之为覆盖集,并且不像传统的K-means算法考虑每个点到所有中心的距离。而是计算点到其所属覆盖集中心的距离。随着K-means算法的迭代,每个覆盖集中心将继续变化,直到收敛为止。在此基础上,提出了BK-means聚类算法。网络舆情数据分析提出了一种基于BTM的舆情主题词挖掘模块,通过改进TF-IDF权重算法以减少频度对权重的影响。最后利用BK-means聚类算法挖掘主题词。本文主要创新内容如下:(1)对于短文本聚类面临的问题,如特征稀疏、维度高和噪声干扰等,传统的基于向量空间模型的聚类方法不适用于短文本的数据处理。在选取初始聚类中心的阶段,通过改进K均值聚类算法,引入Canopy算法进行预处理,优化初始聚类中心的选择。BKmeans聚类算法每次只比较落在对象与所属覆盖集中心的距离。减少了比较次数的同时,大大降低整个聚类的运行时间以及算法的时间复杂度。实验证明,基于BK-means的短文本聚类算法优于传统的短文本聚类算法,F值和纯度值均有提高。(2)本文针对舆情主题词挖掘方面的问题,提出基于BTM主题模型,对短文本数据进行主题建模。采用对数函数log和开方根来代替传统TF-IDF算法中的tf值,改进用于文本相似度量的TF-IDF权重算法。减轻词频对权重的影响,以适应舆情短文本的特征,更好的表示短文本,再利用BK-means聚类算法发现主题词,有效的改善了主题词发现的质量。此外,F值和纯度值在聚类算法中被用作评价指标。通过在爬取的数据集上进行对比实验,对本文提出的BK-means算法以及基于BTM模型进行主题词挖掘的性能进行综合评测。实验结果表明,在处理短文本数据时,本文提出的BK-means算法能很好的缓解短文本数据特征稀疏的影响。与传统的K均值聚类算法相比,F值和纯度值有明显提高。在基于BTM的舆情主题词挖掘模块,通过改进TF-IDF算法,在一定程度上减轻了词频对权重的影响。最后利用BK-means算法相对于传统的方法发现的主题词更具有相关性。(本文来源于《天津理工大学》期刊2019-03-01)
杜晓辉,王烨,孙佳哲[4](2019)在《数据治理与分析——警情云合成作战平台的研发与应用》一文中研究指出数据的共享、融合、治理是未来公安信息化发展的方向,通过整合全社会、公安、政府等多方面的数据源,构建"一人一档"社会人员的整体人物画像和"一案一档"的案件管理模块,为公安在防范、管制、控制、服务、破案等多个方面工作提供数据支持,并结合公安的现状和实际业务需求,提出了警情云合成作战平台的数据治理方案、建设方案,进行了应用案例分析。(本文来源于《警察技术》期刊2019年01期)
鲁艺兵,杨槐柳,冯威,胡子昂,王威[5](2019)在《全市电信网络诈骗警情分析大数据出炉》一文中研究指出2019年已经到来,在刚刚过去的2018年,这一年电信网络诈骗警情如何,哪种警情发案最高,哪种手段骗钱最多?上月10日,武汉警方公布2018年全市电信网络诈骗警情分析大数据。截至目前,网络兼职诈骗案件发案最高,占全市电信网络诈骗警情总数的15%。贷款诈骗(本文来源于《长江日报》期刊2019-01-03)
沈欣[6](2018)在《学情数据的分析与应用》一文中研究指出在线开放课程是学校提升教学质量的重要抓手之一,是高校教学工作的重要组成部分,而对于教学过程中产生的学情数据有些院校并没有给予高度重视。学情数据是学生学习过程中重要的基础数据,它反映了学生学习中的各项指标内容,如果把学情数据进行统计分析,从分析结果可以看到个别差异化学生的特性数据也可以看到共性学生的趋势化数据,根据结果加以个性化的督导,提升学生各方面指标,提高教学质量。(本文来源于《学园》期刊2018年36期)
郭功举[7](2018)在《通过网络爬虫获取舆情数据分析人的行为习惯》一文中研究指出随着网络及科技的迅速发展,网上的数据越来越繁多,越来越复杂化,数据处理和分析就变得尤为重要,利用网络爬虫爬取数据对大数据进行分析处理有着重大的意义。本文以上海美食为例,对网络爬虫所获取的数据进行分析,最后对网络爬虫的延伸应用进行了展望。(本文来源于《测绘通报》期刊2018年S1期)
苏家有[8](2018)在《高校校情数据统计分析与发现》一文中研究指出在"智慧化"管理的思维引领下,数据作为反映校情重要的战略资源,因其在组织结构和外部管理数据应用上发挥的重要作用和优势,越来越受到高度的重视。在传统管理模式的基础上,充分发挥校情数据战略资源的作用,充分发挥与融合数据统计分析手段,是提高教育教学质量的需要,是提高宏观政策科学性的需要,是提高管理绩效的需要。(本文来源于《科技资讯》期刊2018年27期)
,胡颖,通讯员,徐礼国[9](2018)在《交警山海天大队精准警务保旺季畅通》一文中研究指出本报讯( 胡颖 通讯员 徐礼国)两个月时间,疏导车辆400余万台次,查处各类交通违法1.3万起、完成各级警卫任务47批次,辖区内未出现明显交通堵塞,交通事故实现零死亡。在刚刚结束的旅游旺季,面对七八月份周末客流量呈“井喷”态势,碧海路日车流量(本文来源于《日照日报》期刊2018-09-17)
许宁,陈伟斌,马玉贤,袁帅,刘雪琴[10](2018)在《面向海洋调查与风险评估的冰情数据应用需求分析》一文中研究指出本文对冰情监测数据在海冰条件调查、海冰监测、风险评估与预警中的工作需求进行了论述,并从标准规范、技术要求等角度对具体海冰监测要素的内容进行了汇总。面向海洋调查的传统海冰监测主要目的是获取冰情及环境要素数据,开展不同时空尺度的冰情演变规律分析及预测,为用海规划和工程海冰条件确定提供依据。通过2部海洋调查国家标准,以及涉及风电、港口、核电、船舶、石油、桥梁等涉及6个行业6类工程的9部国内外典型标准对比分析,归纳了海冰调查对于冰情监测的要素性需求。对于近年逐渐兴起的海冰风险评估和监测预警的新需求,结合行业内的试行规范和海冰灾害机理,分别分析了区域综合体和产业经济体两类目标的冰情监测需求。面向冰情监测的不同需求可为海冰监测体系发展提供新的需求。(本文来源于《海洋环境科学》期刊2018年05期)
警情数据分析论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着计算机科技的高速发展与网络数据信息的激增,数据挖据技术已经逐步成为信息时代下推动金融股票市场创新发展的核心力量。在股票市场中越来越多的股民投资者热衷于在网络论坛中交流股市投资心得,由此产生的非结构化股评舆情数据成为了影响股票市场健康发展的重要因素。在有关网络舆情数据与股票市场关系的各类研究中,传统的股市交易指标已经无法满足投资者把握股票市场运行规律的需求。本文基于机器学习和深度学习技术对股市舆情数据进行了挖掘与分析,力求解决股市舆情潜藏情感倾向挖掘能力不足以及相关交易指标预测结果不佳的问题,相关研究工作如下:1.使用爬虫抓取器,按照特定规则遍历解析东方财富网股吧网页评论信息及其它特定属性列表信息作为股市舆情数据源。借助多个处理工具对原始数据进行去噪声、去干扰以及分词、停用词过滤等预处理工作,在中文分词和特征矩阵构建的结构化过程中引入TF-IDF加权技术和Word2vec表达技术实现非结构文本的量化表示,以提高后续分类预测模型的输入质量与学习效果。2.以挖掘股市舆情数据的情感倾向作为研究目标,基于朴素贝叶斯和卷积神经网络两种思想构建股评舆情数据情感倾向分类器,根据分类器评测指标对比分析了两种分类器的分类效果,结果表明,基于卷积神经网络的股评舆情数据情感倾向分类准确率高于朴素贝叶斯情感分类器,进一步证明了卷积神经网络在股市领域对股评舆情情感倾向分类的准确性。3.研究了股评舆情数据中潜藏情感信息结构化权值强度对股票交易指标成交量的影响,研究结果表明,通过情感词典匹配计算得到的交易日股评舆情情感值在某种程度上可以对相应股市交易日的成交量指标进行行为预测,并较为真实地反应一定时间内股市成交量的走势情况。4.基于支持向量回归机和BP神经网络两种方法,研究了股市舆情数据对股票收益率的影响,并对两种方法的性能评价指标进行了对比分析,结果表明,两种模型的学习结果均能预测股市收益率及其走势情况,且支持向量回归机模型的预测误差小于BP神经网络,进一步验证了支持向量回归机模型在预测股市收益率时可以产生优于BP神经网络的预测结果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
警情数据分析论文参考文献
[1].王云,李丛.基于改进关联规则算法的警情数据分析[J].计算机与现代化.2019
[2].张翰垠.股市舆情数据的挖掘与分析研究[D].兰州理工大学.2019
[3].李倩茹.基于短文本聚类的网络舆情数据分析[D].天津理工大学.2019
[4].杜晓辉,王烨,孙佳哲.数据治理与分析——警情云合成作战平台的研发与应用[J].警察技术.2019
[5].鲁艺兵,杨槐柳,冯威,胡子昂,王威.全市电信网络诈骗警情分析大数据出炉[N].长江日报.2019
[6].沈欣.学情数据的分析与应用[J].学园.2018
[7].郭功举.通过网络爬虫获取舆情数据分析人的行为习惯[J].测绘通报.2018
[8].苏家有.高校校情数据统计分析与发现[J].科技资讯.2018
[9].,胡颖,通讯员,徐礼国.交警山海天大队精准警务保旺季畅通[N].日照日报.2018
[10].许宁,陈伟斌,马玉贤,袁帅,刘雪琴.面向海洋调查与风险评估的冰情数据应用需求分析[J].海洋环境科学.2018