导读:本文包含了数据挖掘网格论文开题报告文献综述及选题提纲参考文献,主要关键词:数据挖掘网格,决策树,并行算法设计,性能分析
数据挖掘网格论文文献综述
余新华[1](2018)在《数据挖掘网格中决策树并行算法设计及性能分析》一文中研究指出数据挖掘网格中的决策树算法属于并行算法,它能够保证传统串行分类算法在多台PC计算机与服务器所组建的数据挖掘网格中实现对并行数据的深度挖掘。本文就简要阐述了数据挖掘网格中的决策树并行算法及其数据试验过程,并对它的算法性能进行分析。(本文来源于《中国新通信》期刊2018年04期)
杨楠[2](2017)在《数据挖掘在电信公司网格化营销中的应用》一文中研究指出文章介绍了数据挖掘的概念和相关技术,详细阐述了使用CRISP-DM的数据挖掘方法论实践乌鲁木齐电信公司的网格化营销建设,已到达实现电信业务网格化、精确化的分析和营销。(本文来源于《数码世界》期刊2017年07期)
冯婷婷,张继福[3](2016)在《基于网格单元和P权值的离群数据挖掘方法》一文中研究指出基于单元的离群数据挖掘是一类典型的离群数据挖掘方法,尽管具有可以快速识别离群数据和修剪非离群数据等优点,但由于只从单元的角度修剪非离群数据,可能使一些单元无法准确的确定离群数据。给出了一种基于网格单元和P权值的离群数据挖掘算法。该算法首先将数据集的每维均分,划分网格单元,并在网格单元中,筛选出离群数据和正常数据网格单元;对既含有离群数据又有正常数据的网格单元,采用P权值的方法,来度量和确定离群数据,从而进一步提高了离群挖掘精度;最后,采用UCI数据集,实验验证了该算法的有效性和可行性。(本文来源于《太原科技大学学报》期刊2016年05期)
冯婷婷[4](2016)在《基于网格单元和P权值的离群数据挖掘及其并行化》一文中研究指出数据挖掘是从海量数据中发现有价值信息和知识的非平凡过程,可为决策支持服务,而离群数据挖掘是数据挖掘领域的重要组成部分之一。离群数据中经常包含着一些新颖而重要的信息,具有很高的研究价值,离群数据挖掘已在网络入侵检测、信用卡欺诈检测、环境监控、医疗科学等领域都得到广泛应用。本文从海量数据集的空间分布特征与网格单元空间特征结合的角度出发,运用网格单元、P权值以及MapReduce并行编程模型,对离群点挖掘算法及其并行化进行了研究。其主要研究成果如下:1)给出了一种基于网格单元和P权值的离群数据挖掘算法(CWOP)。该算法首先将数据集的每维均分,划分网格单元,并在网格单元中,筛选出离群数据和正常数据网格单元;对既含有离群数据又有正常数据的网格单元,采用P权值的方法,来度量和确定离群数据,从而进一步提高了离群挖掘精度;最后,运用UCI数据集,实验验证了本文算法的可行性。2)利用MapReduce编程模型,给出了一种基于网格单元和P权值的并行离群数据挖掘方法。该算法首先采用叁对Map和Reduce函数实现了统计每维数据的最大最小值、统计每个单元及邻域单元的对象数并选出一部分离群数据;其次,计算离群候选对象的P权值;最后,采用UCI数据集和天体光谱数据,用Eclipse作为开发工具,采用Java语言编写程序,设计并实现了MapReduce下基于网格单元和P权值的并行离群数据挖掘算法,实验验证了本文算法的有效性、可扩展性和可伸缩性。(本文来源于《太原科技大学》期刊2016-05-18)
吕亚娟,翁苏湘,李莹[5](2015)在《基于网格的临床医学数据挖掘技术的应用研究》一文中研究指出该论文的研究视角是当前比较热门的临床医学数据挖掘,分析了临床医学数据的存储特点,提出了依托医院现有网络实现医院的海量临床医学数据挖掘的方法,为医院在疾病诊断和治疗、医学科研与教学、医院管理等方面提供帮助。(本文来源于《科技创新导报》期刊2015年30期)
王越[6](2014)在《基于数据挖掘技术的联通网格化营销系统的设计与实现》一文中研究指出随着计算机软硬件技术的发展和互联网应用范围的扩大,大数据技术称为最近几年新技术关注的焦点之一,而数据挖掘技术就是大数据技术中最为核心的一部分,应用越来越多,尤其是在互联网产业、银行业、证券业、电信业中,已经成为对市场销售进行预测、指导的关键性技术。本文概述了系统开发的背景和数据挖掘技术的概念,并对企业对该系统的需求进行了分析,包括各种功能性需求和非功能性需求,功能性需求包括系统管理、网格管理、人员管理、渠道管理、集商客驻地网管理、业务预测和业务预警管理等;非功能性需求包括系统的安全性、可用性、易用性等。然后运用面向对象技术对系统进行架构设计,并介绍了主要使用的数据挖掘算法。并在此基础上对系统进行详细设计,而且描述了山东联通网格化营销管理系统的实现,着重介绍了运用数据挖掘技术进行的业务预测和业务预警功能。通过该系统的实际工作,为市场营销部门进行精准网格化营销提供决策依据。(本文来源于《山东大学》期刊2014-05-25)
谢冬[7](2013)在《基于网格的数据挖掘体系结构》一文中研究指出随着科学技术的飞速发展以及各种网格体系结构的应用和普及,计算机网络系统环境变得非常复杂并难以管理和统一,尤其是内部软件系统的运行以及各种细节技术问题,给现在的网络环境带来了更大的挑战性。通过科学合理利用网格数据挖掘体系就能够实现网络资源的共享,为网络资源提供一个安全多样化的运行氛围和体制。本文针对网格数据挖掘体系进行了探讨和分析,通过对放网格服务体系(OGSA)思想体系的阐述,并采用分层描述的方法,围绕功能、结构、调度成本和网格服务目标等进行了讲述。(本文来源于《计算机光盘软件与应用》期刊2013年07期)
孔令信[8](2012)在《数据挖掘网格中决策树并行算法设计及性能》一文中研究指出以决策树算法为设计的基础,提出了并行的算法,从而保证传统的串行分类法在多台PC机以及服务器数据挖掘网格上实现并行的数据挖掘体系,以数据的横纵划分结合递归的并兴华特点,建立了可扩展的高性能并行计算模式和体系,有效处理了海量数据未实现并行分类算法的问题。同时给出了知道高校计算的方式,根据具体的实践表明,所总结出的并行算法受到了多种因素的影响,同时具有高校的并行效率加速比。(本文来源于《才智》期刊2012年04期)
张燕[9](2012)在《网格环境中数据挖掘执行过程模型的研究》一文中研究指出随着信息技术的发展,大量数据在各种应用中被产生出来,并被分布的存储和积累在不同地点,如何从这些大量积累的、分布的数据中发现有用的、潜在的知识模式是一个极具挑战性的问题。网格技术用于在分布异构的资源间实现协作和共享,将数据挖掘技术运用于网格平台之上,为从大量分布的数据中获取有用的知识模式提供了有效的解决方案。但数据挖掘过程是一个涉及大量操作和数据的复杂过程,与网格平台相结合,无疑又增加了挖掘过程的复杂性。目前在数据挖掘技术的研究中,数据挖掘算法被作为一个独立的整体,以黑盒的方式出现在应用中,在这种情况下,数据挖掘执行过程对用户和执行环境是不可见的,这使得集中式环境中的数据挖掘算法不能根据分布式环境的特点动态的转化为分布式的数据挖掘过程,用户不能灵活的对数据挖掘执行过程进行控制。此外,访问数据挖掘服务与访问网格服务的接口相互独立给用户访问网格中的数据挖掘服务带来不便。这些因素都导致了数据挖掘技术在网格平台上不能有效的发挥其作用。正如实际的铁路货运应用系统中需要解决的问题:在铁路货运网格平台的基础上,如何充分利用分布的计算资源,对分布在各个铁路局的货运数据进行有效的深层次的挖掘以辅助决策。在本文提出的方法中,数据挖掘算法被分解成由细粒度数据挖掘操作组成的执行过程模型;在此基础之上,结合网格环境中数据资源和计算资源的分布情况,对模型进行优化,得到可以在网格中执行的分布式数据挖掘执行过程模型;然后,执行引擎将模型调度到各个网格节点执行;最后通过统一的、与网格平台相兼容的接口将数据挖掘结果提供给用户。本文在网格平台上,使用提出的方法实现了关联规则、序列模式、决策树分类器和朴素贝叶斯分类器等典型的数据挖掘执行过程模型的分解、优化与执行。本文的主要工作及创新点包括:·提出了由细粒度的数据挖掘操作组成的数据挖掘执行过程模型,用于描述数据挖掘算法的执行过程,将数据挖掘算法白盒化。通过该模型,用户、应用程序和执行环境能清晰的理解整个数据挖掘算法执行经过的中间步骤及各步骤产生的中间结果的信息。本文在集中式环境中,基于仿真数据对数据挖掘执行过程模型中的各个操作进行了实验评估,证明了数据挖掘执行过程模型能够将数据挖掘算法白盒化,将算法中各个步骤的执行情况展现出来。·设计了基于网格环境的数据挖掘执行过程模型的优化算法,用于将集中式执行过程模型转化为可在多个网格节点上并行执行的分布式执行过程模型,该优化算法采用从部分到整体逐层处理的方式,将整个优化过程分为数据具体化、全局优化和局部优化叁个子过程,在每个子过程中,根据数据挖掘操作的类型和数据分布的特征对操作依次进行优化。本文基于网格平台,使用仿真数据对分布式数据挖掘执行过程模型进行了实验,验证了分布式数据挖掘执行过程模型在响应时间和资源使用平衡方面优于集中式的处理方式。·设计了数据挖掘执行过程模型引擎,为分布式数据挖掘执行过程模型在网格平台上执行提供了运行环境,其中,设计了(a)基于网格环境的调度算法,用于将分布式数据挖掘执行过程模型以流程链为单位调度到各个网格节点执行;(b)基于WSRF规范实现的执行服务和控制服务。本文在网格平台上,使用仿真数据进行实验,分析了分布式数据挖掘执行过程模型在网格环境中使用引擎调度执行时,各个流程链调度执行的响应时间;并基于铁路货运网格实验平台和实际的货票数据,使用CART决策树分类器实现了铁路重点客户的预测。·设计了在网格环境中访问数据挖掘服务的接口规范WS-DAI-DM,其目的是使数据挖掘服务与基于OGSA体系架构的网格平台无缝融合,使用户能够像使用网格平台提供的其他服务一样来使用网格环境中的数据挖掘服务。本文通过实例说明了如何使用WS-DAI-DM接口规范,该规范已提交开放网格社区(Open Grid Forum)。最后,对全文做了总结,并对下一步研究工作做了展望。(本文来源于《北京交通大学》期刊2012-01-01)
郑世明,邵荣明,苗壮[10](2011)在《基于网格的数据挖掘体系结构》一文中研究指出由于现有的网格体系结构异常复杂,技术细节过于全面,因此,难以权衡其整体性能,大规模的资源共享和协同并不理想,难以满足高可用性、安全性和互操作性等要求。结合开放网格服务体系(OGSA)的思想,采用分层描述的方法,围绕功能、结构、调度成本和网格服务目标等,设计了一种五层的网格数据挖掘体系结构(GDMA)。该体系结构以服务为核心,通过统一的网格服务接口屏蔽资源的异构性,并针对用户的特殊需求,设计了基于工作流和W eb服务的数据挖掘客户端。(本文来源于《指挥信息系统与技术》期刊2011年05期)
数据挖掘网格论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
文章介绍了数据挖掘的概念和相关技术,详细阐述了使用CRISP-DM的数据挖掘方法论实践乌鲁木齐电信公司的网格化营销建设,已到达实现电信业务网格化、精确化的分析和营销。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
数据挖掘网格论文参考文献
[1].余新华.数据挖掘网格中决策树并行算法设计及性能分析[J].中国新通信.2018
[2].杨楠.数据挖掘在电信公司网格化营销中的应用[J].数码世界.2017
[3].冯婷婷,张继福.基于网格单元和P权值的离群数据挖掘方法[J].太原科技大学学报.2016
[4].冯婷婷.基于网格单元和P权值的离群数据挖掘及其并行化[D].太原科技大学.2016
[5].吕亚娟,翁苏湘,李莹.基于网格的临床医学数据挖掘技术的应用研究[J].科技创新导报.2015
[6].王越.基于数据挖掘技术的联通网格化营销系统的设计与实现[D].山东大学.2014
[7].谢冬.基于网格的数据挖掘体系结构[J].计算机光盘软件与应用.2013
[8].孔令信.数据挖掘网格中决策树并行算法设计及性能[J].才智.2012
[9].张燕.网格环境中数据挖掘执行过程模型的研究[D].北京交通大学.2012
[10].郑世明,邵荣明,苗壮.基于网格的数据挖掘体系结构[J].指挥信息系统与技术.2011