导读:本文包含了异常点挖掘论文开题报告文献综述及选题提纲参考文献,主要关键词:中药,红外光谱图,特征峰异常点,快速挖掘
异常点挖掘论文文献综述
孙扬波,周婷[1](2019)在《中药近红外光谱图特征峰异常点快速挖掘仿真》一文中研究指出由于中药不同部位及不同产地的成分各有差异,传统挖掘方法进行光谱图特征峰异常点挖掘过程中,存在着抗干扰能力差、准确率较低等问题,提出中药近红外光谱图特征峰异常点快速挖掘方法。对红外光谱图固定窗口的像素点灰度值进行排序,并利用滤波结果确定出红外光谱图特征。利用红外光谱图特征确定出特征点集,根据数据点集构建出二维决策图并建成聚类中心,根据聚类中心确定特征峰异常点。仿真证明,所提方法实现了对大面积干扰的抑制,改善了现有异常点挖掘方法用于中药近红外光谱图异常检测的性能。(本文来源于《计算机仿真》期刊2019年08期)
徐晓丹[2](2018)在《复杂高维数据中异常点挖掘算法研究》一文中研究指出为了分析当前高维数据中各类异常点检测算法的性能,采用8个典型数据集,对10种代表性算法在这些数据集上进行了详细的实验分析,给出了不同算法在算法精度、ROC曲线面积及运行时间上的分析比较.实验结果表明:受到数据集分布及属性相关性的影响,同一算法在不同数据集上的效果有很大差异性,基于近邻排序的算法在各个数据集中的结果相对稳定,但其结果受k值的影响较大;和其他算法相比,基于集成的算法效果较好,但用于集成的有效算法选择较为困难.(本文来源于《浙江师范大学学报(自然科学版)》期刊2018年02期)
戴楠[3](2017)在《基于邻居关系的数据库异常点挖掘方法研究与实现》一文中研究指出近年来,随着数据库存储技术、计算机科学技术和数据采集技术高速发展,数据库中都积累了大量的原始数据。所以,如何从大量的数据中快速并且准确的提取出有价值的信息是目前计算机科学领域的一个研究热点。数据挖掘就是提取有效知识的技术。因此,数据库异常点挖掘指的是从含有大量数据的数据库中,通过某些特殊方法来发现具有高价值的知识或信息的过程。主要进行了对数据点邻居关系进行了研究,研究了一种基于邻居关系的数据库异常点挖掘方法NLOF(Neighbor-Local Outlier Factor)。该方法与传统的基于密度的异常点挖掘方法相比,在精度与时间花费都有所改进。该方法主要的改进方面有以下几点:(1)提出一种基于邻居关系的网格山脊点过滤方法对数据进行预处理;(2)采用信息熵对数据进行维度简约和对属性进行权值化;(3)根据网格的邻居关系对数据点邻域查询进行优化,降低数据点找寻邻域的计算量。对方法进行了实验验证。实验采用了人工合成数据、葡萄酒质量数据集和UCI(University of California,Irvine)的成人数据。实验结果表明该方法相对于LOF(Local Outlier Factor)方法,其检验效率和精度都有所提高。(本文来源于《南京理工大学》期刊2017-12-01)
江晨阳[4](2016)在《双线性时间序列模型的多变点估计及多个异常点挖掘》一文中研究指出在时间序列分析中,双线性模型的研究越来越重要,这是基于双线性模型能够很好拟合现实中许多非线性现象。其中,变点估计和异常点检测是双线性模型研究中的两个主要研究问题。本文分别采用贝叶斯方法和小波方法对含有多个变点和不同类型的异常点(单个异常点和成片异常点)的双线性模型进行检测。针对双线性时间序列模型里的变点估计和异常点检测问题,本文首先采用贝叶斯方法解决:针对变点估计问题,我们把多个变点当成多个随机变量,运用贝叶斯方法对这些变点进行估计;针对异常点检测问题,本文采用标准Gibbs抽样检测单个异常点,自适应Gibbs抽样检测成片异常点。针对同一问题,本文还提出了一种基于小波变换的双线性模型变点估计和异常点检测方法。一方面,针对变点估计问题,我们对序列进行多尺度小波分解,每个尺度相当于一层,在每一层找到多个变点,再把它们映射到原序列中,得到变点估计;另一方面,针对异常点检测问题,本文基于小波模极大值的相关理论,采用小波模极大值法检测序列的异常点。最后,本文通过模拟试验,验证了两种检测方法的可行性。通过对贝叶斯方法与小波变换两种方法的比较,本文发现如下结论:贝叶斯方法都更为精确,并能得到异常点的影响大小;小波方法在满足一定的准确率上所需的运行时间远远小于贝叶斯方法。(本文来源于《东南大学》期刊2016-02-24)
陈鹏,胡啸峰,林艳[5](2015)在《孤立点挖掘在警情时间序列异常点识别中的应用》一文中研究指出针对北京市的警情时间序列中存在的一些异常特征,采用了一种基于距离和的孤立点挖掘方法来进行分析。该方法将警情在每日不同时段内的分布处理为相应的属性,然后将警情的时段属性进行标准化,计算了不同点之间的欧式距离和来判断点的异常性。结果发现,北京的警情异常现象出现在春节和年底期间,其中前者表现为由于居民燃放烟花爆竹所引起的火灾事故和治安纠纷;而后者则表现为电信诈骗案的高发。与基于日接警数量的异常点分析相比,基于距离和的异常点挖掘能够有效地将警情在时序分布中隐藏的一些异常聚集效应识别出来,从而为公安部门开展预警和情报信息服务提供帮助。(本文来源于《科学技术与工程》期刊2015年07期)
黄重阳,刘造,王玉兰,刘朝阳[6](2014)在《基于统计全相关谱的代谢组NMR数据异常点挖掘的研究》一文中研究指出代谢组数据异常是指某机体的代谢组型与相同作用下其他机体的代谢组型不一致。异常点可能干扰研究结果判断,亦有可能含有重要的生物学信息,对其进行检测与分析是代谢组数据挖掘的基本任务之一。目前的处理方式是认为主成分分析得分图上的离聚类比较远的点为"异常点"。此方法有一定的主观性、挖掘过程需反复进行并且所得结果难以解释。本研究首次将统计全相关谱(STOCSY,Statistical Total Correlation Spectroscopy)的方法推广应用(本文来源于《第十八届全国波谱学学术年会论文集》期刊2014-10-10)
张洋[7](2012)在《一种基于热计量数据的异常点挖掘算法研究》一文中研究指出随着我国“集中供暖、分户计量”供热体制改革的推广,热表物联网的规模越来越大,家家户户也将不再按面积缴纳热费,而是通过热计量的方式,用多少热掏多少钱。这一体制的推广虽然从某种程度上体现出了用热公平,但是大量热表的使用,难免会出现表损坏、用户盗热、IC卡欺骗等情况。同时,热网规模的不断扩大也使得系统数据库中积累了大量的历史数据与临时数据。因此,如果能够通过数据挖掘技术来发现热网中的一些异常情形将会有十分重要的意义。首先,根据本文热计量数据异常点挖掘的主题,提出了基于WSN与GPRS技术的远程热表数据采集系统的框架,并针对该框架,重点设计了WSN数据采集模块的通信协议、GPRS数据传输模块的通信指令以及远程数据包的解析格式等。然后,以SQL Server2005数据库软件为工具,详细阐述了热表信息数据仓库的设计以及数据的抽取、转换、加载过程。其次,针对热计量数据高维的特性,提出了本文的核心算法:R-HOT算法(基于粗糙超图的高维异常点挖掘算法),该算法包括叁个主要阶段:第一,利用本文提出的基于粗糙超图的频繁项集挖掘算法挖掘重要关联规则,然后将数据仓库中的n条热表记录看作超图中的n个顶点,将重要关联规则看作超边,并利用给出的公式计算超边的权重,最后形成热网超图。第二,利用GRASP算法(基于贪心随机自适应的搜索过程)进行超图分割。第叁,利用给出的异常点的概念进行异常点测试。最后,结合热表信息数据仓库的模型,对热表远程监控收费管理系统中采集的一些实际的数据进行实验,验证了R-HOT算法的可行性。(本文来源于《燕山大学》期刊2012-08-01)
赵伯夷[8](2011)在《基于神经网络的异常点挖掘》一文中研究指出近年来,社会的飞速发展,伴随而来的就是大量的数据的产生。对于这些海量的数据,人们希望能过其中的大部分数据找出某些规律来指导人们日常的行为。在这个过程中,人们大多数情况下都认为只有那些大量相似的数据才会包含某种重要信息,从未忽略了某些少数样例。然而,正是这些被人们认为无用的数据可能包含着人们没有发现的更重要的信息。正是由于这个原因,人们提出了异常点挖掘算法。异常点挖掘又被称为离群点分析、异常检测,是数据挖掘技术的一个重要方面。目前,已经有很多种异常点挖掘算法被人们提出,最被人们熟知的有基于距离的和基于密度的挖掘算法。但是两种算法都具有一些不足之处,它们不适用于一些高维数据。本文提出了一种基于神经网络的异常点挖掘算法,该算法利用神经网络来对数据进行分类,再结合信息熵来判断数据是否为异常点,避免了其它异常点挖掘算法的一些不足之处。最后,在一些数据集上进行了试验,并对结果进行了分析。实验结果表明,该算法可以有效的发现数据中的异常点。(本文来源于《河北大学》期刊2011-05-01)
周欢,孙易木[9](2009)在《异常点挖掘在证券业的应用研究》一文中研究指出异常点挖掘是数据挖掘的一项功能,现有的文献较多关注于算法及其改进方面,而对于异常点挖掘过程以及如何将异常点挖掘应用于证券业缺乏深入研究。本文针对上述两个问题展开探讨,提出异常点挖掘的生命周期模型并给出该模型在证券业的应用案例,为应用的研究提供参考。(本文来源于《商业时代》期刊2009年13期)
张重生,冯海军,陈红,梁思维,李翠平[10](2008)在《一种分布式数据集上top-n异常点挖掘的高效算法》一文中研究指出异常点挖掘是一种从数据中分析并发现潜在的反常对象的数据挖掘技术,它在实际生活中有很多的应用,如入侵检测、金融数据分析、病症数据分析等.异常点挖掘具体技术与所研究的数据类型和数据环境有密切关系,已有研究大多是假定数据是集中分布在一张单表上的,而实际应用中很多数据是分布式的.分析了水平分布的数据集上异常点挖掘的问题,并提出了一个改进的基于Birch的分布式数据集中上top-n异常点挖掘的算法MOD.MOD首先在各分支节点上提取聚类特征概要信息,并将其发送到查询节点.查询节点同步地构造特征向量树CF-tree,并使用K-Means算法对CF-tree的叶节点聚类生成微聚类.通过估量微聚类的异常值的范围,能够排除大量的不包含top-n异常点的微聚类,最后对剩余的候选微聚类中的对象做具体异常值计算.模拟实验验证了MOD能够避免大量数据的传输和集中,在不太影响检测结果的准确度的前提下,能够较好地提高异常点挖掘的效率.(本文来源于《第二十五届中国数据库学术会议论文集(二)》期刊2008-10-24)
异常点挖掘论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为了分析当前高维数据中各类异常点检测算法的性能,采用8个典型数据集,对10种代表性算法在这些数据集上进行了详细的实验分析,给出了不同算法在算法精度、ROC曲线面积及运行时间上的分析比较.实验结果表明:受到数据集分布及属性相关性的影响,同一算法在不同数据集上的效果有很大差异性,基于近邻排序的算法在各个数据集中的结果相对稳定,但其结果受k值的影响较大;和其他算法相比,基于集成的算法效果较好,但用于集成的有效算法选择较为困难.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
异常点挖掘论文参考文献
[1].孙扬波,周婷.中药近红外光谱图特征峰异常点快速挖掘仿真[J].计算机仿真.2019
[2].徐晓丹.复杂高维数据中异常点挖掘算法研究[J].浙江师范大学学报(自然科学版).2018
[3].戴楠.基于邻居关系的数据库异常点挖掘方法研究与实现[D].南京理工大学.2017
[4].江晨阳.双线性时间序列模型的多变点估计及多个异常点挖掘[D].东南大学.2016
[5].陈鹏,胡啸峰,林艳.孤立点挖掘在警情时间序列异常点识别中的应用[J].科学技术与工程.2015
[6].黄重阳,刘造,王玉兰,刘朝阳.基于统计全相关谱的代谢组NMR数据异常点挖掘的研究[C].第十八届全国波谱学学术年会论文集.2014
[7].张洋.一种基于热计量数据的异常点挖掘算法研究[D].燕山大学.2012
[8].赵伯夷.基于神经网络的异常点挖掘[D].河北大学.2011
[9].周欢,孙易木.异常点挖掘在证券业的应用研究[J].商业时代.2009
[10].张重生,冯海军,陈红,梁思维,李翠平.一种分布式数据集上top-n异常点挖掘的高效算法[C].第二十五届中国数据库学术会议论文集(二).2008