导读:本文包含了异常点检测论文开题报告文献综述及选题提纲参考文献,主要关键词:集成学习,异常点检测,无监督
异常点检测论文文献综述
张志平[1](2019)在《基于集成方法的异常点检测》一文中研究指出在大数据时代,基于机器学习的异常点(Outlier)检测被广泛应用在抗网络攻击、检测信用欺诈等方面,已引起工业界的普遍重视。不同于传统的分类和聚类问题,异常点检测需要面临严重数据失衡问题。为了解决这一问题,笔者提出了集成多种机器学习技术检测异常点的方法,并通过实验证明了方法的有效性。(本文来源于《信息与电脑(理论版)》期刊2019年20期)
商明菊,胡尧,周江娥[2](2019)在《基于改进递归小波变换的交通流异常点与变点检测算法》一文中研究指出为准确界定交通流状态,辅助交通管理者对交通异常事件进行及时处理,提出了一种基于改进递归小波变换的异常点与变点快速检测算法,并将其应用于交通流实时监控与预警。首先,对历史交通流序列建立自回归模型,将残差序列的标准化有效分数向量作为统计量,利用3-Sigma原则,提出为统计量差分时序设定监控阈值的方法,实现了交通流状态的实时预警。其次,利用改进递归小波变换统计量,结合小波复合信息并综合考虑真实变点与估计变点之间的差异,选取小波变换特征频率与最优搜索长度,快速检测并估计交通流异常点与变点,实现了交通流状态的在线监控。最后,仿真试验和实例分析验证了算法的合理性与可行性。研究结果表明:设定的阈值对交通流变化趋势掌控明显,能够对交通异常状态进行及时预警;结合特征频率的复小波变换信息,能够有效检测并区分交通流异常点与变点;与基于有效分数向量的传统变点检测算法相比,算法的检测性能在延迟与收敛性两方面均有明显改善。该算法能够对交通流状态进行在线监控,这将为断面车流实时预警提供支持。(本文来源于《公路交通科技》期刊2019年08期)
叶朱兵[3](2019)在《基于SVM技术的网络异常点检测模型的研究》一文中研究指出随着我国互联网规模的不断扩大,网络通信模式和网络服务也日益复杂,数据种类的增多和数据来源的多元化都不同程度地提高了网络的运维工作难度。以往对于网络异常点的检测工作多采用被动的统计检测技术,其不足指出较多,迫切需要改进。该文提出将网络性能指标作为监测对象,从而实现快速查找和定位异常点的目标,构建了基于同点时间序列的网络性能模型,并采用SVM技术完成了对异常点的分析判断任务,显着提高了网络异常点的检出率和识别速度,具有较好的应用前景。(本文来源于《电脑知识与技术》期刊2019年21期)
曹鹏,马婕,施展华[4](2019)在《针对浮动车异常数据的增强型在线异常点检测算法》一文中研究指出在智能交通系统(ITS)中,为了从浮动车数据中获取准确动态的交通信息,需要实时识别并剔除异常数据。为了检测异常浮动车数据,本文提出一种独特的增强型在线非监督离群点检测算法(EOSA)。该算法由SS算法和K-means聚类算法组成,其中,SS算法可采用基于离散变量和连续变量的概率模型来计算异常分值,将K-means聚类算法与SS算法相结合可以有效提高检测精度。本文采用了深圳市浮动车数据来验证EOSA算法,试验结果表明,该算法能够成功检测到异常的数据,其中包含车辆停放和停车等待时的异常GPS记录。此外,通过试验比较,本文提出的EOSA算法比现有六种常用算法都具有更高的异常数据检测精度。EOSA算法有望应用于基于浮动车数据的智能交通系统。(本文来源于《交通运输工程与信息学报》期刊2019年02期)
刘嘉诚,王爽,刘伟华,胡炳梁[5](2019)在《显着性权重RX高光谱异常点检测》一文中研究指出高光谱图像异常点检测中,传统RX异常点检测算法忽略了空间相关性,背景估计不准确。本文提出了一种基于图像局部邻域光谱显着性分析的加权RX算法。该算法通过引入图像显着性分析,对基于概率密度为权重的图像背景建模进行改进,建立光谱显着性权重图,重新定义RX算法中的均值向量和协方差矩阵,并给不同的目标赋予不同的权值,达到优化背景估计的目的。利用合成高光谱数据和真实高光谱数据进行异常点检测实验,结果表明,对于同一组数据,本文算法检测到的异常点数比传统算法多,虚警率较低,有效地提高了检测率。(本文来源于《遥感学报》期刊2019年03期)
罗斌[6](2019)在《基于多次抽样和维度熵的异常点检测算法研究》一文中研究指出异常点是与数据集中大多数数据不同的、不一致的和具有足够大偏差的数据实例。异常点检测的主要任务是检测数据集中的异常数据实例,可以用于找出某些反常现象和异常行为,有着十分重要的研究意义。当前,异常点检测技术已经在各种社会生产和生活领域中提供关键的、可操作的信息,并产生了许多代表性的应用,例如信用卡欺诈检测、医疗诊断、环境监控、基因序列研究等。目前学术界已经提出了许多异常点检测算法,通常可以分为五大类,即基于统计模型的方法、基于距离的检测方法、基于密度的检测方法、基于子空间的检测方法和基于集成学习的检测方法。本文概述了上述五类异常点检测算法,分析了它们各自的优点以及存在的不足之处,介绍了一些常用的异常点检测算法和两种主流的评价方法平均精度以及AUC值,并提出了两种新的异常点检测算法。1)基于多次抽样的最近邻异常点检测算法MS-1NN:随着近年数据容量和维度的增加,对异常点检测算法的运行速度、检测效果和稳定性都提出了更高的要求,传统的基于k-近邻搜索方法难以兼顾,基于一次抽样的方法随机因素较大,算法效果不够稳定。鉴于这些问题,本文提出了一种基于多次抽样的最近邻异常点检测算法MS-1NN,并且将该算法与LOF、SOD等算法进行了对比实验,验证了该算法只需要很小的训练模型,使用默认参数就能在多数数据集中取得较好的检测效果,较快的运行速度,以及较为稳定的检测结果。2)基于维度熵的改进孤立森林异常点检测算法E-iForest:异常点检测是数据挖掘领域中一个重要并且基础的研究任务。在众多异常检测方法中,iForest算法时间复杂度低、检测效果好,在面对大容量高维数据时具有更好的适应性。但是,iForest算法不适用于特别高维数据,对噪声维度鲁棒性不够强,且运行结果稳定性不足。鉴于这些问题,本文提出了一种基于维度熵的改进孤立森林异常点检测算法E-iForest。该算法通过引入信息熵作为选择隔离属性和隔离点的依据,并且以此为基础改进路径长度计算,进行异常检测。通过实验验证了E-iForest算法在运行效率、检测效果、稳定性和对噪声维度的鲁棒性方面均有较好的表现,尤其在面对大容量数据集时表现出色。(本文来源于《江西理工大学》期刊2019-05-23)
戴楠,严悍,卓勤政,马玲玲[7](2019)在《基于网格山脊点的异常点检测》一文中研究指出LOF(Local Outlier Factor)算法是目前比较实用且效果比较良好的异常点检测算法之一,但是该算法在处理大规模的数据集时,往往会耗费巨大的时间和空间。目前基于网格的异常点检测算法虽然一定情况下降低了算法的时间和空间的耗费,但是时间和空间的耗费依然比较大。对此论文提出一种基于网格山脊点的异常检测算法。该算法先根据数据分布情况划分成空间网格单元,然后计算各个网格山脊点的高度,挑选出网格山脊点低的区域。最后对山脊点低的区域进行LOF算法检测。实验结果表明,相对于目前的基于网格的异常点检测算法,该算法的执行效率显着提高。(本文来源于《计算机与数字工程》期刊2019年05期)
李春生,于澍,刘小刚[8](2019)在《基于改进距离和的异常点检测算法研究》一文中研究指出为了降低原始数据中的勘误影响,提高数据质量,深入分析了常用的基于距离的异常点检测算法,提出了一种新的基于改进距离的异常点检测算法,舍去了传统算法中对DB(d,p)参数的设置。首先,为了解决终端的不确定性选择属性困难的问题,引入了"属性隶属度"的概念,简化了检测属性的选择方式;其次,为了解决由于数据分布不均匀而导致的检测准确率较低的问题,改进了常用的距离度量,并采用改进的加权距离进行计算,得到距离矩阵,通过分析计算距离的总值,给出了一种异常评价方法用来判断异常点的异常程度;最后,以股票交易数据进行实验,与传统基于距离和的检测算法进行比较,结果表明该改进算法在异常点检测的准确度方面具有明显的改善。(本文来源于《计算机技术与发展》期刊2019年03期)
王丝丝,张敬磊,王建兴,陈慈,马春杰[9](2018)在《基于改进群智能K-means优化算法的侵犯性驾驶行为异常点检测》一文中研究指出如何有效地检测侵犯性驾驶行为异常数据,避免它们对后续建模分析产生不利影响是研究的焦点。在综述侵犯性驾驶行为研究现状基础上,借助驾驶模拟仿真实验系统和Ergo LAB人因系统进行侵犯性驾驶实验;并通过不同传感器获取了驾驶行为人车环境高维数据,最后采用优化的K-means聚类算法对该高维数据进行聚类和异常值检测。结果表明,最佳聚类数为2;并有效输出了异常点检测结果,为下一步的侵犯性驾驶行为定量分析提供了优质的数据保证。(本文来源于《科学技术与工程》期刊2018年34期)
胡淼,王开军,李海超,陈黎飞[10](2018)在《模糊树节点的随机森林与异常点检测》一文中研究指出提出一种模糊树节点的随机森林算法进行异常点检测.在构建随机森林的分类决策树过程中,把模糊方法引入到二叉决策树的节点中,在节点中设计关于类别划分的模糊区域,在模糊区域上设计正常与异常隶属度函数.当某样本通过决策树节点的模糊区域时,若该样本的异常隶属度大于正常隶属度,则该样本被判别为异常类;否则,该样本进入决策树的下层树节点,若无下层节点则被判别为正常类.该样本的最终类别由随机森林算法中的投票步骤决定.在四个UCI数据集上的实验结果表明,在异常点检测的综合性能(召回率、精度和准确率)上,与基于随机森林的异常点检测算法RFV和RFP相比,新方法不仅具有较高的综合性能且性能稳定,还具有与一类支持向量机相当的性能,其部分实验结果优于一类支持向量机.(本文来源于《南京大学学报(自然科学)》期刊2018年06期)
异常点检测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为准确界定交通流状态,辅助交通管理者对交通异常事件进行及时处理,提出了一种基于改进递归小波变换的异常点与变点快速检测算法,并将其应用于交通流实时监控与预警。首先,对历史交通流序列建立自回归模型,将残差序列的标准化有效分数向量作为统计量,利用3-Sigma原则,提出为统计量差分时序设定监控阈值的方法,实现了交通流状态的实时预警。其次,利用改进递归小波变换统计量,结合小波复合信息并综合考虑真实变点与估计变点之间的差异,选取小波变换特征频率与最优搜索长度,快速检测并估计交通流异常点与变点,实现了交通流状态的在线监控。最后,仿真试验和实例分析验证了算法的合理性与可行性。研究结果表明:设定的阈值对交通流变化趋势掌控明显,能够对交通异常状态进行及时预警;结合特征频率的复小波变换信息,能够有效检测并区分交通流异常点与变点;与基于有效分数向量的传统变点检测算法相比,算法的检测性能在延迟与收敛性两方面均有明显改善。该算法能够对交通流状态进行在线监控,这将为断面车流实时预警提供支持。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
异常点检测论文参考文献
[1].张志平.基于集成方法的异常点检测[J].信息与电脑(理论版).2019
[2].商明菊,胡尧,周江娥.基于改进递归小波变换的交通流异常点与变点检测算法[J].公路交通科技.2019
[3].叶朱兵.基于SVM技术的网络异常点检测模型的研究[J].电脑知识与技术.2019
[4].曹鹏,马婕,施展华.针对浮动车异常数据的增强型在线异常点检测算法[J].交通运输工程与信息学报.2019
[5].刘嘉诚,王爽,刘伟华,胡炳梁.显着性权重RX高光谱异常点检测[J].遥感学报.2019
[6].罗斌.基于多次抽样和维度熵的异常点检测算法研究[D].江西理工大学.2019
[7].戴楠,严悍,卓勤政,马玲玲.基于网格山脊点的异常点检测[J].计算机与数字工程.2019
[8].李春生,于澍,刘小刚.基于改进距离和的异常点检测算法研究[J].计算机技术与发展.2019
[9].王丝丝,张敬磊,王建兴,陈慈,马春杰.基于改进群智能K-means优化算法的侵犯性驾驶行为异常点检测[J].科学技术与工程.2018
[10].胡淼,王开军,李海超,陈黎飞.模糊树节点的随机森林与异常点检测[J].南京大学学报(自然科学).2018