孤立点发现论文-陈旭,陈红平

孤立点发现论文-陈旭,陈红平

导读:本文包含了孤立点发现论文开题报告文献综述及选题提纲参考文献,主要关键词:孤立点,审计疑点,审计数据分析,Python语言

孤立点发现论文文献综述

陈旭,陈红平[1](2019)在《孤立点分析在审计疑点发现中的应用探讨——基于K-Means聚类算法的Python实现》一文中研究指出孤立点分析作为一种无监督方法,在结合具体审计业务选择适当审计指标的基础上,能够自主发现审计疑点。在自主学习并发现价值信息的过程中,孤立点分析方法既兼顾了对海量数据的总体分析,又可作为审计经验补充,辅助审计工作人员发现审计疑点,并实现疑点的精确定位。文章在分析孤立点研究现状及常用审计疑点发现方法的基础上,提出了基于孤立点分析的审计疑点发现方法,构建了基于孤立点分析的审计疑点发现框架,并尝试结合Y上市公司实际案例数据,利用Python语言实现建模分析,以探讨孤立点分析方法对于辅助审计疑点发现、提高审计工作效率的意义,为审计人员挖掘审计疑点提供了新思路。(本文来源于《会计之友》期刊2019年17期)

赖锦辉,梁松[2](2014)在《一种消除孤立点的微博热点话题发现方法》一文中研究指出微博具有数量多、字数少、话题广泛等特点,导致数据中孤立点较多,对微博热点话题聚类算法产生不利影响,为此,提出一种消除孤立点的微博热点话题发现方法。首先消除数据集中的孤立点,然后采用CURE(Clustering Using Representatives)算法对剩余有聚类价值的数据进行聚类,最后通过实例验证算法的有效性。结果表明,相对于对比聚类算法,该算法降低聚类结果对孤立点的敏感度,提高了微博热点话题发现的准确性,并提高了算法的运行效率,更适合应用于大规模的微博热点话题发现。(本文来源于《计算机应用与软件》期刊2014年01期)

刘巍[3](2010)在《基于聚类的孤立点发现技术研究及其在审计中的应用》一文中研究指出自上世纪90年代以来,计算机、网络、通讯技术得到了飞速发展,应用的领域在不断扩大,其影响力和生命力向社会的各个方面渗透和发展。信息化给审计工作带来的挑战正是源于经济管理领域的信息化。目前,国家机关、企事业单位的经济活动已经实现了信息化,特别是随着互联网的发展,电子商务和网络交易的产生,财务管理已经突破了空间的局限。审计对象和审计环境的巨大变化促使审计机关的工作方式必须与时俱进。计算机审计已向着网络化发展,实现了异地机构的财务收支活动以及在线审计核查。计算机审计是审计理论与实践发展的必然结果,具有手工审计不可比拟的优势。计算机审计最重要的一点就是计算机联网审计实施系统的建立,它的建立极大的提高了审计工作的质量和效率。具体到日常的审计工作,信息化带来的是海量的业务数据。审计人员面对海量数据时往往无从下手,人员的分配也没有目的性和计划性,为解决这些现实问题,我们引入了数据挖掘技术。现阶段,这一技术作为辅助审计工具极大的提高了审计人员对海量数据的驾驭能力。本文首先介绍了数据挖掘、聚类分析、孤立点分析、计算机联网审计技术,详细阐述了上述几种技术的概念、算法实现等,其次有重点的讨论了基于聚类的孤立点发现系统的设计,最后以某省某年的救灾资金数据为研究对象,对基于聚类的孤立点发现技术进行了实际应用研究。(本文来源于《中国海洋大学》期刊2010-05-30)

曹晖,司刚全,张彦斌,贾立新[4](2009)在《一种基于密度近邻的增量式孤立点发现算法》一文中研究指出为了解决数据集更新时孤立点增量发现问题,提出一种基于密度近邻的增量式孤立点发现算法.当数据集更新时,该算法在确定出受影响的对象后,根据对象和其近邻间k-密度变化,建立对象的密度近邻序列.然后依据对象的密度近邻序列代价和其k-距离邻域的平均密度近邻序列代价,计算出受影响对象的增量异常因子(IOF)来表征对象的孤立程度,从而提高增量孤立点发现的效果.此外,由于只需重新计算这些受影响对象的IOF值,该算法还提高孤立点发现的速度.实验表明,该算法不仅在孤立点增量发现的效果上高于以往算法且减少算法的运行时间.(本文来源于《模式识别与人工智能》期刊2009年06期)

汪加才,张金城,江效尧[5](2007)在《一种有效的可视化孤立点发现与预测新途径》一文中研究指出孤立点发现是数据挖掘活动的重要组成部分,被广泛应用于电子贸易、信用卡等领域的欺诈检测。由于优良的拓扑结构保持和概率分布保持特性,SOM(Self-Organizing Maps)可作为一种有效的降维工具供分析人员获取隐藏于数据中的分布结构信息。在分析了当前基于距离的孤立点发现的基础上,提出了一种基于SOM的孤立点发现与预测新途径,具有可扩展性、可预测性、交互性、简明性等特征。实验结果表明,基于SOM的孤立点发现与预测是有效的。(本文来源于《计算机科学》期刊2007年06期)

邵峰晶,孙仁诚,郭振波[6](2006)在《基于孤立点发现的彩色图像人脸边缘提取算法》一文中研究指出本文针对彩色人脸边缘提取问题,分析了运用孤立点分析方法进行彩色图像人脸边缘提取的可行性,给出并实现了基于孤立点分析的彩色人脸边缘提取算法——RGB-OEA。在此基础上,通过实例应用证明了算法的有效性。(本文来源于《计算机科学》期刊2006年09期)

陆声链[7](2005)在《孤立点挖掘及其内涵知识发现的研究与应用》一文中研究指出孤立点挖掘又称孤立点分析、异常检测、例外挖掘、小事件检测、挖掘极小类、偏差检测。孤立点可能是“脏数据”,也可能是与实际对应的有意义的事件。从知识发现的角度看,在某些应用里,那些很少发生的事件往往比经常发生的事件更有趣、也更有研究价值。因此,异常数据的检测和分析是一项重要且有意义的研究工作。本文的主要工作可以概括为以下五个方面:(1)从孤立点挖掘的现实意义、算法、应用领域、挖掘工具、算法的评价等各个方面对孤立点挖掘问题进行了综述。(2)针对基于距离的方法需要设置阈值的不足,本文提出了一个新的孤立点定义,通过对象与数据集中所有其它对象的距离之和来判别异常,从而有效解决了算法需要设置最近邻参数p 或者k 的问题。为提高算法的效率,设计了基于抽样的近似检测算法。真实数据集上的实验表明该定义与DB(p,d)孤立点定义有相同的结果,同时给出了数据对象在数据集中的孤立程度,降低了阈值设置对用户的要求。(3)对分类、多维数据中的局部异常检测问题进行了研究,基于属性值的频数差异性理论给出了一个新的异常定义,并提出了判断异常显着性的异常存在判别准则,实验结果表明,该判别准则可有效去除大量异常程度并不显着的对象。文章从检测结果的有趣性、与同类算法的比较、对提高分类准确率的贡献和检测小类的能力四个方面对算法的有效性进行了评价。(4)实现了一个异常检测实验平台SOD(Smart Outlier Detection),其中集成了所提出或改进的算法,为异常检测提供了一个分析工具。所提供的数据接口能够从多个外部数据源获取数据,增强了平台的实用性,现已集成到某高校的教务管理系统中进行测试。(5)结合教务管理系统的特点,探讨了在教务管理系统中使用异常检测的必要性,并就实际需求给出了应用实例。本文的研究目的是构建一个从真实数据中检测异常数据及发现其内涵知识的实验平台,主要包括有机结合的五个方面:消除阈值设置的基于距离和的近似算法;针对分类数据、高维数据的异常检测算法;为有效发现异常中的内涵知识的例外规则挖掘算法;针对子序列长度相等的静态时间序列数据中的异常挖掘算法;集成了以上几种算法的实验平台。异常检测的最终目的在于应用,本文对异常挖掘在教务管理系统中的应用进行了有益的探索。(本文来源于《广西师范大学》期刊2005-04-01)

邵峰晶,孙仁诚,于忠清[8](2003)在《基于单元的孤立点发现改进算法》一文中研究指出孤立点分析是数据挖掘的一项重要内容。本文针对基于单元的孤立点挖掘算法中边界处孤立点的误判问题,给出了数据空间的单元格划分及数据对象分配方法,定义了数据集边界阈值动态调整函数,提出了基于单元的孤立点挖掘算法的改进算法,在不增加原有算法时间复杂度的前提下,极大地减少了边界处孤立点的误判,通过实际应用证明了算法的有效性。(本文来源于《全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)》期刊2003-09-01)

孤立点发现论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

微博具有数量多、字数少、话题广泛等特点,导致数据中孤立点较多,对微博热点话题聚类算法产生不利影响,为此,提出一种消除孤立点的微博热点话题发现方法。首先消除数据集中的孤立点,然后采用CURE(Clustering Using Representatives)算法对剩余有聚类价值的数据进行聚类,最后通过实例验证算法的有效性。结果表明,相对于对比聚类算法,该算法降低聚类结果对孤立点的敏感度,提高了微博热点话题发现的准确性,并提高了算法的运行效率,更适合应用于大规模的微博热点话题发现。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

孤立点发现论文参考文献

[1].陈旭,陈红平.孤立点分析在审计疑点发现中的应用探讨——基于K-Means聚类算法的Python实现[J].会计之友.2019

[2].赖锦辉,梁松.一种消除孤立点的微博热点话题发现方法[J].计算机应用与软件.2014

[3].刘巍.基于聚类的孤立点发现技术研究及其在审计中的应用[D].中国海洋大学.2010

[4].曹晖,司刚全,张彦斌,贾立新.一种基于密度近邻的增量式孤立点发现算法[J].模式识别与人工智能.2009

[5].汪加才,张金城,江效尧.一种有效的可视化孤立点发现与预测新途径[J].计算机科学.2007

[6].邵峰晶,孙仁诚,郭振波.基于孤立点发现的彩色图像人脸边缘提取算法[J].计算机科学.2006

[7].陆声链.孤立点挖掘及其内涵知识发现的研究与应用[D].广西师范大学.2005

[8].邵峰晶,孙仁诚,于忠清.基于单元的孤立点发现改进算法[C].全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上).2003

标签:;  ;  ;  ;  

孤立点发现论文-陈旭,陈红平
下载Doc文档

猜你喜欢