导读:本文包含了最近邻方法论文开题报告文献综述及选题提纲参考文献,主要关键词:最近邻,k-最近邻,稀疏表示,重构
最近邻方法论文文献综述
宗鸣[1](2016)在《基于稀疏表示和决策树的最近邻方法研究》一文中研究指出分类问题是数据挖掘领域中最基本和最重要的问题之一,在计算机视觉、自然语言处理、生物特征识别和医学诊断等领域都有着广泛的应用。最近邻算法是一种常见的分类算法:给定一个测试样本,找出与它相似的训练样本进行比较来学习。k-最近邻方法(kNN)在训练样本集中找出最接近测试样本的k个邻居,然后根据它们分类。kNN作为一种经典的分类算法,是数据挖掘领域应用最广泛的分类算法之一,广泛应用于人脸识别、手写字符识别等各个领域。但kNN也有其不足的地方,对于kNN的改进一直是学者们研究的热点,其中kNN中k值的确定是一个公开性问题,本文重点研究了kNN中k值的选取问题,主要工作如下:1)kNN使用固定k值对于所有的测试样本都使用同样数目的训练样本来进行分类、预测等,这在实际情况中是不合理的。本文将稀疏表示引进kNN算法,提出CM-kNN算法,通过重构技术尝试性解决k值固定问题,即对于不同的测试样本,应该在训练样本空间中使用不同数目的训练样本对其进行分类,这样才更加符合实际情况。2)和经典kNN算法相比,CM-kNN准确率提升了很多,不过当样本数据量很大时,重构过程耗费时间过长。为此,本文引入决策树技术,提出kTree算法,通过建立决策树来避免重构这一过程,从而大大提高分类速度,同时可以保持和CM-kNN接近的分类准确率。3)在k Tree算法基础上,将决策树叶子结点附近的k个邻近样本及其最近邻样本考虑在内,提出k*Tree算法,在这个小范围内进行kNN分类,从而获得进一步的计算速度提升,同时也能保证和CM-kNN接近的准确率。(本文来源于《广西师范大学》期刊2016-04-01)
李乡儒,卢瑜,周建明,王永俊[2](2011)在《基于最近邻方法的类星体与正常星系光谱分类》一文中研究指出随着高质量CCD传感器技术的日渐成熟与广泛应用,以及许多大型巡天计划的相继实施,天体数据量极大,因此天体观测数据的自动识别、分析问题首当其冲。文章在原始测量空间使用最近邻方法(NN)研究了正常星系与类星体光谱的识别问题。正常星系和类星体属于河外天体,一般距离地球较远,其观测光谱会受到许多干扰,所以这两类天体光谱的分类在光谱自动识别研究中具有一定的代表性。同时,采用的NN是模式识别和数据挖掘方面的基准性方法,在许多新方法的评估中,往往以NN方法的性能作为比较对象。从实用价值来说,研究表明,NN方法的类星体和正常星系光谱识别率与文献中复杂方法的最好结果相当,但该文方法不需要进行分类器的训练,利于实时进行增量式学习和并行实现,这对海量光谱数据的快速处理有重要意义。因此,该研究具有重要的理论参考意义和一定的实用价值。(本文来源于《光谱学与光谱分析》期刊2011年09期)
邹鹏,章根龙,张海黎,闫中原[3](2010)在《基于最近邻方法的LFM信号识别初探》一文中研究指出在对LFM信号实现分选的基础上,选取待识信号的瞬时频率作为识别特征,利用最近邻方法对信号进行识别。实验结果表明,在一定的信噪比条件下能达到较理想的识别效果。该方法原理简单,运算量小,能够满足工程中实时性的要求。(本文来源于《舰船电子工程》期刊2010年06期)
朱曼龙[4](2010)在《最近邻方法在填充和分类中应用的新技术》一文中研究指出在当今互联网时代,海量信息处理已成为我国经济建设进程中的一个重大需求。最近邻方法是海量信息处理中最重要的理论与技术之一,运用已知的最邻近点估计或逼近问题的解,为海量信息计算与服务提供了简单、易理解、有效的理论和技术。本论文研究最近邻方法在缺失值填充与分类中应用的新技术和算法。首先,从缺失值填充和数据分类的应用角度对k最近邻算法进行研究,详细地阐述了k最近邻算法的基本原理,分析它的优缺点和一些常用的改进方法。在此基础上,本论文以获取更高的填充(分类)准确率为主要目标,针对k最近邻算法的某些缺点提出新的改进策略,并从理论和实验两方面验证策略的有效性。一方面,本论文研究最近邻填充的新理论与算法。针对k最近邻填充算法(kNNI)在缺失数据的k个最近邻的选择上可能存在偏好,提出一种新的缺失填充算法:象限近邻填充算法QENNI(是一种壳近邻填充算法),它仅仅使用缺失数据象限方向的最近邻来填充该缺失值,避免了kNNI中选取的k个最近邻点有偏好这一情况。进一步,本论文采用叁种可能的加权方法对壳近邻填充算法(SNI)[1,2]进行分析,通过实验总结出壳近邻填充中近邻数据重复选择有利于提高填充效果,而基于频率与距离加权方式的壳近邻填充算法fdwSNI具有最好的填充效果这一结论。关于缺失值填充,填充算法固然重要,但好的评价方式无疑能为算法的选择提供有效的指导。通过具体的实例分析,本论文指出常用的填充效果指标RMSE容易偏向严重的填充误差,并提出一种新的goodness评价方式。即使存在个别严重的填充误差,goodness仍然能得出理想的结论。另一方面,本论文建立一个壳近邻分类算法SNC,克服了kNN最近邻选择上可能存在偏好这一问题,该算法对距离度量不敏感,在大数据集上具有更好的分类效果。另外,在实际的数据挖掘应用中,面对的数据通常是质量差的或者不完全的,开发噪声鲁棒性较好的挖掘算法是一个具有实际应用价值的挑战性工作。噪声消除常常是困难且昻贵的,并且减少历史数据来换取信息的完备,会导致可分析的数据容量大量减少,造成资源的浪费,并丢弃了大量隐藏在这些数据中的信息。kNN是基于距离的局部最优的算法,忽略了部分或整体上的数据分布可能对分类结果的影响,会导致分类器对训练集中噪声数据的敏感性增大。本论文提出综合考虑k近邻、簇和训练集中的数据分布特性,建立一个新的分类算法,称为NCT,由于充分利用了局部、部分和全局叁方面的数据资源,该算法具有良好的噪声鲁棒性。实验结果表明,NCT算法不仅具有更好的分类效果,而且在噪声环境中具有良好的鲁棒性。在不含噪声的环境中,NCT算法稍微好于kNN;而在含噪声的环境中,NCT算法的分类准确率明显高于kNN算法,且噪声率越大,这种优势越显着。最后,对NCT算法引进的聚类信息和全局信息做其他形式的组合变型,通过实验证明在含噪声的环境中,无论用哪种组合方式加入新信息都有利于提高kNN算法的分类效果,而线性插值组合方式的NCT算法提高分类准确率的幅度最大。简言之,本论文的主要创新点可以概述如下:提出一种象限近邻填充算法QENNI,克服kNNI算法缺失数据的最近邻选择可能存在偏好;提出一种新的goodness缺失值填充评价方式,当个别数据存在严重填充误差时,goodness评价方式优于RMSE;构造一种新型的壳近邻分类算法SNC,克服了kNN算法最近邻选择上可能存在偏好这一问题,该算法对距离度量不敏感,在大数据集上具有更好分类效果;提出一种综合考虑k近邻、簇和训练集中的数据分布特性的NCT分类算法,有效增强对噪声的鲁棒性。为证明其有效性,本论文提出的算法均在真实数据集上进行大量的实验。实验结果表明,本论文提出的QENNI、SNC和NCT算法均优于k最近邻算法,特别NCT算法在噪声环境中分类效果的优势显着。(本文来源于《广西师范大学》期刊2010-04-01)
张健楠,赵永恒,刘蓉[5](2009)在《基于非参数回归与最近邻方法的恒星光谱自动分类》一文中研究指出恒星光谱数据的自动识别与分类是现代巡天望远镜所产生的海量光谱数据处理的一项重要研究内容。针对流量未定标的低分辨率恒星光谱设计了一种有效的自动分类方案,实现恒星光谱的MK分类:光谱型及其次型分类,光度型分类。该方案由叁部分实现:(1)连续谱归一化:基于小波技术提取低频信号逼近连续谱的方法;(2)七种光谱型及其次型的分类通过非参数回归方法实现。(3)光度型分类通过基于最近邻的χ2方法实现。实验结果表明该方案能够有效实现恒星光谱的MK分类,光谱型及其次型的分类精度为3.2个光谱次型,Ⅰ-Ⅴ光度型的正确识别率为60%,次优统计率为78%。该方案训练速度快,方法实现容易,适用于海量恒星光谱自动分类处理系统。(本文来源于《光谱学与光谱分析》期刊2009年12期)
孙小华,陈洪,孔繁胜[6](2006)在《在协同过滤中结合奇异值分解与最近邻方法》一文中研究指出协同过滤是一种减小信息过载的常用方法,但是它有叁方面的限制,即准确性、数据稀疏性和可扩展性。提出一种新的协同过滤算法来解决数据稀疏性的问题,利用奇异值分解法的结果来进行邻居选择,然后采用最近邻方法来得到未打分项目的预测值。在EachMovie数据库集上的试验结果表明该算法在数据稀疏时算法的准确性超过普通的Pearson算法和奇异值分解算法。(本文来源于《计算机应用研究》期刊2006年09期)
赵莹,高隽,汪荣贵,胡静[7](2004)在《一种新的广义最近邻方法研究》一文中研究指出本文在仿生模式识别理论的指导下 ,推广了传统的最邻近方法 ,提出一种新的广义最近邻方法 .该方法利用同类样本间的连续性规律 ,增加了样本点个数 .再通过由多个超球体的并所形成的几何形体 ,覆盖可能的样本点 .将这一方法用于人脸识别仿真实验 ,实验结果表明该方法是有效可行的 .(本文来源于《电子学报》期刊2004年S1期)
最近邻方法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着高质量CCD传感器技术的日渐成熟与广泛应用,以及许多大型巡天计划的相继实施,天体数据量极大,因此天体观测数据的自动识别、分析问题首当其冲。文章在原始测量空间使用最近邻方法(NN)研究了正常星系与类星体光谱的识别问题。正常星系和类星体属于河外天体,一般距离地球较远,其观测光谱会受到许多干扰,所以这两类天体光谱的分类在光谱自动识别研究中具有一定的代表性。同时,采用的NN是模式识别和数据挖掘方面的基准性方法,在许多新方法的评估中,往往以NN方法的性能作为比较对象。从实用价值来说,研究表明,NN方法的类星体和正常星系光谱识别率与文献中复杂方法的最好结果相当,但该文方法不需要进行分类器的训练,利于实时进行增量式学习和并行实现,这对海量光谱数据的快速处理有重要意义。因此,该研究具有重要的理论参考意义和一定的实用价值。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
最近邻方法论文参考文献
[1].宗鸣.基于稀疏表示和决策树的最近邻方法研究[D].广西师范大学.2016
[2].李乡儒,卢瑜,周建明,王永俊.基于最近邻方法的类星体与正常星系光谱分类[J].光谱学与光谱分析.2011
[3].邹鹏,章根龙,张海黎,闫中原.基于最近邻方法的LFM信号识别初探[J].舰船电子工程.2010
[4].朱曼龙.最近邻方法在填充和分类中应用的新技术[D].广西师范大学.2010
[5].张健楠,赵永恒,刘蓉.基于非参数回归与最近邻方法的恒星光谱自动分类[J].光谱学与光谱分析.2009
[6].孙小华,陈洪,孔繁胜.在协同过滤中结合奇异值分解与最近邻方法[J].计算机应用研究.2006
[7].赵莹,高隽,汪荣贵,胡静.一种新的广义最近邻方法研究[J].电子学报.2004