邻近搜索论文-赵永国,陈奕奕,吴峻峰

邻近搜索论文-赵永国,陈奕奕,吴峻峰

导读:本文包含了邻近搜索论文开题报告文献综述及选题提纲参考文献,主要关键词:KANN算法,谱哈希,随机算法,矩阵逼近

邻近搜索论文文献综述

赵永国,陈奕奕,吴峻峰[1](2018)在《近似邻近搜索随机算法》一文中研究指出通过研究近似邻近查询算法,提出了一种基于随机化思想的KANN(K-approximate nearest-neighbor algorithm)算法,改进相似性搜索的速度和精度。算法在两个阶段采用了随机思想:一是在编码时,结合谱哈希算法和随机矩阵逼近法得到数据点的二进制编码。二是在查询时,为降低搜索时间成本,先对原数据集进行初次阈值筛选得到一个查询点的一个近似类别集。由于近似类别中存成对距离很小,采用基于距离搜索算法精度下降。本论文提出采用统计秩的思想,保留距离排序的信息,在近似类别的数据集进行多次抽样排序,得到k个近似邻居。本文提出的近似邻近检索框架采用多环节过滤数据,并控制搜索误差,在速度和精度上得到了改进。(本文来源于《科技通报》期刊2018年12期)

张海涛,周欢,张国楠[2](2018)在《基于空间邻近搜索的移动轨迹相对时间模式挖掘方法》一文中研究指出针对传统移动轨迹模式挖掘方法挖掘速度慢、占用最大内存大的问题,提出一种基于空间邻近搜索的移动轨迹相对时间模式挖掘方法。该方法包括5个阶段:1)对移动轨迹数据进行时空划分,并基于移动轨迹数据与时空格的匹配得到移动轨迹数据对应的时空格序列。2)扫描所有的时空格序列数据得到空间网格集合,并通过空间网格与时空格序列的包含运算得到所有的频繁空间网格。3)频繁空间网格转变为长度为1的频繁相对时间模式。4)基于空间邻近搜索的方式进行模式增长,得到以频繁空间网格为单元的候选相对时间模式,并通过相对时间模式与时空格序列的匹配运算,计算相对时间模式的支持度。5)基于设定的支持度阈值,得到所有频繁的相对时间模式。实验结果表明:所提方法由于采用了基于空间邻近搜索的方式进行模式扩展,大幅减小候选相对时间模式的搜索范围。与传统方法相比,所提方法具有挖掘速度快、占用最大内存少的优点。另外,方法在运行时间上具有更好的稳定性和可扩展性,而在占用最大内存上的稳定性与可扩展性与传统方法基本相近。该方法有助于移动轨迹模式挖掘方法提升挖掘速度、减少占用最大内存。(本文来源于《计算机应用》期刊2018年11期)

汤盛宇[3](2018)在《基于邻近搜索技术的快速密度聚类算法研究》一文中研究指出随着计算机技术和网络通信技术的高速发展,各种信息化和数字化技术与社会生活的方方面面联系的越来越紧密,无论是对我们的生产、生活还是工作和思维等都引发了巨大的影响,我们已经进入了大数据时代。面对海量数据,当前一个十分重要的课题就是如何能够将这些海量数据转化为由价值的信息。机器学习、数据挖掘技术在解决这类问题中发挥了日益重要的作用。聚类分析是机器学习研究的一个重要内容,目前已经被广泛应用于图像处理、推荐系统、医疗诊断等多个领域。聚类是一个无监督的过程,聚类算法的目的是将输入的数据集基于某种相似性度量准则划分为若干个语义一致的簇。DBSCAN是最为重要的一种基于密度的聚类算法,它不需要预先指定聚类个数,可以在含有噪声的数据中识别出复杂分布的聚类。虽然DBSCAN算法有很多的优势,但是其时间复杂度为O(n~2),无法高效的处理大规模高维数据。其根本原因在于DBSCAN在判断每个点是否为核心点时,需要对每个数据点做近邻搜索,而其中存在大量冗余计算。本文对造成DBSCAN冗余计算的根源进行了深度分析,并在总结前人工作的基础上,提出了基于邻近搜索技术的快速密度聚类算法(NQ-DBSCAN),有效提高了DBSCAN算法处理大规模高维数据的性能。本文主要包括以下几个方面的内容:(1)首先,对DBSCAN的优缺点进行了深入探究,总结出DBSCAN在近邻搜索中存在大量的冗余计算,造成了该算法复杂度过高,无法处理大规模数据。(2)其次,对于DBSCAN相关改进算法的改进思路和效果也进行了深入分析,如IDBSCAN、FDBSCAN、LSH-DBSCAN、STDBSCAN、Fast-DBSCAN和ρ-Approximate DBSCAN等,发现这些算法处理相对高维的数据时性能不够理想。(3)最后,对于DBSCAN聚类速度较慢的问题,提出了改进算法NQ-DBSCAN。该算法使用邻近搜索的思想,通过将部分满足条件的数据点直接标记为离群点或者核心点,过滤了大量的冗余近邻计算,从而加快了聚类速度。从理论上确定了邻近搜索的上限和下限,确保NQ-DBSCAN和DBSCAN有一致的聚类结果。通过在人工合成数据集和真实数据集上的实验表明,NQ-DBSCAN的算法效率有很大的提升,尤其对于高维数据,随着维度增加算法性能退化缓慢,且对带噪声数据适应性更好。(本文来源于《华侨大学》期刊2018-05-30)

赵龙飞,赵学胜,朱思坤,付瑞全[4](2018)在《一种球面退化四叉树格网的多层次邻近搜索算法》一文中研究指出格网单元的邻近搜索是聚类、索引、查询等空间操作的基础,但现有方法大都局限于单个剖分层次,无法直接满足全球多尺度数据集成查询和操作的应用需求。在球面退化四叉树格网(DQG)模型基础上,提出了一种基于多层次格网的邻近搜索算法。首先采用视点相关技术建立DQG格网的多层次模型,然后引入细分评价函数确定格网单元的邻近单元层次,设计并实现了一种相邻格网单元层次差不超过1的动态多层次格网单元邻近搜索算法,最后与单层次邻近搜索算法进行了对比实验。结果表明,搜索同一区域,该算法的耗时成本约为DQG单层次搜索算法的1/3(层次为11);将该算法用于全球地形实时可视化表达,平均刷新帧率达到60帧/s。(本文来源于《武汉大学学报(信息科学版)》期刊2018年04期)

梁志剑,周文娟[5](2016)在《一种改进的邻近粒子搜索算法》一文中研究指出为提高SPH方法中邻近粒子的搜索效率,采用条形Point-In-Box(PIB)搜索法和邻域区域相关搜索法交替执行机制,实现了一种邻近粒子融合搜索算法.实验中,分别用融合搜索法的SPH方法和条形PIB搜索法的SPH方法对溃坝现象进行了模拟,并对条形PIB搜索法、邻域相关搜索法和融合搜索法在搜索时间和准确率上进行了比较,证明了融合算法的可行性和高效性.(本文来源于《微电子学与计算机》期刊2016年11期)

黄昊,王结臣,陶伟东,苑振宇,杨柳[6](2013)在《规则格网内插中的J邻近点快速搜索算法》一文中研究指出引入KD-Tree的二维索引结构,提出一种基于优先队列的改进J邻近点搜索策略,针对规则格网内插中的固定点数和固定距离这两种搜索原则,分别设计其J邻近点搜索算法,并以反距离加权法为例实现了整个内插过程。实验表明,该算法具有较高的运行效率,并在大数据量的情况下性能更优。(本文来源于《地理与地理信息科学》期刊2013年06期)

江锦成,吴立新,孙文彬,杨宜舟[7](2013)在《点集V图-K阶邻近并行搜索算法设计与实验》一文中研究指出K阶邻近在空间层次聚类、空间邻近分析、DEM内插等方面有着广泛应用,然而传统的串行算法无法满足大规模数据集快速搜索K阶邻近的需求。该文在分析V图-K阶邻近串行搜索算法特点的基础上,提出了一种基于MPI的并行搜索算法——PVKN(Parallel Voronoi K-order Neighbors)算法,分别对V图构建和K阶邻近搜索进行并行化,并通过实验对算法进行测试。结果表明:当求解单源点目标的K阶邻近时,构建V图的时间远远大于搜索K阶邻近的用时,仅对构建V图过程进行并行化,即可获得良好的加速效果;当对多源点目标进行求解时,搜索K阶邻近的时间随着K阶数和源目标数的增加而增长,成为影响PVKN算法效率的主要因素,对K阶邻近搜索过程进行并行化,PVKN算法加速比可达5倍以上,能有效降低运行时间。(本文来源于《地理与地理信息科学》期刊2013年04期)

刘树勇,杨庆超,位秀雷,吴海平[8](2012)在《邻近点快速搜索方法在混沌识别中的应用》一文中研究指出针对混沌振动特征指数计算过程中,相空间轨道上邻近点方法计算量大、搜索效率低等问题,提出了一种改进邻近点快速搜索方法.首先应用kd树法分割样本空间并搜索重构吸引子上的邻域;然后根据吸引子的几何结构信息研究邻域的分布特点,剔除同一轨线上的邻点,得到能够真实反映轨道演化的有效点对.仿真结果表明改进的邻近点搜索方法能够有效地实现混沌吸引子上参考点邻域的搜索.(本文来源于《华中科技大学学报(自然科学版)》期刊2012年11期)

杨容浩,岑敏仪,张同刚,郑平元[9](2012)在《格网划分的最邻近点搜索方法》一文中研究指出为了提高迭代最近点(ICP)算法中最邻近点搜索的存储和计算效率,本文通过对盒子结构方法优、缺点的深入分析,提出了基于格网划分的最邻近点搜索方法。该方法充分考虑了3D点云获取时的投影特性,将点云投影到某一坐标平面,并基于格网划分进行存储,使最邻近点的搜索限制在较小的范围。不同类型的模拟数据和实测数据试验均表明,该方法能够在不损失匹配精度和拉入范围的前提下,显着提高存储和计算效率。(本文来源于《测绘科学》期刊2012年05期)

刘丹,陈捷捷[10](2012)在《基于CUDA的邻近粒子搜索算法研究》一文中研究指出在粒子方法中,运用邻近粒子搜索算法可以快速获取每个粒子的邻近粒子信息。由于粒子方法模拟一个体系的行为所采用的粒子数据是十分庞大的,对计算机的运算速度提出了挑战。研究了GPU的计算能力和CUDA开发环境,利用GPU的并行多线程处理技术,提出了一种并行邻近粒子搜索算法。实验结果表明,基于CUDA的并行邻近粒子搜索算法,加快了邻近粒子搜索过程,显着地减少了计算时间,成功实现了硬件加速,可获取290以上的加速比,对大规模粒子系统呈现出高效的处理能力。(本文来源于《计算机工程与应用》期刊2012年18期)

邻近搜索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对传统移动轨迹模式挖掘方法挖掘速度慢、占用最大内存大的问题,提出一种基于空间邻近搜索的移动轨迹相对时间模式挖掘方法。该方法包括5个阶段:1)对移动轨迹数据进行时空划分,并基于移动轨迹数据与时空格的匹配得到移动轨迹数据对应的时空格序列。2)扫描所有的时空格序列数据得到空间网格集合,并通过空间网格与时空格序列的包含运算得到所有的频繁空间网格。3)频繁空间网格转变为长度为1的频繁相对时间模式。4)基于空间邻近搜索的方式进行模式增长,得到以频繁空间网格为单元的候选相对时间模式,并通过相对时间模式与时空格序列的匹配运算,计算相对时间模式的支持度。5)基于设定的支持度阈值,得到所有频繁的相对时间模式。实验结果表明:所提方法由于采用了基于空间邻近搜索的方式进行模式扩展,大幅减小候选相对时间模式的搜索范围。与传统方法相比,所提方法具有挖掘速度快、占用最大内存少的优点。另外,方法在运行时间上具有更好的稳定性和可扩展性,而在占用最大内存上的稳定性与可扩展性与传统方法基本相近。该方法有助于移动轨迹模式挖掘方法提升挖掘速度、减少占用最大内存。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

邻近搜索论文参考文献

[1].赵永国,陈奕奕,吴峻峰.近似邻近搜索随机算法[J].科技通报.2018

[2].张海涛,周欢,张国楠.基于空间邻近搜索的移动轨迹相对时间模式挖掘方法[J].计算机应用.2018

[3].汤盛宇.基于邻近搜索技术的快速密度聚类算法研究[D].华侨大学.2018

[4].赵龙飞,赵学胜,朱思坤,付瑞全.一种球面退化四叉树格网的多层次邻近搜索算法[J].武汉大学学报(信息科学版).2018

[5].梁志剑,周文娟.一种改进的邻近粒子搜索算法[J].微电子学与计算机.2016

[6].黄昊,王结臣,陶伟东,苑振宇,杨柳.规则格网内插中的J邻近点快速搜索算法[J].地理与地理信息科学.2013

[7].江锦成,吴立新,孙文彬,杨宜舟.点集V图-K阶邻近并行搜索算法设计与实验[J].地理与地理信息科学.2013

[8].刘树勇,杨庆超,位秀雷,吴海平.邻近点快速搜索方法在混沌识别中的应用[J].华中科技大学学报(自然科学版).2012

[9].杨容浩,岑敏仪,张同刚,郑平元.格网划分的最邻近点搜索方法[J].测绘科学.2012

[10].刘丹,陈捷捷.基于CUDA的邻近粒子搜索算法研究[J].计算机工程与应用.2012

标签:;  ;  ;  ;  

邻近搜索论文-赵永国,陈奕奕,吴峻峰
下载Doc文档

猜你喜欢