局部敏感哈希算法论文-童学杰,彭绪富

局部敏感哈希算法论文-童学杰,彭绪富

导读:本文包含了局部敏感哈希算法论文开题报告文献综述及选题提纲参考文献,主要关键词:局部敏感,哈希,LSH,Simhash

局部敏感哈希算法论文文献综述

童学杰,彭绪富[1](2019)在《局部敏感哈希算法的内容相似度比较》一文中研究指出局部敏感哈希(Locality Sensitive Hashing,LSH)算法,又称局部敏感散列算法,顾名思义,该算法产生的散列值是局部敏感的。对原始内容做微小的修改后,经过LSH算法生成的散列值的变化也是微小的,因此LSH生成的散列值是局部敏感的。这一特性可以运用在论文查重、网页比较、文本比较等需要比较内容相似度的场景上。该文着重研究LSH在文本比较上的实现(Simhash算法)。首先,对给定的文本做分词降噪和加权处理得到带权重的具有给定文本特征的词语,其次,使用哈希算法为每个词语生成对应的哈希值并根据各自的权重形成加权数字串,然后合并所有词语并降维,最后,通过使用海明距离(Hamming Distance)计算生成的两个Simhash的相似度。(本文来源于《电脑知识与技术》期刊2019年10期)

白亮,贾玉华,王昊冉,谢毓湘,于天元[2](2018)在《基于局部敏感哈希算法和神经网络学习的跨媒体检索方法》一文中研究指出为了提高跨媒体检索的效率,可行的方法是降低数据集中不相关内容的比例。采用局部敏感哈希算法将图像数据映射到汉明空间并利用神经网络学习将文本数据映射到汉明空间的哈希函数,提出一种可以显着提高数据集中相关文件比例的高效跨媒体检索方法。实验结果表明,提出的方法能够有效去除数据集中的不相关内容,相对于已有的跨媒体检索方法,其有效提高了检索效率与准确率。(本文来源于《国防科技大学学报》期刊2018年01期)

刘畅[3](2016)在《基于学习的分布式局部敏感哈希算法研究》一文中研究指出随着计算机网络技术的不断发展,网络中充斥着各种各样的海量高维数据,在此数据中搜索目标数据也随之变得耗时和低效。为解决上述问题,近似近邻搜索的概念及各种算法被陆续提出,并成为机器学习、数据挖掘、模式识别等多种应用中的一类基本算法,而局部敏感哈希算法被证明是解决高维空间近邻搜索的最有效算法之一。在处理大数据问题上,基于(key,value)的分布式结构被越来越广泛的采用,如经典的并行编程框架MapReduce、Twitter Storm和Spark等。结合(key,value)结构,对经典局部敏感哈希算法进行分布式化,是近期的研究热点。为了保证查询精度,需要建立大量的哈希表,这无疑将占用不少内存空间,尤其是在处理高维数据的场合。同时,在分布式背景下,由于哈希桶位于不同的节点,在不同的哈希桶进行查询就会产生多次网络调用,从而导致大量的网络传输。为了减少内存占用和网络调度费用,Layered LSH给出了采用0(1)个哈希表的分布式局部敏感哈希方案。不过,研究中发现会降低查询的精度。本文尝试设计了一种将学习算法应用在基于(key,value)的分布式结构,且在该索引基础上进行了基于MapReduce的空间近邻查询实现。本文的主要工作如下:(1)提出了查询精度更高的算法LB-LSH,改进了 Entropy LSH的分布式(key,value)模型。(2)类似于Layered LSH机制,LB-LSH在采用0(1)个哈希表的情况下保证了查询精度,大大减少了网络传输和频繁的I/O。(3)在Hadoop平台上实现了 LB-LSH,大量的实验结果显示,该算法优于当前所采用的一些哈希算法。(本文来源于《大连海事大学》期刊2016-06-01)

张一凡,余小清,安炫东,万旺根[4](2015)在《一种基于CUDA的局部敏感哈希算法》一文中研究指出传统的局部敏感哈希算法建立哈希表时往往需要较大的内存空间以及较长的建立时间.在查询阶段,查询样本K个最近邻数据项的所需时间超过整个运行时间的95%.针对这些问题,运用计算设备架构将局部敏感哈希算法移植至图形处理器,并用多线程并行计算数据项的哈希值来建立哈希表.查询阶段在全局内存中引入基于工作队列的多样本查询,以提高算法的运行效率.实验结果表明,所提出的算法与传统的局部敏感哈希算法相比,能在不降低运算精度的情况下将运算速度提高近12倍.(本文来源于《应用科学学报》期刊2015年05期)

曹玉东,刘艳洋,贾旭,王冬霞[5](2016)在《基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤》一文中研究指出提出一种快速的图像型垃圾邮件过滤方案,结合半监督机器学习技术改进局部敏感哈希(LSH)算法,基于改进的LSH算法构建垃圾图像特征库索引,提高图像的查找速度。搜集并构造了60 000个垃圾图像样本,实验结果表明,利用改进的LSH算法能有效地提高垃圾图像的过滤速度。(本文来源于《计算机应用研究》期刊2016年06期)

刘根平[6](2015)在《集中式环境下的局部敏感哈希算法综述》一文中研究指出局部敏感哈希算法是一种很流行的高维相似性查找算法。通过总结多篇已发表论文,介绍了集中式环境下的局部敏感哈希算法及其实现,分析了各种局部敏感哈希算法的特点和优缺点。在近似最近邻查询中的广泛应用证实了局部敏感哈希算法的有效性。(本文来源于《移动通信》期刊2015年10期)

史世泽[7](2013)在《局部敏感哈希算法的研究》一文中研究指出高维数据的近邻搜索是许多应用研究的一个基础问题,它需要依赖于有效的数据结构和算法。本文主要研究了局部敏感哈希算法并对其进行了改进。在本文中,我们首先阐述了局部敏感哈希算法的基本思想,并介绍了几个具体的局部敏感哈希算法:基于汉明距离的局部敏感哈希算法,基于P稳定分布的局部敏感哈希算法,多探寻的局部敏感哈希算法。注意到上述算法中回收数据的处理依赖于对数据的距离的计算和排序,这需要花费大量时间。针对此,本文提出了一种对于局部敏感哈希算法的改进方法,其主要思想是使用数据的出现次数来近似数据的距离,从而从回收数据中获得结果。在该算法中,我们在数据的回收过程中统计数据的出现次数,然后将数据按其出现次数分类,并按其出现次数的大小依次获得结果。最后,本文给出了两个评估局部敏感哈希算法的两个标准参数,并分别使用实际数据和模拟数据对算法进行了测试,证明了该方法能有效的减少算法的运行时间,提高算法的时间效率。(本文来源于《西安电子科技大学》期刊2013-03-01)

曹玉东,刘福英,蔡希彪[8](2013)在《基于局部敏感哈希算法的图像高维数据索引技术的研究》一文中研究指出局部敏感哈希(LSH)算法是有效的高维数据索引方法之一,该算法成功地解决了"维数灾难"问题。分析了LSH算法中主要参数对索引性能的影响,在规模不同的图像数据集上应用了LSH算法,实验结果表明选择合适的参数时,其性能接近顺序搜索方法。(本文来源于《辽宁工业大学学报(自然科学版)》期刊2013年01期)

何学文,张磊[9](2012)在《基于局部敏感哈希算法的语音文档主题分类》一文中研究指出对识别后的语音文档进行了向量空间模型的建立,针对得到的高维稀疏矩阵提出了基于局部敏感哈希的语音文档分类算法,算法能够直接在高维稀疏矩阵上进行分类,无需降维。此外,在构建局部敏感哈希函数的时候结合了稳定分布。实验证明,局部敏感哈希算法能够对语音文档进行合理有效的分类,同时获得了较小的时间复杂度。(本文来源于《大众科技》期刊2012年03期)

局部敏感哈希算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了提高跨媒体检索的效率,可行的方法是降低数据集中不相关内容的比例。采用局部敏感哈希算法将图像数据映射到汉明空间并利用神经网络学习将文本数据映射到汉明空间的哈希函数,提出一种可以显着提高数据集中相关文件比例的高效跨媒体检索方法。实验结果表明,提出的方法能够有效去除数据集中的不相关内容,相对于已有的跨媒体检索方法,其有效提高了检索效率与准确率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

局部敏感哈希算法论文参考文献

[1].童学杰,彭绪富.局部敏感哈希算法的内容相似度比较[J].电脑知识与技术.2019

[2].白亮,贾玉华,王昊冉,谢毓湘,于天元.基于局部敏感哈希算法和神经网络学习的跨媒体检索方法[J].国防科技大学学报.2018

[3].刘畅.基于学习的分布式局部敏感哈希算法研究[D].大连海事大学.2016

[4].张一凡,余小清,安炫东,万旺根.一种基于CUDA的局部敏感哈希算法[J].应用科学学报.2015

[5].曹玉东,刘艳洋,贾旭,王冬霞.基于改进的局部敏感哈希算法实现图像型垃圾邮件过滤[J].计算机应用研究.2016

[6].刘根平.集中式环境下的局部敏感哈希算法综述[J].移动通信.2015

[7].史世泽.局部敏感哈希算法的研究[D].西安电子科技大学.2013

[8].曹玉东,刘福英,蔡希彪.基于局部敏感哈希算法的图像高维数据索引技术的研究[J].辽宁工业大学学报(自然科学版).2013

[9].何学文,张磊.基于局部敏感哈希算法的语音文档主题分类[J].大众科技.2012

标签:;  ;  ;  ;  

局部敏感哈希算法论文-童学杰,彭绪富
下载Doc文档

猜你喜欢