音乐哼唱检索论文-吴娟

导读:本文包含了音乐哼唱检索论文开题报告文献综述及选题提纲参考文献，主要关键词:指纹,哼唱检索,语谱图,局部敏感哈希

音乐哼唱检索论文文献综述

吴娟^[1]（2015）在《基于数字指纹的音乐哼唱检索系统的设计与实现》一文中研究指出随着互联网的发展和多媒体压缩技术的进步,数字音乐开始大量涌现。在这种情况下,音乐检索变成了海量数据检索。传统的音乐检索方式是基于人工标注的关键词进行的,需要用户记住关键信息。当用户记不住关键信息又想搜索歌曲的时候,这种检索方式就不能满足用户的需求,所以需要一种新的检索方式来解决这个问题。哼唱检索是一种基于内容的检索方式,不需要对音乐加入其他信息进行检索,而是根据音乐本身的特征,如音调、旋律等信息进行检索。通过这种方式,用户只需要哼唱一小段的音乐,就能检索出想要的歌曲。它为用户提供了一种更为自然的检索方式,在移动平台上有非常好的应用前景。本文对哼唱检索技术和哼唱检索系统进行了研究,主要研究工作包括以下几个方面：1)实现了基于小波变换的的音频指纹提取算法基于小波变换的音频指纹提取算法的流程是将音频信号转化成语谱图,然后根据小波变换能够在时域和频域都能较好的表示图片信息的特点,用小波变换对语谱图进行一系列处理,最后通过降维算法得到更精简的指纹。本文首次将此算法应用于哼唱检索系统当中,当哼唱质量较高时,检出率可以达到90%以上。2)实现并改进了基于局部敏感哈希(Locality Sensitive Hashing, LSH)的音频指纹检索匹配算法基于LSH的音频指纹检索算法是目前最流行的高维快速检索算法。本文在此算法的步骤中添加了一个二次投票的过程,当参数组合适当时,系统的检索率优于未改进的系统。3)设计并实现了哼唱检索系统哼唱检索系统主要分为两个部分,一个是建立音乐指纹数据库的部分,一个是哼唱片段的检索匹配的部分。本文根据哼唱检索系统的总体流程,将系统功能分为音频录入、检索、数据建立、信息返回四部分。系统的整体架构采用MVC模式。本文按照系统的设计,结合音频指纹提取和检索匹配两个算法,实现了WEB版和Android版的哼唱检索系统。这个系统能够有效地完成哼唱片段的录制、上传和检索。(本文来源于《湖南师范大学》期刊2015-05-01）

匡竹青^[2]（2015）在《基于音乐分类的哼唱检索研究》一文中研究指出哼唱检索是从音乐本质特征出发的一种基于内容的音乐检索方式。用户可以不用记住音乐名、音乐的演唱者、作曲家以及词曲家等一系列繁杂的信息,只需要能够哼唱出某个音乐片段的旋律即可。本文提出了一种新的哼唱检索方法,即基于音乐分类的哼唱检索。该方法的主要思想是:系统预先将音乐库中的音乐分成固定的几类,并对每类音乐集训练和建立其各自的隐马尔可夫模型。接着,在检索时,根据哼唱信号的物理特征,基于已经训练好的HMM,对其进行分类。最后,提取已经分类好的哼唱信号的旋律特征,与其对应类别的音乐特征库中的旋律特征序列进行旋律匹配。将相似度比较高的几个作为结果返回。基于本文提出的音乐分类哼唱检索研究的需要,本文主要做了以下四个工作:1)对哼唱信号的预处理工作进行了研究。确定了要对哼唱信号进行预滤波、采样量化、预加重以及加窗分帧四个工作。2)对音乐信号特征提取与选择进行了研究。研究了音乐的物理特征和感知特征,以及它们的提取方法,以及确定了音乐信号的分类特征和旋律特征。本文将信号的短时平均能量、短时过零率、Mel倒谱系数等物理特征作为分类特征,信号的音高和音值两个感知特征作为旋律特征。3)对基于隐马尔可夫模型的音乐分类进行了研究。使用了隐马尔可夫模型作为音乐分类的模型,对哼唱信号进行了分类。4)对基于隐马尔可夫模型和动态时间规整的旋律匹配算法进行了研究。分析了两种算法的基本原理,确定了系统所使用的旋律匹配算法。为了证明本文提出方法的有效性,主要进行了两个对比实验,其一就是基于HMM的哼唱检索实验与基于音乐分类和HMM的哼唱检索实验的对比;另一个就是基于动态时间规整(DTW)算法的哼唱检索实验与基于音乐分类和DTW的哼唱检索实验的对比。通过对比实验结果的分析,可以得知本文提出的基于音乐分类的哼唱检索方法在一定程度上能缩短了平均检索时间,提高检索速度。(本文来源于《重庆大学》期刊2015-04-01）

曹亮^[3]（2014）在《海量音乐的哼唱检索研究》一文中研究指出音频检索是基于内容的检索领域中发展起来的研究新热点。作为音乐检索的一个分支,哼唱检索为用户提供了一种全新的检索方式。但是,由于哼唱音频可能含有背景噪声,以及哼唱音频在音高、节奏上与目标歌曲音频有很大差距。所以,设计合理的海量音乐的哼唱检索系统,是一个很有价值的研究课题。本文的主要工作包括：1.提出了一种新的基于深度学习的哼唱检索系统。哼唱检索有两个关键问题：其一是旋律特征不稳定。本文中使用深度置信网络对旋律特征进行处理,来解决这一问题。其二是旋律特征的模糊匹配。本文中通过对旋律特征聚类,从而实现近邻检索。具体来讲,在建立歌曲数据库阶段,系统先对歌曲提取旋律特征,再对其进行聚类；之后,用聚类结果作为标签,训练深度置信网络模型；然后,使用深度置信网络进行特征变换并建立索引。在在线检索阶段,系统提取哼唱音频的旋律特征,根据索引找到对应聚类,将该聚类的歌曲库旋律就作为候选集,最后对候选排序并返回结果。实验证明,相比传统的基于局部敏感哈希的检索系统,本文的哼唱检索系统缓解了特征不稳定的问题,提高了检索精度。2.设计了一种海量音乐下的哼唱检索系统针对海量哼唱检索歌曲库,本文采用分布式建立索引和并行检索解决索引庞大和并发查询的问题。具体来讲,本文提出了对海量音乐哼唱检索系统的设计方法,并进行了分析。为了存放大规模的索引,系统采用分布式建立索引的方法。为了处理并发查询请求,系统采用并行检索的策略。实验证明,本文设计的海量音乐检索系统在保持检索精度稳定的情况下,提高了检索速度,分布式索引易于进行歌曲数据库的扩展。(本文来源于《北京邮电大学》期刊2014-10-17）

周翔^[4]（2014）在《基于E2LSH的音乐哼唱检索系统的研究》一文中研究指出在基于内容的检索领域中,音频检索是新发展起来的研究热点。音乐哼唱检索是基于内容的音频检索的一个分支,它提供了一种新颖、方便的音乐检索方法,当人们遗忘了歌曲的歌名等信息时,用户可以通过哼唱一段旋律的方式,在大型歌曲数据库中快速寻找到目标歌曲,这种检索方式给用户带来了简单、直观、方便的音乐检索体验。本文分析了当今基于哼唱的音乐检索系统中的一些技术,对旋律特征表示方法、旋律特征提取算法、旋律匹配算法进行了讨论和研究。现今的哼唱检索系统大都忽略了检索速度的问题,本文针对这个问题,将基于精确欧氏距离位置敏感哈希的相似性检索技术应用到哼唱检索中,构建一个快速的音乐哼唱检索系统。本文主要做了以下几个方面工作:1.对哼唱检索系统基础进行了分析。在了解哼唱检索系统结构的基础上,分别研究了旋律特征表示方法以及相关语音信号处理技术,研究了使用MIDI文件建立旋律模板库,研究了旋律特征的提取技术,包括基音周期预估、平滑处理和音符切分,其中,对比了几种基音周期预估算法,YIN的性能较好,然后对旋律匹配过程中音高偏移问题和音长伸缩问题进行分析讨论。2.对旋律匹配技术进行研究。本文对比了线性伸缩(LS),动态时间规整(DTW)和土堆移动距离(EMD)叁种旋律匹配算法的性能,针对旋律匹配,对DTW算法进行了动态阈值偏移约束的改进,形成了检索速度较快的改进型DTW(IDTW)。综合EMD与IDTW各自的优点,本文提出了一种旋律匹配算法EMD-IDTW,该方法匹配准确率较高且检索速度较快。3.针对现今哼唱检索系统检索速度慢、需要穷举匹配的问题,本文研究了基于精确欧氏位置敏感哈希(E2LSH)的相似性快速检索技术,对E2LSH及其哈希函数进行了理论分析,将E2LSH检索技术应用到哼唱检索系统中,建立了基于pitch向量的E2LSH索引结构,利用该索引结构进行第一层检索,加快了系统检索速度。本文结合EMD-IDTW匹配算法,提出了Pitch-E2LSH+EMD-IDTW旋律匹配方法。最后本文构建了基于E2LSH的音乐哼唱检索系统,该系统在保证检索准确率的情况下,大大提高了检索速度。(本文来源于《电子科技大学》期刊2014-03-01）

叶飞^[5]（2013）在《基于旋律的音乐哼唱检索系统的设计与实现》一文中研究指出音乐作为人们生活中必不可少的一部分,音乐搜索具有广大的用户群体,也蕴含着巨大的商机。传统的音乐搜索是根据用户输入的关键词进行搜索,关键词可以是歌曲的名称,歌手名,歌词等,这种方式被称为基于文本的检索。对于这种方式的检索,如果用户不能准确地记住歌曲的相关信息(歌曲名称,歌词等),就不能准确的检索歌曲。同时,采用这种检索方式需要手动去维护一个音乐数据库,对每首歌曲的基本信息进行标注,增加了管理者的工作量,因此需要找到一种更简单,更快捷的检索方式。哼唱检索便是一种新型的检索方式,它充分利用歌曲自身的特征,如音高,音长等特征,为用户提供一种更简单更自然的检索方式。这种新型的检索方式可以广泛地应用在移动互联网,卡拉OK中,也可以应用于音乐教育等方面。哼唱检索最核心的两部分是音乐旋律特征提取和匹配。如何准确的提取歌曲的特征信息,利用特征信息描述歌曲轮廓；采用哪种匹配算法又快又准确的检索出我们所需要的歌曲是本文的研究重点。围绕这两个问题,本文做了如下相关研究和探索。(1)综合分析了音乐的各种特征,介绍了常见的几种基音提取的算法。包括自相关函数法,平均幅度差函数法等。同时为了使基音的提取更加准确,本文介绍了常用的预处理操作和后期处理操作。总结了当前音乐旋律特征的表示方式,最后确定了本文中采用绝对音高序列来描述音乐特征。(2)介绍了常用的几种旋律匹配算法,包括欧氏距离,编辑距离,DTW算法等。确定了本文中采用LS算法和DTW算法来进行旋律的匹配操作。首先采用LS算法粗略过滤掉一部分差异比较大的候选项,然后利用DTW算法进行二级过滤,完成精确匹配。充分发挥LS算法在时间上的优势和DTW算法在效率上的优势。(3)本文中采用台湾清华大学资讯工程系张智星老师提供的48首MIDI音乐,采用midtoolbox工具提取MIDI音乐的音乐特征,搭建了一个小型的哼唱检索音乐数据库。并在此基础上开发一个哼唱检索系统。本文研究成果的特色之处在于：(1)设计了基于能量的过滤和平滑处理两种后期处理方式,使提取到的基频更加准确。(2)开发了一个批量提取MIDI音乐音高特征的工具,采用此工具可以很方便的提取MIDI音乐文件中的音乐信息,构建一个音乐特征数据库。(3)综合采用LS算法和DTW算法进行旋律匹配,充分发挥两种算法的优势。同时,本文分析了提高系统执行效率的几种方式并简单介绍了GPU和CUDA,分析了使用CUDA来加速MATLAB执行速度的可行性和具体的操作流程。(本文来源于《华中师范大学》期刊2013-05-01）

向毅,钟育彬^[6]（2012）在《基于模糊聚类的音乐哼唱检索的研究与实现》一文中研究指出针对哼唱检索中匹配过程的耗时性和哼唱的非完全准确性,提出了并行模糊动态时间规整算法实现音乐的哼唱检索。采用相对音高差表示旋律,用动态时间规整算法实现哼唱音高差序列与目标音高差序列的近似匹配。在匹配过程中,引入模糊集合及模糊聚类,通过构造哼唱音高差与目标音高差之间的隶属函数并计算隶属度得到音高差信息的相似度,进而获得转换代价矩阵,最后得到两个匹配序列的匹配距离。为提高检索速度,引入并行算法实现匹配过程。实验结果表明,模糊方法的引入提高了检索精度,并行算法的运用明显缩短了检索时间。基于并行模糊动态时间规整算法的音乐哼唱检索的正确率达到72%左右,在双核计算机上进行实验,引入并行算法后检索时间缩短一半。(本文来源于《江南大学学报(自然科学版)》期刊2012年03期）

周旭^[7]（2012）在《哼唱检索系统在音乐播放器中的研究与实现》一文中研究指出目前伴随着多媒体技术的飞速发展,再加上网络的快速普及,大数据量的音乐搜索、定位成为了人们迫切需要解决的难题。哼唱检索正是研究从大量音乐数据中准确便捷定位所搜索的音乐,渐渐的成为一个热门的研究课题。目前我们常用的是基于文本的音乐检索,这种检索只能通过输入歌曲名或演唱者名等信息进行检索。随着音乐数据量的增加和人们追求便捷生活观念的加强,基文本的音乐检索方式很有局限性,假如不知道歌曲名或者演唱者名就无从查起了。但是基于内容的音乐检索就能解决这个问题,它可以使用户通过哼唱歌曲片段的形式来检索所需歌曲,不需要歌曲名或演唱者名等文本信息,需要用户做的仅仅是把他能记住的歌曲的部分片断哼唱出来就可以了。这种新型的音乐检索方式,对于音乐检索有着革命性的现实意义,它代表了音乐所独有的基本的特征,也受到了人工智能研究者和广大音乐爱好者的强烈关注。本文首先将MIDI格式音乐转化为WAV格式音乐。分析WAV格式的音频,并提取音频中的旋律等信息。利用基频提取算法和端点检测方法对哼唱查询片段和标准数据库中的音乐进行旋律提取和截取,并对得到的音频的旋律用N-Gram字符串匹配算法进行近似匹配,得到近似匹配的相似度,按照相似度由高到低返回近似匹配结果,然后再用相似度大小采用DTW进行细匹配。本文按照哼唱检索的处理的基本思路,首先研究与分析了哼唱检索的相关理论知识和相关音乐音频处理技术,在哼唱音乐和标准音乐旋律特征的提取上,根据它们各自的特点,采用了不同的端点检测的方法截取音乐段落,并且综合使用了音高特征和节奏特征的音乐旋律特征提取方法。该方法能够较准确和快速地返回给哼唱用户检索信息。最后,在对目前的音乐检索匹配算法研究与比较下,采用了一种改进的分层式并加入端点检测的音乐检索匹配算法-基于N-Gram字符串匹配和句子长度的DTW音乐检索匹配算法。(本文来源于《内蒙古大学》期刊2012-05-30）

王小凤,耿国华,孙霞,张翔^[8]（2009）在《一个以句为单位的音乐哼唱检索算法》一文中研究指出本文针对音乐自身的特征提出一个以句为单位的音乐哼唱检索算法,并将其应用到音乐检索系统中。基于内容的音乐检索首先提取代表音乐旋律的特征串,然后进行匹配检索。一般匹配算法是对目标特征串和待检索特征串依次进行字符串匹配,当数据库中歌曲数目很大时,这样检索浪费时间。此时建立索引可以提高检索速度,但音乐信息不同于文本信息,没有固定的短语可以用来作为索引关键字。现有音乐索引方面也有很多研究,但都没有考虑音乐的特点,即音乐是以句为单位的。本文分析音乐数据特征——每句音乐的旋律波动和句子长度都是固定的,基于此提出一个应用这两个特征的以句为单位的分层检索算法。实验结果证明,本算法的检索前7位成功率为80%。(本文来源于《第18届全国多媒体学术会议（NCMT2009）、第5届全国人机交互学术会议（CHCI2009）、第5届全国普适计算学术会议（PCC2009）论文集》期刊2009-10-29）

刘怡,郝云飞^[9]（2009）在《大型音乐哼唱检索系统中的近似匹配算法及性能评测》一文中研究指出研究了大型音乐哼唱检索系统中采用的近似匹配算法的性能问题,为了支持对于多种近似匹配算法的比较研究,开发了一个独立于算法的测试平台.所研究的基本算法包括后缀树、隐马尔科夫模型(HMM)、编辑距离、动态时间规整(DTW)和单侧连续匹配(OSCM)方法,用于测试的音乐数据库包括72000首音乐片段.通过构造1500个不同类型错误的查询方法,对其中3类方法算法进行了大量实验,分析评价了它们的性能.实验结果表明,基于单侧连续匹配的算法不仅查询速度快,而且在用户哼唱只包含与旋律轮廓方向相同的错误时,查询的准确率是100%,在用户哼唱包含两个以内与旋律轮廓方向相反的错误时,前10位的命中率也在90%左右,是适用于大型哼唱检索系统的查询算法.图11,表1,参8.(本文来源于《湖南科技大学学报(自然科学版)》期刊2009年01期）

张晶,周明全,耿国华,王小凤^[10]（2008）在《音乐哼唱检索技术在WEB上的应用》一文中研究指出将基于内容的哼唱检索技术用于WEB上。首先阐述了音乐检索现状,并对基于内容的音乐检索过程进行了详细地分析,然后介绍了WEB的相关技术,提出了将音乐检索技术用于WEB的思路,最后对全文归纳总结,并对进一步的工作进行了展望。(本文来源于《计算机应用与软件》期刊2008年12期）

音乐哼唱检索论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

哼唱检索是从音乐本质特征出发的一种基于内容的音乐检索方式。用户可以不用记住音乐名、音乐的演唱者、作曲家以及词曲家等一系列繁杂的信息,只需要能够哼唱出某个音乐片段的旋律即可。本文提出了一种新的哼唱检索方法,即基于音乐分类的哼唱检索。该方法的主要思想是:系统预先将音乐库中的音乐分成固定的几类,并对每类音乐集训练和建立其各自的隐马尔可夫模型。接着,在检索时,根据哼唱信号的物理特征,基于已经训练好的HMM,对其进行分类。最后,提取已经分类好的哼唱信号的旋律特征,与其对应类别的音乐特征库中的旋律特征序列进行旋律匹配。将相似度比较高的几个作为结果返回。基于本文提出的音乐分类哼唱检索研究的需要,本文主要做了以下四个工作:1)对哼唱信号的预处理工作进行了研究。确定了要对哼唱信号进行预滤波、采样量化、预加重以及加窗分帧四个工作。2)对音乐信号特征提取与选择进行了研究。研究了音乐的物理特征和感知特征,以及它们的提取方法,以及确定了音乐信号的分类特征和旋律特征。本文将信号的短时平均能量、短时过零率、Mel倒谱系数等物理特征作为分类特征,信号的音高和音值两个感知特征作为旋律特征。3)对基于隐马尔可夫模型的音乐分类进行了研究。使用了隐马尔可夫模型作为音乐分类的模型,对哼唱信号进行了分类。4)对基于隐马尔可夫模型和动态时间规整的旋律匹配算法进行了研究。分析了两种算法的基本原理,确定了系统所使用的旋律匹配算法。为了证明本文提出方法的有效性,主要进行了两个对比实验,其一就是基于HMM的哼唱检索实验与基于音乐分类和HMM的哼唱检索实验的对比;另一个就是基于动态时间规整(DTW)算法的哼唱检索实验与基于音乐分类和DTW的哼唱检索实验的对比。通过对比实验结果的分析,可以得知本文提出的基于音乐分类的哼唱检索方法在一定程度上能缩短了平均检索时间,提高检索速度。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

音乐哼唱检索论文参考文献

[1].吴娟.基于数字指纹的音乐哼唱检索系统的设计与实现[D].湖南师范大学.2015

[2].匡竹青.基于音乐分类的哼唱检索研究[D].重庆大学.2015

[3].曹亮.海量音乐的哼唱检索研究[D].北京邮电大学.2014

[4].周翔.基于E2LSH的音乐哼唱检索系统的研究[D].电子科技大学.2014

[5].叶飞.基于旋律的音乐哼唱检索系统的设计与实现[D].华中师范大学.2013

[6].向毅,钟育彬.基于模糊聚类的音乐哼唱检索的研究与实现[J].江南大学学报(自然科学版).2012

[7].周旭.哼唱检索系统在音乐播放器中的研究与实现[D].内蒙古大学.2012

[8].王小凤,耿国华,孙霞,张翔.一个以句为单位的音乐哼唱检索算法[C].第18届全国多媒体学术会议（NCMT2009）、第5届全国人机交互学术会议（CHCI2009）、第5届全国普适计算学术会议（PCC2009）论文集.2009

[9].刘怡,郝云飞.大型音乐哼唱检索系统中的近似匹配算法及性能评测[J].湖南科技大学学报(自然科学版).2009

[10].张晶,周明全,耿国华,王小凤.音乐哼唱检索技术在WEB上的应用[J].计算机应用与软件.2008

标签：指纹; 哼唱检索; 语谱图; 局部敏感哈希;

音乐哼唱检索论文-吴娟

音乐哼唱检索论文文献综述

音乐哼唱检索论文开题报告

音乐哼唱检索论文参考文献

猜你喜欢