导读:本文包含了主旋律提取论文开题报告文献综述及选题提纲参考文献,主要关键词:主旋律,音符切分,维特比算法,基频判别模型
主旋律提取论文文献综述
陆雄,夏秀渝,蔡良,孙文慧[1](2019)在《声乐主旋律的自动提取》一文中研究指出提出一种基于多候选基频提取和歌声基频判别的声乐主旋律提取算法。该算法可以有效降低旋律定位虚警率,提高整体准确率。利用度量距离(DIS)算法对音乐进行音符切分,并用方差法实现浊音段检测;采用幅度压缩基音估计滤波器(PEFAC)多基频提取技术,通过计算音高显着度提取每个浊音帧的多个候选基频。最后用维特比算法跟踪浊音段主导基频轨迹,并用基频判别模型进行歌声主旋律判别。在MIR-1K数据集上进行的实验表明,在信干比为5d B和0d B的情况下,本文算法提取的声乐主旋律整体准确率分别达到了86.22%和77.4%,相比于其他算法至少提高了3.79%和2.01%。(本文来源于《太赫兹科学与电子信息学报》期刊2019年03期)
张维维[2](2019)在《音乐主旋律提取与多音高估计方法研究》一文中研究指出音乐信息检索包括音乐内容分析、音乐风格分类、哼唱识别、音乐推荐等内容,近年来在网络音乐、移动终端、消费电子、游戏娱乐等领域得到了广泛应用。主旋律提取与多音高估计是音乐信息检索领域的重要课题,国内外对此进行了研究,取得了重要成果,但在性能上还无法满足实际需要,有许多问题有待深入研究解决。本文应用欧几里得算法、贝叶斯滤波、动态规划、时频分析等技术,对主旋律提取和多音高估计方法进行了深入研究,所做的主要创新工作如下:(1)低音伴奏、特殊歌唱技巧以及某些乐器的固有特性会导致基频丢失,此时难以用基频跟踪技术提取音乐主旋律。为此,本文将计算两个自然数最大公约数的欧几里得算法推广到浮点数域,提出了改进欧几里得算法。然后,将其用于旋律音高候选估计,提出了基于改进欧几里得算法的主旋律提取方法。该方法用短时傅里叶变换和瞬时频率进行音乐混合信号正弦估计,并基于谱峰频率对,用改进欧几里得算法计算每帧的多个候选音高估计,再根据音高轮廓时长和连续性特征得到旋律音高序列。该方法不依赖于基频分量就能进行音高估计。进一步,针对同一音符持续时间内音高估计值有时剧烈跳变的问题,提出了改进欧几里得算法和动态规划相结合的主旋律提取方法。该方法用改进欧几里得算法估计每帧多个候选音高,用动态规划算法迭代求解描述主旋律音高的目标函数,以获得平滑的旋律音高轮廓,大幅度减少旋律轮廓的短时剧烈跳变。实验结果表明,该方法在基频丢失时能有效地估计主旋律音高,且避免了旋律音高序列的短时剧烈跳变。(2)鉴于随时间演进的主旋律音高具有时序相关性,本文用贝叶斯理论对音乐主旋律提取建模,并用粒子滤波获得其有效近似解,提出了基于粒子滤波和动态规划的主旋律提取方法。该方法在粒子滤波阶段,用Logistic分布描述音高转移概率,基于音高显着性、谱平滑性和音色相似性构建似然函数,用粒子滤波递推估计旋律音高序列的后验概率密度,以获得旋律轮廓粗估计。在动态规划阶段,先对旋律轮廓粗估计结果进行平滑,得到帧级旋律音高动态范围,然后用动态规划算法迭代求解描述主旋律音高的目标函数,从而得到最终的旋律音高序列。该方法不需要先验信息,两阶段策略既缩小了旋律音高搜索范围,又大幅度降低了动态规划计算量。实验结果表明,该方法具有较高的旋律提取准确率。(3)音乐信号中部分乐音分量存在谐波重迭,导致多音高估计时常产生漏检和误检问题。为此,本文定义了伪二维谱,推导出相关性质,在此基础上,提出一种基于伪二维谱的多音高估计方法。该方法用伪二维变换,将一维音乐信号映射到二维频率平面上;然后,计算伪二维幅度谱与二维谐波模板的互相关函数,实现二维模式匹配,得到音高初估计;最后,借助邻近帧估计结果去除异常值,并用音高直方图对剩余音高进行筛选和补充,从而得到精确的帧级多音高估计结果。该方法能有效地区分和声导致的重迭谐波分量,且计算量较小。实验结果表明,与现有方法相比,该方法的音高估计精确率与召回率较高。(本文来源于《大连理工大学》期刊2019-01-07)
张维维,陈喆,殷福亮[3](2018)在《结合改进欧几里得算法和动态规划的音乐主旋律提取》一文中研究指出主旋律提取是音乐信息检索领域一项基础而重要的研究课题,由于音乐信号固有的复杂性,使该项研究仍具有较大的挑战。为了更精确地描述旋律显着度并防止同一音符持续时间范围内旋律轮廓出现跳变,本文提出了基于改进欧几里得算法和动态规划的主旋律提取方法。该方法先用改进的欧几里得算法估计每帧的候选音高。然后,在动态规划框架下建模旋律音高的显着性和时序连续性,并跟踪得到最终的主旋律音高序列。在叁个主旋律提取评价数据库上测试了该方法的性能,实验结果表明,本文方法取得了较好的旋律提取结果,且在叁个测试数据库上的原始音高准确率均高于其他参考方法。(本文来源于《信号处理》期刊2018年08期)
贾宸[4](2018)在《主旋律提取中若干关键问题的研究》一文中研究指出主旋律提取是音乐信息检索中的一个重要问题。音乐信息检索的目的在于将波形音乐文件转化为一串表征人声基频值的频率序列。基频作为一种重要的声学特征在诸多领域都有着重要的应用,因此主旋律提取在音乐信息交互上具有重要的地位。传统的主旋律提取方法中主要包含两个模块,候选基频提取和主基频判定。现阶段候选基频提取模块主要存在虚假基频过多的弊端,而主基频判定模块主要存在对时间帧内短时特征利用不充分,以及过分依赖旋律起始阶段提取准确性两个弊端。本文针对上述弊端做出改进,主要创新点包含以下两部分:1.提出了一种基于级联过滤的候选基频提取模块。这个系统包含叁个部分,预处理部分,超傅里叶变换滤波部分及横纹滤波部分。首先,未经任何处理的原始信号中含有较大的成分的干扰源,我们利用乐曲重复性特点,采用先进音源分离方法对原始信号预处理,处理后的信号频谱中仍旧包含大量虚假基频,并且这些虚假基频多由伴奏信号和人声信号迭加产生的虚假峰值点产生,我们通过超傅里叶变换滤波,滤除频谱中伴奏声的频率分量,削减候选基频中非人声基频数量,最后我们认为原始的未进行能量映射的频谱保留了最接近原始声音信号的特征,我们利用横纹滤波模块滤除频谱中的离群点,野点候选基频簇及表现为平稳长直音的横纹候选基频簇,再一次大幅度削减候选基频中的非人声基频数。2.研究了基于人声帧判决的主基频判定方法。利用基于梅尔频率倒谱系数,谐波特征,频谱形状特征,谱对比度特征等特征进行训练的人声判决机器学习分类器。实验从单一特征,组合特征两个角度出发,寻找主旋律提取中人声准确率召回率表现相对较好的一组特征进行模型训练。在主基频判定模块中用以区分人声旋律线及非人声旋律线以提取最终的主旋律。(本文来源于《北京邮电大学》期刊2018-03-12)
方旭怡[5](2017)在《歌曲主旋律提取研究》一文中研究指出从音乐信号中提取主旋律是一种可以通过分析音频文件信息来帮助用户直接与音乐进行交互的技术,它与音频信号处理及音乐信息检索(MIR)有很大的联系。这种技术多被称为“主旋律提取”、“音频旋律提取”、“主旋律估计”、“主基频估计”等,其目的是从音乐信号中自动获得表示主旋律线基频的频率序列。本文的研究方法是基于音乐多基频提取的方法,即认为音乐是由人声和各种乐器音源的信号混合而成,为了得到人声音源的基频,需要在基频域提取候选人声基频,再通过人声乐器的短时区分性特征进行主基频判决得到候选人声基频序列,最后通过人声乐器的长时区分性特征进行人声帧判决得到一条主旋律基频序列。本文创新点主要分为以下叁个部分:1、提出并研究了叁类人声与乐器在谐波域上的区分性特征本文首先从人声乐器发音机理上分析人声乐器两者的区别,通过理论分析挖掘出可能的区分点,对纯人声、纯乐器以及多音源音乐信号在谐波域上进行了大量实验统计分析工作,分别提出了基于谐波结构能量、谐波结构频率误差以及谐波次数叁类区分性特征,其中部分特征能够较好的描述多音源音乐中人声乐器的区别。2、提出并研究了基于谐波结构特征的主基频判决方法本文在已有多基频提取的基础,根据谐波结构的区分性特点以及结合逻辑回归分类器提出了多种新的主基频判决方法,并且对比分析这些方法的优劣情况,这些方法不仅提高人声基频的召回率,也使得整个主旋律提取系统的人声召回率和音高准确率得到提升。3、研究并实现了预处理阶段的人声帧判决模块本文利用多种音乐检索领域的统计特征和逻辑回归分类器,在预处理阶段引入人声帧判决,使得非人声帧对主旋律判决的影响尽可能的减小,从而降低主旋律提取的虚警率,从而达到提高系统主旋律正确率的效果。(本文来源于《北京邮电大学》期刊2017-03-09)
关金晨,曹西征,马青阁,赵宛,汪旭彬[6](2016)在《基于H-K的改良算法的MIDI文件提取主旋律》一文中研究指出基于内容的音乐检索、哼唱检索及基于机器学习的自动作曲中,其源音乐文件常以多音轨的MIDI格式存储,主旋律是其中最重要的信息,因此,主旋律的提取是机器分析的核心工作。先利用分层次聚类方法中的修订的轮廓线法去除一部分控制音符和无用的音符,再运用一些方法排除一部分音轨,最后利用H-K算法进行主旋律的提取,改良后的算法大大提高了音轨提取的准确率。(本文来源于《福建电脑》期刊2016年06期)
赵宛,曹西征,马青阁,关金晨,汪旭彬[7](2016)在《基于BP神经网络优化算法的MIDI文件中主旋律提取》一文中研究指出本文对多音轨的MIDI文件提取出能表征音乐主旋律音符的时值、音高、音强等特征参数;再对各音轨音符序列进行音程差的统计和信息熵的求解;初步排除一些非常明显的伴奏旋律,对剩余候选音轨提出一种优化的基于BP神经网络算法的模型,实现对主旋律音轨的自动定位,使主旋律提取的准确性提高到96%。(本文来源于《福建电脑》期刊2016年05期)
马青阁,曹西征,赵宛,汪旭彬,关金晨[8](2016)在《基于H-K算法的MIDI文件主旋律音轨提取探讨》一文中研究指出主旋律是音乐旋律信息的重要组成部分,文章通过对表征音乐旋律特征向量的提取,采用H-K分类算法构建音轨分类器模型,对MIDI片旋律音轨和伴奏旋律音轨进行分类。最后通过候选音轨提取出主旋律音轨,研究表明,这种方法对10个音轨内的主旋律提取准确率由75%提升到90%,对于2个音轨以内的主旋律提取可以达到95%的准确率。(本文来源于《无线互联科技》期刊2016年06期)
龚小龙[9](2016)在《歌曲主旋律提取研究》一文中研究指出歌曲主旋律是指一首歌曲中人声的基频曲线。主旋律提取的定义是将一段歌曲信号中的主旋律提取出来并转换为数字格式特征。主旋律提取主要应用在哼唱检索系统中,利用歌曲主旋律作为检索特征。本文研究歌曲主旋律提取方法由多基频提取和主旋律判决两个步骤组成。主要工作分为以下两个部分:(1)研究了两种多基频提取算法对其进行改进在多基频提取部分,本文首先对歌曲信号进行等响度滤波,将歌曲信号的高频和低频部分进行能量削弱。之后分析了短时傅立叶变换用于多基频提取的不足之处。引用了更加适合处理歌曲信号的多分辨率短时傅立叶变换。本文介绍了多基频提取中常用的分谐波迭加算法,并分析了其用于多基频提取存在的问题。介绍了谐波音阶特征描述算法的用途并将其实现,对谐波音阶特征描述算法做了一系列改进,使其适用于多基频提取。通过对比实验,本文改进的基于谐波音阶特征描述算法的多基频提取算法准确度高,简单可行。(2)研究了主旋律判决算法,并提出了一种结合规则和统计方法的主旋律判决算法在主旋律判决的过程中,利用多基频提取算法得到的多个候选基频,确定哪些候选基频属于主旋律。本文首先实现了一种已有的构建音高轮廓线的方法,分别对属于人声、背景音乐的构建音高轮廓线。对音高轮廓线提取一系列新的特征,统计新特征与原有特征的分布特性。提出了一种新的主旋律判决方法,利用特征的分布特性制定滤除规则,结合支持向量机分类模型,以达到区分人声基频点和非人声基频点的目的。并提取到最终的主旋律信息,增强了主旋律判决鲁棒性。(本文来源于《北京邮电大学》期刊2016-03-15)
李冰瑶[10](2014)在《基于听觉场景分析的主旋律提取》一文中研究指出主旋律的定义是音乐中人声的基频曲线,音乐的主旋律提取是众多研究领域,如哼唱搜索和歌曲结构分析等的基础。计算听觉场景分析(CASA)算法的目的是将人声与背景噪声分离,所以在理论上采用CASA来进行主旋律提取是一种可行的方案。但是CASA算法对混合信号的信噪比的要求比较高,目前多运用于人声和普通噪声分离。而音乐信号不满足高信噪比这一特点,并且音乐信号中的伴奏不同于普通噪声,其有明显的谐波结构,在结构上更类似于人声,会对人声的分离产生干扰,如果直接采用CASA算法进行主旋律提取而不加以改进所得到的结果并不理想。本文结合了CASA的发展现状和音乐的特点,研究了一种基于听觉场景分析的主旋律提取算法。主要工作内容如下:(1).研究了两种音乐信号预处理的方法音乐信号中的谐波乐器信号和高次谐波信号会对基于计算听觉场景分析的主旋律提取产生一定的影响。为了解决这些问题,本文使用了两种预处理方法。第一种是运用“谐波乐器/打击乐器信号分离”(HPSS)算法对信号进行预处理。由于纯乐器信号,谐波乐器分量和打击乐器分量在语谱图上具有各向异性,利用HPSS对音乐信号进行预处理,滤除对歌声信号干扰比较大的谐波乐器分量,解决了谐波乐器信号干扰的问题。第二种是根据入声和乐器发声的特点,适当降低音乐信号的高频部分,提升音乐信号中的信噪比,解决了高次谐波影响的问题。实验证明,预处理可以显着提高主基频提取的精度。(2).研究了一种基于计算听觉场景分析的主基频提取算法音乐信号中真实音源数量众多,这对计算听觉场景分析是一大挑战。本文引入了多种方法来解决此问题。首先,对音乐信号进行听觉外围处理,对每一个时频单元的滤波器响应和响应包络提取相关函数和瞬时频率特征,构造6维特征向量。然后,利用提取的特征作为叁个多层感知器的输入,对每一个时频单元进行基频判定,找出最有可能的基频值,作为此时频单元的基频估计值,并通过基频估计值确定相应的理想二值掩膜(IBM)。接着,通过初始估计和掩膜在每一帧内最多得到两个基频,根据短时连续性可得到多条基频曲线。本文利用迭代的方法,对基频曲线和IBM进行迭代估计,提高预测的准确度。最后,对于多基频曲线中重合的基频点,本文采用一种基频选择算法,利用了信号的短时连续性,从两个主要基频中选择一个作为主旋律。实验结果表明,本文算法对主基频提取能取得良好的效果。(3).提出了一种基于能量比特征的基频预估计方法人声信号和伴奏信号在高频区域的能量分布不同,人声信号在高频区域存在着明显的衰减,而伴奏信号在高频的衰减比较小。本文通过对每一帧中人声基频范围内可能的基频点分别计算该基频点的低频谐波分量和总谐波分量的能量值,计算低频谐波分量所占能量值的比例,通过能量比排序并根据判定规则滤除伪基频候选点,最终对每一时间帧得到初始基频候选值,将此基频候选值作为主旋律提取算法的基频初始估计并最终得到基频曲线。实验结果表明,与采用听觉特征进行初始预测相比,运用能量特征所得到的主基频的准确率有了很大的提高。(本文来源于《北京邮电大学》期刊2014-12-19)
主旋律提取论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
音乐信息检索包括音乐内容分析、音乐风格分类、哼唱识别、音乐推荐等内容,近年来在网络音乐、移动终端、消费电子、游戏娱乐等领域得到了广泛应用。主旋律提取与多音高估计是音乐信息检索领域的重要课题,国内外对此进行了研究,取得了重要成果,但在性能上还无法满足实际需要,有许多问题有待深入研究解决。本文应用欧几里得算法、贝叶斯滤波、动态规划、时频分析等技术,对主旋律提取和多音高估计方法进行了深入研究,所做的主要创新工作如下:(1)低音伴奏、特殊歌唱技巧以及某些乐器的固有特性会导致基频丢失,此时难以用基频跟踪技术提取音乐主旋律。为此,本文将计算两个自然数最大公约数的欧几里得算法推广到浮点数域,提出了改进欧几里得算法。然后,将其用于旋律音高候选估计,提出了基于改进欧几里得算法的主旋律提取方法。该方法用短时傅里叶变换和瞬时频率进行音乐混合信号正弦估计,并基于谱峰频率对,用改进欧几里得算法计算每帧的多个候选音高估计,再根据音高轮廓时长和连续性特征得到旋律音高序列。该方法不依赖于基频分量就能进行音高估计。进一步,针对同一音符持续时间内音高估计值有时剧烈跳变的问题,提出了改进欧几里得算法和动态规划相结合的主旋律提取方法。该方法用改进欧几里得算法估计每帧多个候选音高,用动态规划算法迭代求解描述主旋律音高的目标函数,以获得平滑的旋律音高轮廓,大幅度减少旋律轮廓的短时剧烈跳变。实验结果表明,该方法在基频丢失时能有效地估计主旋律音高,且避免了旋律音高序列的短时剧烈跳变。(2)鉴于随时间演进的主旋律音高具有时序相关性,本文用贝叶斯理论对音乐主旋律提取建模,并用粒子滤波获得其有效近似解,提出了基于粒子滤波和动态规划的主旋律提取方法。该方法在粒子滤波阶段,用Logistic分布描述音高转移概率,基于音高显着性、谱平滑性和音色相似性构建似然函数,用粒子滤波递推估计旋律音高序列的后验概率密度,以获得旋律轮廓粗估计。在动态规划阶段,先对旋律轮廓粗估计结果进行平滑,得到帧级旋律音高动态范围,然后用动态规划算法迭代求解描述主旋律音高的目标函数,从而得到最终的旋律音高序列。该方法不需要先验信息,两阶段策略既缩小了旋律音高搜索范围,又大幅度降低了动态规划计算量。实验结果表明,该方法具有较高的旋律提取准确率。(3)音乐信号中部分乐音分量存在谐波重迭,导致多音高估计时常产生漏检和误检问题。为此,本文定义了伪二维谱,推导出相关性质,在此基础上,提出一种基于伪二维谱的多音高估计方法。该方法用伪二维变换,将一维音乐信号映射到二维频率平面上;然后,计算伪二维幅度谱与二维谐波模板的互相关函数,实现二维模式匹配,得到音高初估计;最后,借助邻近帧估计结果去除异常值,并用音高直方图对剩余音高进行筛选和补充,从而得到精确的帧级多音高估计结果。该方法能有效地区分和声导致的重迭谐波分量,且计算量较小。实验结果表明,与现有方法相比,该方法的音高估计精确率与召回率较高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
主旋律提取论文参考文献
[1].陆雄,夏秀渝,蔡良,孙文慧.声乐主旋律的自动提取[J].太赫兹科学与电子信息学报.2019
[2].张维维.音乐主旋律提取与多音高估计方法研究[D].大连理工大学.2019
[3].张维维,陈喆,殷福亮.结合改进欧几里得算法和动态规划的音乐主旋律提取[J].信号处理.2018
[4].贾宸.主旋律提取中若干关键问题的研究[D].北京邮电大学.2018
[5].方旭怡.歌曲主旋律提取研究[D].北京邮电大学.2017
[6].关金晨,曹西征,马青阁,赵宛,汪旭彬.基于H-K的改良算法的MIDI文件提取主旋律[J].福建电脑.2016
[7].赵宛,曹西征,马青阁,关金晨,汪旭彬.基于BP神经网络优化算法的MIDI文件中主旋律提取[J].福建电脑.2016
[8].马青阁,曹西征,赵宛,汪旭彬,关金晨.基于H-K算法的MIDI文件主旋律音轨提取探讨[J].无线互联科技.2016
[9].龚小龙.歌曲主旋律提取研究[D].北京邮电大学.2016
[10].李冰瑶.基于听觉场景分析的主旋律提取[D].北京邮电大学.2014