音乐流派分类论文-何丽,袁斌

音乐流派分类论文-何丽,袁斌

导读:本文包含了音乐流派分类论文开题报告文献综述及选题提纲参考文献,主要关键词:音乐分类,长短时记忆网络,梅尔倒谱系数,频谱质心

音乐流派分类论文文献综述

何丽,袁斌[1](2019)在《利用长短期记忆网络进行音乐流派的分类》一文中研究指出针对传统的基于人工标注的文本音乐分类存在人工标注成本高,易于出错,没有涉及到音乐本身的内容的问题,提出了一种基于音乐内容的分类方法,将深度学习中的长短时记忆网络(LSTM)应用到音乐流派分类中。从包含10种音乐流派的1 000首歌曲中提取出梅尔倒谱系数,频谱质心和频谱对比度叁个特征,将提取出来的特征数据输入到LSTM网络中进行训练,输出每种音乐类别的概率。对此,进行了叁次实验。第一次是将梅尔倒谱系数,频谱质心作为特征数据输入到LSTM网络中,第二次是以频谱对比度和频谱质心作为特征数据,第叁次是将梅尔倒谱系数,频谱质心和频谱对比度作为特征数据。从实验结果上看,当梅尔倒谱系数,频谱质心和频谱对比度作为特征数据时,模型的分类效果最好,分类准确率最高。实验结果表明,该方法在准确率上比玻尔兹曼机和卷积神经网络等方法都有所提升。(本文来源于《计算机技术与发展》期刊2019年11期)

袁斌[2](2019)在《基于深度学习的音乐流派分类方法的研究》一文中研究指出随着互联网的高速发展,数字音乐呈现爆炸式增长。面对海量的音乐,如何快速准确的检索出用户想要的音乐变的越来越重要了。而音乐分类作为音乐信息检索的重要组成部分成为近年来的研究热点。传统的音乐分类方法主要是手动提取特征,然后使用机器学习方法进行分类,这种方法存在两个缺陷,一是手动提取特征很难保证特征的有效性和准确性;二是传统的机器学习分类方法在多分类问题上表现不佳,且无法进行大规模数据的训练。针对以上问题,本文提出了一种基于深度神经网络的音乐流派分类的方法,并研究了不同结构的深度神经网络对音乐流派分类的影响。本文的主要工作如下:(1)根据音乐信号具有时序的特性,提出了一种使用长短时记忆网络LSTM作为分类器的音乐流派分类方法。实验中,首先人工提取梅尔倒谱系数、频谱对比度、频谱质心叁种描述音乐内容的特征,然后通过五组对比实验,找出较佳的特征组合。实验结果表明,当梅尔倒谱系数,频谱对比度,频谱质心叁种特征进行组合时,长短时记忆网络在音乐流派分类上的准确率高于其他的特征组合。(2)根据卷积神经网络在图像处理上的优势,提出了一种利用声谱图作为输入数据,卷积神经网络作为分类器的音乐流派分类方法。由于声谱图是图像数据,包含了音乐的频率分布和声音幅度的变化,因此非常适合使用卷积神经网络。利用卷积神经网络能够自动学习抽象特征的能力,对音乐的局部特征进行组合,从而形成全局的表达。在实验中,首先使用音乐的声谱图数据训练了本文设计的卷积神经网络和基于VGG16的改进的网络,然后人工提取若干音乐特征作为训练数据,输入到支持向量机、随机森林、决策树、逻辑回归等分类模型中。最后将基于卷积神经网络的方法和传统的机器学习分类方法进行了对比。实验结果表明,在分类准确率上,基于卷积神经网络的方法要优于传统的机器学习分类方法。(本文来源于《北方工业大学》期刊2019-05-06)

黄琦星[3](2019)在《基于卷积神经网络的音乐流派分类模型研究》一文中研究指出音乐流派分类,是音乐信息检索中一个关键环节,不同的用户对各流派的音乐喜爱程度差异也有霄壤之别。无论何许流派,一首音乐的组成十分复杂,伴奏的乐器多种多样,人声的差异也十分显着,各种元素的和声更是千变万化。构建一个良好的音乐分类体系,可以有效减少用户对于喜爱音乐的检索耗时,提高用户体验。早期音乐流派分类主要是通过专业人士听音注释,这种方法无疑费时费力。引入机器学习的方法之后,最初是以人工判断的方法决定可能用到的声学特征,提取音乐中的这些特征训练分类器,从而实现音乐流派分类。这类方法不稳定性较大,需要手工设计特征集,因此一定程度上依赖个人经验判断以及专业知识,因此准确率难以提高。针对以上问题,本文基于深度学习的思想和卷积神经网络的结构特性,设计了以频谱图为输入的音乐流派分类模型,提供了音频分类识别的新思路。主要工作有:1.将音乐文件通过短时傅利叶转换、梅尔变换和常数Q变换及可视化处理生成对应频谱图,研究了叁者所能呈现的可视声学特征,及叁者之间图像化声学特征的直观差异,并举例对比了不同流派所生成的图谱。从输入到输出设计了完整的架构,搭建出基于频谱图的卷积神经网络分类模型,利用卷积神经网络的高效性和强大的特征学习及分类能力减少了人工处理的时间和成本。在GTZAN(George Tzanetakis)数据集上,该模型有着71.34%的分类精度,领先于其他常见机器学习算法。2.针对原始模型在输入数据以及网络架构方面的不足,本文提出了改进的卷积神经网络分类模型。新模型在GTZAN数据集上的分类精度最优可达92.21%,相比原始模型性能又有了进一步的提升。未来还将在特征分析、模型的加速以及数据规模方面进一步优化模型性能,将其更好的应用于音乐信息检索领域。(本文来源于《吉林大学》期刊2019-05-01)

姚晓梅[4](2019)在《基于LSTM模型的音乐流派分类方法研究》一文中研究指出音乐流派分类/识别在音乐信息检索领域是一项必不可少的关键任务,在音乐推荐以及音乐自动标记中都是一项必要的处理环节。音乐流派分类对于用户搜索自己喜欢的音乐作品是非常有用的。音乐流派分类一直是理解人类对音乐偏好的核心问题,并被应用于音乐推荐系统的构建。音乐流派分类中研究的任务主要包含特征提取和分类器设计,利用各种音频信号特征提取技术,利用手工制作的高级特征如响度、节奏和音色,以及最先进的神经网络模型已被广泛研究。在传统的基于帧特征的音乐流派分类方法中,音频数据由独立帧表示,完全忽略了音频的时序特性。如果能够对序列关系进行很好的建模,分类性能就会得到显着提高。利用深度学习模型设计并实现音乐流派分类系统是有趣而富有挑战的。在本课题中,围绕音乐流派分类,从音频特征提取、分类器训练到最终音乐流派预测设计和实现一个完整的音乐流派自动识别系统。本文在音乐流派分类问题上采用了长短期记忆(LSTM)模型,而不是卷积神经网络。通过训练一个深层模型,可以对音乐进行分类十种不同的类型。此外,本文还采用了分层分类的方案,进一步提高了精度。首先,通过训练LSTM分类器将音乐分成强音类和弱音类两个类,然后将音乐进一步划分为多个子类。本文提出了基于LSTM的音乐流派分类算法,利用LSTM学习连续帧特征的表示形式,整合分段特征中每个分段中的帧特征的相关统计信息构成。在对GTZAN数据集上的实验显示,提出的音乐流派分类系统在十种流派类型上能够达到50%的准确度,比基线模型CNN提高了约3.13%。这一重大改进显示了所提出的深层LSTM算法在音乐流派分类上的有效性。(本文来源于《河南科技大学》期刊2019-05-01)

潘镇锋[5](2019)在《基于深度学习的MIDI音乐流派分类研究》一文中研究指出随着数字音乐时代的到来,数字音乐资源呈现爆发式增长。音乐分类是管理海量音乐资源的基础。音乐流派是描述音乐的重要标签。音乐标签对数字音乐资源起到很好的标识和划分作用。面对庞大的音乐数据库,依赖人工标注进行分类将耗费大量的成本和时间,已不能满足时代的需求。因此,音乐自动化分类逐渐成为研究热点。MIDI(Musical Instrument Digital Interface)是一种重要的数字音乐格式,在音乐创作和教育中广泛使用。MIDI音乐流派分类任务,包括两个重要步骤:特征提取和分类器设计。本文根据MIDI音乐流派分类任务,针对特征提取和分类器设计进行改进,提出基于深度学习的音乐分类方法。本文主要研究工作和创新点如下:(1)针对传统分类方法中对MIDI音乐提取全局特征难以描述音乐的时序特性,本文在特征提取的过程中,将MIDI音乐划分成多个局部弹奏风格相近的乐段,以乐段为分析单元,提取乐段特征,组成乐段特征序列,以更好地描述音乐。具体过程包括提取音符特征矩阵,基于音符特征矩阵提取主旋律和乐段划分,基于乐段主旋律研究并提取有效特征,组成特征序列。(2)针对传统分类方法中分类器由于浅层结构的限制难以学习音乐的时序和语义信息,本文提出一种基于深度学习的MIDI音乐分类方法。根据输入MIDI乐段特征序列,对循环神经网络和注意力机制进行研究,首次使用Bi-GRU(Bi-directional Gated Recurrent Unit)和注意力机制设计MIDI分类网络模型。Bi-GRU擅长处理序列数据,能从乐段特征序列学习音乐的上下文语义和深层特征,加入注意力机制对Bi-GRU从不同的乐段学习的特征自动赋予不同的注意力权重,学习出更显着的音乐特征,从而提高分类的准确率。(3)从互联网上收集1920首具有流派标签的MIDI文件构建数据集,进行音乐分类相关实验。实验中,使用本文提出的音乐分类方法取得90.1%分类准确率,优于传统基于BP神经网络的分类方法,并结合等长划分乐段的分类实验准确率,验证了本文使用的乐段划分方法对音乐分类的有效性。(本文来源于《华南理工大学》期刊2019-04-10)

姚佳宁[6](2018)在《基于深度注意力机制的音乐流派分类方法研究》一文中研究指出随着互联网和多媒体设备的普及,数字音乐在各大应用平台的数量急剧增加。海量的音乐数据对用户造成了极大的混乱,并且很难通过人工对庞大的音乐数据库进行管理。所以如何利用计算机自动地对音乐进行分类和管理成为了目前急需解决的问题。音乐流派作为一种可以描述和理解音乐的标签,能有效区分不同风格的音乐。因此,音乐流派分类任务成为了音乐信息检索领域中最受关注的研究方向之一。在音乐流派分类任务中,特征提取和分类器建模是直接影响分类准确率的两个关键部分。传统的分类方法将特征提取和分类过程进行分别设计,先手动地从原始音乐信号中提取特征,然后选择合理的分类器建模并对提取的特征进行分类。虽然传统的方法在很多分类任务中取得了很好的效果,但特征提取过程复杂不易实现,且不同的分类任务所需的特征需要专门设计,提取得到的特征缺乏通用性。随着深度学习模型在其他领域的成功应用和不断发展,越来越多的研究开始利用音乐的声谱图作为深度学习模型的输入进行音乐流派分类。但目前为止,已有的基于深度学习的分类方法的准确率还并不理想,所以本文主要研究一种基于深度学习的分类方法,以此来提高音乐流派分类模型的分类准确率。本文共提出了两种结构的基于深度注意力机制的分类模型,一种是串行结构的深度注意力分类模型。通过对BRNN的训练,使得其可以自动地从样本中学习到音乐特征,线性的注意力模型根据学习到的特征计算出在该特征上的注意力概率分布,并重新分配给该特征表示。最后根据分配了不同权重的特征向量实现分类。但是,由于串行的注意力模型依赖于BRNN的训练结果,若BRNN不能得到有效的特征表示,则会影响注意力模型的学习效果。考虑到串行结构的局限性,本文对其进行了改进。提出了另一种并行结构的深度注意力分类模型。并且除了结构简单的线性注意力模型,还设计了一种学习能力更强的CNN注意力模型。为了验证模型的可行性和有效性,本文分别在GTZAN和Extended Ballroom两个标准数据集上做了验证实验。实验结果表明,相比于串行结构的分类模型,基于深度并行注意力机制的分类模型分类效果更好,并且利用BRNN与并行的CNN注意力模型进行分类,在Extended Ballroom数据集上准确率达到92.7%,优于现有的基于深度学习的分类方法,证明了该分类模型的有效性和可行性。(本文来源于《大连理工大学》期刊2018-06-19)

王冰聪[7](2018)在《基于内容的音乐流派自动分类系统的研究与实现》一文中研究指出随着互联网和多媒体技术的迅猛发展,在线音乐服务已经成为面向大众消费者最重要的互联网在线服务之一。互联网上的音乐曲库规模已经极其庞大,各大在线曲库中不乏曲目规模上百万者,这些曲库的规模还在迅速扩大中。随之而来的一个重要又紧迫的需求是自动化标注并合理组织与分类海量的数字化音乐曲目,以便消费者根据个人喜好高效便捷地从海量音乐曲库中检索自己感兴趣的音乐曲目。近年来音乐信息检索(Music Information Retrieval,MIR)已经发展为一个令人瞩目的新兴研究领域,其中基于内容的音乐流派自动分类是一个重要的音乐自动标注任务。本研究设计并实现了 一个基于内容的音乐流派自动分类系统。作者根据音乐在时间上的流动特点,结合卷积神经网络和长短时记忆网络设计了一种特殊结构的基于音乐梅尔频谱的深度学习分类器,并在GTZAN数据集上验证了该网络结构的有效性;该深度学习分类器的另一个优点是其可以方便地对音乐进行实时处理;为了进一步提高该深度学习分类器的分类准确率,作者对梅尔频谱进行了和声打击分离,并引入集成学习技术,最终获得了超高的分类准确率;为了指导分类系统按照给定目标音乐流派标签进行音乐检索,本研究充分探索了分类器在各种分类概率阈值设定下的预测性能。(本文来源于《北京化工大学》期刊2018-06-01)

雷文康[8](2017)在《基于深度神经网络的音乐流派分类研究》一文中研究指出如今随着互联网技术的飞速发展,在线的音乐服务逐渐成为人们收听音乐作品最便捷和主要的方式。面对海量的音乐作品,音乐信息检索系统性能关系到音乐服务的质量,其中的自动流派分类技术是基于内容的音乐信息检索的重要组成部分,因而成为了近年来研究的热点。音乐信号具有复杂的频率构成和丰富的语义信息,找到对音乐的有效特征表达是流派分类的关键。本文基于深度学习的方法,对音乐信号进行建模分析,通过深度神经网络进行自动的学习,获取信号中与流派相关的语义信息和时频特征表达,从而提高分类的准确率。具体工作和创新点如下:1.研究了音乐信号的语义信息提取,提出使用循环神经网络的流派分类算法。由于传统的特征都是基于语音信号的短时平稳特性,而语义信息则蕴藏在较长时间段的上下文中。因此,可以利用循环神经网络的记忆特性,对短时特征组成的特征序列进行学习,获取其中的上下文信息。实验结果表明,使用了循环神经网络后获得的语义特征比原始的短时特征的统计量能更好地描述分析窗长内的音乐特性,在GTZAN和ISMIR2004两个数据集上的分类准确率分别达到81.85%和83.7%。2.研究了音乐信号的时频特征自动提取,提出使用卷积神经网络的音乐流派分类算法。语音信号的声谱图能反映出一段音频的时频特性,以声谱图作为原始输入,利用卷积神经网络的局部和全局感知特性,从声谱图中体现的频率分布和变化中学习局部特征,通过多层卷积将局部特征进行组合形成了高层和全局的表达。同时,在卷积网络中加入了残差单元和随机深度策略,提升网络性能。最后,将卷积神经网络和循环神经网络的优点相结合,提出卷积循环神经网络,完成了从声谱图到分类结果的端到端的流派分类算法。实验中,卷积循环神经网络在GTZAN和ISMIR2004两个数据集上的分类准确率分别达到88.16%和89.93%,超过了目前基于卷积神经网络和手工特征的分类算法。本文提出的音乐流派分类算法,有助于音乐信号的高层语义特征提取的研究,以及推进深度学习方法在音乐信号分析领域的应用。(本文来源于《华南理工大学》期刊2017-04-13)

王芳[9](2016)在《基于深度学习的音乐流派及中国传统乐器识别分类研究》一文中研究指出近几年,随着互联网和数字音频技术的发展,音乐信息检索逐渐成为研究热点。其中,对音乐流派进行有效的识别分类是一个重要的研究方向;此外,乐器的识别分类也是研究热点方向之一,其中中国传统乐器作为世界乐器的重要组成部分,也具有很大的研究价值,但对其研究较少。目前音乐信息检索领域的识别分类系统主要先人工提取音乐特征,再用分类器训练建模,最后利用建好的模型对测试音乐样本进行识别分类。但是目前在人工提取音乐特征方面遇到了瓶颈。因为不同的识别分类任务所需的音乐特征不同,甚至有时所需的音乐特征叫不出名字,所以人工提取音乐特征十分困难。而深度学习作为一种新的特征提取技术,已在图像处理、自然语言理解等领域取得了巨大成果,因此本文针对是否可以利用深度学习强大的特征提取能力发现更合适的音乐特征用于音乐流派和中国传统乐器识别分类这一问题展开了研究。首先,本文介绍了人工提取的音乐特征以及经典的分类方法,并概述了深度学习的发展历史、结构以及常用模型,指出了本文采用深度置信网络的原因。接着,本文研究了基于深度置信网络的音乐流派识别分类算法,并对其进行了改进。先对各音乐流派信号预处理并提取梅尔多频系数,再将该特征作为深度置信网络的输入,并对网络添加Dropout和动量来改进网络,然后不断调参训练得到最佳网络模型,最后利用得到的最佳模型对测试音乐进行流派预测。仿真实验结果表明,使用改进的方法对GTZAN库的十大音乐流派进行识别分类的准确率最高达75.8%,优于现有经典算法。最后,本文提出了基于深度置信网络的中国传统乐器识别分类算法,对各乐器音乐样本预处理并提取梅尔频率倒谱系数,再将其输入深度置信网络,然后调参训练,最后利用训练好的模型对测试乐器的种类进行预测。仿真实验结果表明,使用该算法对本人建立的中国传统乐器音乐库的六种乐器进行识别分类的准确率最高达99.2%,同样优于现有经典算法。因为乐器库的音乐质量较好且乐器的种类较少,故预测准确率明显高于流派库的预测准确率。(本文来源于《南京理工大学》期刊2016-12-01)

张智乐[10](2016)在《基于听觉图像的音乐流派自动分类》一文中研究指出听觉图像构建的模拟模型依循了耳蜗本体特性,时域模型接纳了传递过来的声音而后变为可参照的二维图像。依照图像细化的类别以便于自动区分现有的音乐流派,解析了不同情形下的音乐强度。针对于音乐流派,解析了听觉图像基础之上的自动分类,探析适宜的分类思路。(本文来源于《黄河之声》期刊2016年01期)

音乐流派分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着互联网的高速发展,数字音乐呈现爆炸式增长。面对海量的音乐,如何快速准确的检索出用户想要的音乐变的越来越重要了。而音乐分类作为音乐信息检索的重要组成部分成为近年来的研究热点。传统的音乐分类方法主要是手动提取特征,然后使用机器学习方法进行分类,这种方法存在两个缺陷,一是手动提取特征很难保证特征的有效性和准确性;二是传统的机器学习分类方法在多分类问题上表现不佳,且无法进行大规模数据的训练。针对以上问题,本文提出了一种基于深度神经网络的音乐流派分类的方法,并研究了不同结构的深度神经网络对音乐流派分类的影响。本文的主要工作如下:(1)根据音乐信号具有时序的特性,提出了一种使用长短时记忆网络LSTM作为分类器的音乐流派分类方法。实验中,首先人工提取梅尔倒谱系数、频谱对比度、频谱质心叁种描述音乐内容的特征,然后通过五组对比实验,找出较佳的特征组合。实验结果表明,当梅尔倒谱系数,频谱对比度,频谱质心叁种特征进行组合时,长短时记忆网络在音乐流派分类上的准确率高于其他的特征组合。(2)根据卷积神经网络在图像处理上的优势,提出了一种利用声谱图作为输入数据,卷积神经网络作为分类器的音乐流派分类方法。由于声谱图是图像数据,包含了音乐的频率分布和声音幅度的变化,因此非常适合使用卷积神经网络。利用卷积神经网络能够自动学习抽象特征的能力,对音乐的局部特征进行组合,从而形成全局的表达。在实验中,首先使用音乐的声谱图数据训练了本文设计的卷积神经网络和基于VGG16的改进的网络,然后人工提取若干音乐特征作为训练数据,输入到支持向量机、随机森林、决策树、逻辑回归等分类模型中。最后将基于卷积神经网络的方法和传统的机器学习分类方法进行了对比。实验结果表明,在分类准确率上,基于卷积神经网络的方法要优于传统的机器学习分类方法。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

音乐流派分类论文参考文献

[1].何丽,袁斌.利用长短期记忆网络进行音乐流派的分类[J].计算机技术与发展.2019

[2].袁斌.基于深度学习的音乐流派分类方法的研究[D].北方工业大学.2019

[3].黄琦星.基于卷积神经网络的音乐流派分类模型研究[D].吉林大学.2019

[4].姚晓梅.基于LSTM模型的音乐流派分类方法研究[D].河南科技大学.2019

[5].潘镇锋.基于深度学习的MIDI音乐流派分类研究[D].华南理工大学.2019

[6].姚佳宁.基于深度注意力机制的音乐流派分类方法研究[D].大连理工大学.2018

[7].王冰聪.基于内容的音乐流派自动分类系统的研究与实现[D].北京化工大学.2018

[8].雷文康.基于深度神经网络的音乐流派分类研究[D].华南理工大学.2017

[9].王芳.基于深度学习的音乐流派及中国传统乐器识别分类研究[D].南京理工大学.2016

[10].张智乐.基于听觉图像的音乐流派自动分类[J].黄河之声.2016

标签:;  ;  ;  ;  

音乐流派分类论文-何丽,袁斌
下载Doc文档

猜你喜欢