单通道语音增强论文-邓贺元,刘加,夏善红,彭春荣

单通道语音增强论文-邓贺元,刘加,夏善红,彭春荣

导读:本文包含了单通道语音增强论文开题报告文献综述及选题提纲参考文献,主要关键词:深度学习,时间频率掩蔽值,空间特征,波束成形

单通道语音增强论文文献综述

邓贺元,刘加,夏善红,彭春荣[1](2019)在《一种联合频谱和空间特征的深度学习多通道语音增强算法》一文中研究指出近年来,越来越多的电子产品使用麦克风阵列,而且与传统多通道语音增强算法相比,基于深度学习的算法效果更好,为了进一步提高增强效果,提出一种联合频谱特征和空间特征的深度学习算法。该算法包括两个部分,第一部分,使用频谱和通道间相位差特征估计时间频率掩蔽值,然后进行基于掩蔽值的波束成形;第二部分,使用方向特征和频谱特征进行进一步的增强。在CHiME4数据集上的实验证明了该算法的有效性,与仅使用频谱特征的方法相比,在真实数据上的词错误率相对降低27.6%,在仿真数据上的主观语音质量评估得分从2.46提高到2.81。(本文来源于《电子测量技术》期刊2019年18期)

叶中付,朱媛媛,贾翔宇[2](2019)在《基于字典学习和稀疏表示的单通道语音增强算法综述》一文中研究指出如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。(本文来源于《应用声学》期刊2019年04期)

葛宛营,张天骐[3](2019)在《基于掩蔽估计与优化的单通道语音增强算法》一文中研究指出单通道语音增强算法通过从带噪语音中估计并抑制噪声成分来得到增强语音。然而,噪声估计算法在计算时存在过估现象,导致部分估计噪声能量值比实际值大。尽管可以通过补偿消去这些过估值,但引入的误差同样会降低增强语音的整体质量。针对此问题,提出一种基于计算听觉场景分析(CASA)的时频掩蔽估计与优化算法。首先,通过直接判决(DD)算法估计先验信噪比(SNR)并计算初始掩蔽;其次,利用噪声与带噪语音在Gammatone频带内的互相关(ICC)系数来计算噪声的存在概率,结合带噪语音能量谱得到新的噪声估计,减少原估计噪声中的过估成分;然后,利用优化算法对初始掩蔽进行迭代处理以减少其中因噪声过估而存在的误差并增加其中的目标语音成分,在满足条件后停止迭代并得到新的掩蔽;最后,利用新的掩蔽合成增强语音。实验结果表明在不同的背景噪声下,相比优化前,新的掩蔽使增强语音获得了较高的主观语音质量(PESQ)和语音可懂度(STOI)值,提升了语音听感与可懂度。(本文来源于《计算机应用》期刊2019年10期)

何礼[4](2019)在《车载环境下的双通道语音增强技术研究》一文中研究指出随着经济的高速发展,人们消费水平日益提高,汽车已成为人们出行的一种主要代步工具。相比以触屏交互方式为主的传统车载人机交互,车载语音交互是一种更加安全、智能的方式。在理想情况下,驾驶员发出控制车载电子设备的命令语音,由车载语音识别系统根据识别出的内容来调用相应的车载电子设备。然而,真实的车载环境中存在各种车载背景噪声和副驾驶位人声干扰,严重降低车载语音交互体验。因此,语音增强算法作为前置处理方案是抑制噪声和干扰的一种有效且必要的途径,为后续的语音交互提供方便。相比传统单通道语音增强算法,麦克风阵列能够利用信号的空间信息,具有更好的噪声抑制效果。本文主要研究了车载环境下的双通道语音增强技术。主要工作内容如下:首先,针对传统双通道语音增强算法不适用于车载声学环境的问题,本文首先基于观测信号互相关功率谱相位的方式,估计信号时频点由目标声源或干扰声源主导的后验概率,从而抑制副驾驶位干扰的影响。然后进一步结合基于深度神经网络估计的语音存在概率,提高对车载背景噪声的鲁棒性。最后,将混合的语音活动检测信息应用于波束形成、阻塞矩阵和自适应噪声消除器等模块的设计中。其次,针对传统的后置滤波算法无法有效消除车载环境下波束形成输出中残留副驾驶位干扰和车载背景噪声的问题,本文深入分析了经典单通道和多通道后置滤波算法中噪声功率谱估计算法的性能,然后在其基础上,结合车载环境的特殊性提出基于变泄漏因子的改进算法,从而提升了车载环境下后置滤波器的性能。最后,根据真实车载环境数据的仿真实验结果证明,本文提出的基于相位和深度神经网络混合语音活动检测器的自适应波束形成算法,以及基于变泄露因子噪声功率谱估计的后置滤波算法能够减少期望信号的失真,同时有效抑制车载背景噪声和副驾驶位干扰,具有更好的降噪效果。(本文来源于《重庆邮电大学》期刊2019-06-02)

刘园[5](2019)在《基于监督学习的单通道语音增强算法研究》一文中研究指出语音增强是涉及语音人机交互、语音识别的重要技术。在实际的应用环境中,语音容易受到噪声和混响的影响,导致语音识别性能的下降。随着监督学习模型训练算法的不断发展,基于监督学习的语音增强算法相较于传统的语音增强方法显示了较大的优越性。本文以监督学习为基础,分别研究了在噪声和混响环境下基于监督学习的语音降噪和解混响算法,并在AGV语音识别控制系统中进行实现,具有较高的理论意义和工程应用价值。首先,阐述了语音降噪和解混响技术的国内外研究现状,介绍了监督学习的模型训练方法以及语音降噪和解混响的理论基础,对噪声和混响环境下基于监督学习的语音识别整体方案进行了设计。着重分析了常用语音降噪和语音解混响算法存在的不足,明确本文研究的关键内容是基于监督学习的语音降噪和语音解混响。其次,针对监督学习中的NMF语音降噪算法在低信噪比非稳定噪声环境下存在噪声残留的问题,提出一种基于PM-RNMF的单通道语音降噪算法。该算法将心理声学掩蔽特性应用于NMF语音降噪算法中,对不同频率位采用不同的掩蔽阈值,通过阈值约束残余噪声能量和语音失真能量,同时结合SPP进行感知增益修正重构NMF算法。实验结果表明,利用PM-RNMF算法得到的增强语音的PESQ、SDR值较算法NMF、RNMF、PM-DNN都有所提高。然后,针对NMF算法无法很好地描述混响信号到纯净语音之间复杂的非线性关系和深度神经网络类的算法在混响条件下训练数据量较大的问题,提出一种基于DNN-NMF的语音解混响算法。该算法首先使用NMF算法对混响信号进行预处理得到混响信号的激活系数矩阵,然后将其作为深度神经网络的输入,对混响信号的激活系数矩阵进行再优化,最后利用优化后的激活系数矩阵重构语音信号。实验结果表明,DNN-NMF算法和DNN、SNMF、LSTM-NMF相比具有更好的解混响性能。最后,构建噪声和混响环境下的AGV语音识别系统,分别实现在不同噪声和不同混响环境下的AGV语音控制指令识别实验。实验结果表明,PM-RNMF降噪算法和DNN-NMF解混响算法分别在不同噪声环境下和不同混响环境下都具有较好的语音识别性能。(本文来源于《重庆邮电大学》期刊2019-05-29)

时文华,张雄伟,邹霞,孙蒙[6](2019)在《利用深度全卷积编解码网络的单通道语音增强》一文中研究指出针对传统的神经网络未能对时频域的相关性充分利用的问题,提出了一种利用深度全卷积编解码神经网络的单通道语音增强方法。在编码端,通过卷积层的卷积操作对带噪语音的时频表示逐级提取特征,在得到目标语音高级特征表示的同时逐层抑制背景噪声。解码端和编码端在结构上对称,在解码端,对编码端获得的高级特征表示进行反卷积、上采样操作,逐层恢复目标语音。跳跃连接可以很好地解决极深网络中训练时存在的梯度弥散问题,本文在编解码端的对应层之间引入跳跃连接,将编码端特征图信息传递到对应的解码端,有利于更好地恢复目标语音的细节特征。对特征融合和特征拼接两种跳跃连接方式、L_1和L_2两种训练损失函数对语音增强性能的影响进行了研究,通过实验验证所提方法的有效性。(本文来源于《信号处理》期刊2019年04期)

李煦,王子腾,王晓飞,付强,颜永红[7](2019)在《采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强》一文中研究指出为了从带噪信号中得到纯净的语音信号,提出了一种采用性别相关模型的单通道语音增强算法。具体而言,在训练阶段,分别训练了与性别相关的深度神经网络-非负矩阵分解模型用于估计非负矩阵分解中的权重参数;在测试阶段,提出了一种基于非负矩阵分解和组稀疏惩罚的算法用于判断测试语音中说话人的性别信息,然后再采用对应的模型估计权重,并结合已训练好的字典进行语音增强。实验结果表明所提算法在噪声抑制量及语音质量上,均优于一些基于非负矩阵分解的算法和基于深度神经网络的算法。(本文来源于《声学学报》期刊2019年02期)

张星[8](2019)在《改进NMF单通道语音增强算法》一文中研究指出针对语音与噪声在频带内存在高度重迭而使传统方法性能下降的问题,提出了一种单麦克风信道的改进NMF语音增强算法,算法在传统非负矩阵分解方法计算的用于增强的语音和噪声的基矩阵基础上,通过对数谱估计方法对时频谱图中的语音存在概率进行估计,以此对NMF识别基进行自适应补偿,从而提高识别基语音增强性能,然后通过残差消除进一步提高语音质量,实验结果表明,与传统的基于单通道的NMF方法相比,文中算法获得了更好的语音增强性能。(本文来源于《机械设计与制造》期刊2019年01期)

李艳生,刘园,张毅[9](2019)在《基于感知掩蔽的重构非负矩阵分解单通道语音增强算法》一文中研究指出针对非负矩阵分解(NMF)语音增强算法在低信噪比(SNR)非稳定环境下存在噪声残留的问题,提出一种基于感知掩蔽的重构NMF(PM-RNMF)单通道语音增强算法。首先,将心理声学掩蔽特性应用于NMF语音增强算法中;其次,对不同频率位采用不同的掩蔽阈值,建立自适应感知掩蔽增益函数,通过阈值约束残余噪声能量和语音失真能量;最后,结合语音存在概率(SPP)进行感知增益修正,重构NMF算法,以此建立新的目标函数。仿真结果表明,在不同SNR的3种非稳定噪声环境下,与NMF、重构NMF(RNMF)、感知掩蔽深度神经网络(PM-DNN)算法相比,PM-RNMF算法的感知语音质量评估(PESQ)平均值分别提高了0.767、0.474、0.162,信源失真比(SDR)平均值分别提高了2.785、1.197、0.948。实验结果表明,无论是在低频还是高频PM-RNMF有更好的降噪效果。(本文来源于《计算机应用》期刊2019年03期)

余亮,吴海军,蒋伟康[10](2018)在《结合波束形成和GAN网络的多通道语音增强研究》一文中研究指出后端滤波处理是多通道语音增强系统中一种比较常用的技术,其目的是为了进一步提高语音增强系统的性能,提高波束形成后的输出信噪比。但是,常用的后滤波方法需要相当繁琐的参数调整过程才能实现噪声抑制和语音质量之间的合理权衡。本文提出一种基于最小方差无畸变(MVDR)波束形成和生成对抗深层神经网络相结合的多通道语音增强算法。前端使用波束形成器对信号进行初步增强;后端滤波处理采用生成对抗深层神经网络,避免了繁琐的参数调整过程。实验系统是通过MATLAB和Tensor Flow仿真实现,结果证明了该方法的有效性。(本文来源于《噪声与振动控制》期刊2018年S2期)

单通道语音增强论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

如何从带噪语音信号中恢复出干净的语音信号一直都是信号处理领域的热点问题。近年来研究者相继提出了一些基于字典学习和稀疏表示的单通道语音增强算法,这些算法利用语音信号在时频域上的稀疏特性,通过学习训练数据样本的结构特征和规律来构造相应的字典,再对带噪语音信号进行投影以估计出干净语音信号。针对训练样本与测试数据不匹配的情况,有监督类的非负矩阵分解方法与基于统计模型的传统语音增强方法相结合,在增强阶段对语音字典和噪声字典进行更新,从而估计出干净语音信号。该文首先介绍了单通道情况下语音增强的信号模型,然后对4种典型的增强方法进行了阐述,最后对未来可能的研究热点进行了展望。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

单通道语音增强论文参考文献

[1].邓贺元,刘加,夏善红,彭春荣.一种联合频谱和空间特征的深度学习多通道语音增强算法[J].电子测量技术.2019

[2].叶中付,朱媛媛,贾翔宇.基于字典学习和稀疏表示的单通道语音增强算法综述[J].应用声学.2019

[3].葛宛营,张天骐.基于掩蔽估计与优化的单通道语音增强算法[J].计算机应用.2019

[4].何礼.车载环境下的双通道语音增强技术研究[D].重庆邮电大学.2019

[5].刘园.基于监督学习的单通道语音增强算法研究[D].重庆邮电大学.2019

[6].时文华,张雄伟,邹霞,孙蒙.利用深度全卷积编解码网络的单通道语音增强[J].信号处理.2019

[7].李煦,王子腾,王晓飞,付强,颜永红.采用性别相关的深度神经网络及非负矩阵分解模型用于单通道语音增强[J].声学学报.2019

[8].张星.改进NMF单通道语音增强算法[J].机械设计与制造.2019

[9].李艳生,刘园,张毅.基于感知掩蔽的重构非负矩阵分解单通道语音增强算法[J].计算机应用.2019

[10].余亮,吴海军,蒋伟康.结合波束形成和GAN网络的多通道语音增强研究[J].噪声与振动控制.2018

标签:;  ;  ;  ;  

单通道语音增强论文-邓贺元,刘加,夏善红,彭春荣
下载Doc文档

猜你喜欢