话者辨识论文-郑建炜,王万良,郑泽萍

话者辨识论文-郑建炜,王万良,郑泽萍

导读:本文包含了话者辨识论文开题报告文献综述及选题提纲参考文献,主要关键词:相关向量机,高斯混合模型,话者辨别,支持向量机

话者辨识论文文献综述

郑建炜,王万良,郑泽萍[1](2010)在《GMM与RVM融合的话者辨识方法》一文中研究指出相关向量机(RVM)分类法使用概率输出克服了支持向量机(SVM)识别速率低的缺点,并且具有更好的稀疏性。但在与文本无关的话者辨别中,大量训练样本数据体现了RVM在模型训练时计算量与内存需求过大的缺点。针对以上特点,提出基于GMM统计特征参数与RVM融合的与文本无关的语者辨别系统,既有效地提取话者特征信息,解决大样本数据下的RVM训练问题,又结合统计模型鲁棒性高和分辨模型辨别效果好的优点。实验结果证明,该系统比基本的GMM系统具有更优的错误辨别率,比GMM/SVM系统具有更高的稀疏性。(本文来源于《计算机工程》期刊2010年15期)

罗海风,龙长才[2](2009)在《多话者环境下说话人辨识听觉线索研究》一文中研究指出1引言在多个说话人语音以及复杂的声环境中,辨识和跟踪某一个说话人的语音并提取语音信息,是语音识别技术走向应用面临的重要课题和难题。技术上是从接收的语音信号中提取某些特征,利用这些特征和一定的判据将语音信号进行分类。迄今,所取得的效果并不令人满意。但是,听觉系统却有很(本文来源于《中国声学学会2009年青年学术会议[CYCA’09]论文集》期刊2009-10-01)

毕竞[3](2008)在《应用于视频内容分析的话者辨识系统》一文中研究指出随着多媒体、互联网、大容量存储等技术的不断发展,数字化视频开始进入人们的日常生活。为发挥海量视频数据的资源共享优势,支持视频非线性编辑、语义理解和高效检索,完善和发展视频内容分析技术迫在眉睫。经过早期基于图像信息的研究,越来越多的研究者发现由于机器视觉和模式识别的发展限制,自动提取视频的语义是比较困难的。音频作为视频文档中包含的另外一种类型时间媒体,是一种可为视觉信息提供重要补充的信息源。音频流所包含的语义信息往往比图像流丰富,提取语义信息也更加直观方便。因此,基于音频的视频内容分析技术,近年来已逐渐成为基于内容多媒体检索和过滤研究的热点。本文提出了一种应用于视频内容分析的话者辨识系统。相对于通用的话者辨识系统,论文研究考虑以下几点:首先,从视频数据中提取的音频流中不仅包含静音和语音,还包括音乐和背景音;其次,视频内容中的话者数目无法预先得知,系统也无法直接获得用来训练话者模型的纯净的话者数据;最后,视频内容中大量存在的各种噪声将加剧训练数据和测试数据的失配,严重影响话者辨识系统的性能。基于上述实际系统中的考虑,本文提出的应用于视频内容分析的话者辨识系统架构主要包括:基于规则和支持向量机的音频分类与分割;基于谱聚类的话者聚类和基于高斯混合模型的话者辨识;基于谱减法的语音增强。围绕应用于视频内容分析的话者辨识系统,本文的主要工作包括:(1)本文对话者辨识的原理和算法进行了深入的研究和分析,实现了基于高斯混合模型的话者辨识,验证了该方法在应用于视频内容分析的话者辨识系统中的有效性。(2)SVM是建立在VC维,泛化性能和推广能力之上的一种理论,对SVM中的相关概念(支持向量、核函数等)进行了介绍。根据本文中实际系统的考虑,提出并实现了基于叁个支持向量机的分类器架构,验证了该架构的可用性。(3)本文对语音增强的原理和算法进行了分析和比较,实现了谱减法在应用于视频内容分析的话者辨识系统中的应用,验证了方法的可用性。实验数据来源于新闻视频、访谈视频和电影视频。实验结论证明了本文提出系统的有效性。(本文来源于《北京邮电大学》期刊2008-03-01)

刘鸣,戴蓓倩,李辉,陆伟,李霄寒[4](2002)在《鲁棒性话者辨识中的一种改进的马尔科夫模型》一文中研究指出为了提高话者识别系统的噪声鲁棒性 ,本文对CHMM进行了改进 ,将每帧特征参数之间的差分参数来对应状态之间的转移 ,从而使帧间信息在模型中得到了体现 .利用改进后的CHMM模型对不同的特征参数携带的信息进行信息融合 .使得在强噪环境下 ,鲁棒性好的特征参数起主导作用 ,而在噪声比较小的环境下 ,精细度高的特征参数起主导作用 .实验证明 ,这种改进的马尔可夫模型明显提高语音识别系统的鲁棒性能 ,这种技术具有良好的发展和应用前景(本文来源于《电子学报》期刊2002年01期)

戴明扬,徐柏龄[5](2001)在《基于听觉模型的话者特征参数提取及其在噪声背景下的话者辨识》一文中研究指出本文基于人耳听觉模型提出了一种鲁棒性的话者特征参数提取方法.该种方法中,首先由Gammatone听觉滤波器组和Meddis内耳毛细胞发放模型获得表征听觉神经活动特性的听觉相关图。由听觉神经脉冲发放的锁相特性和双声抑制特性,我们将听觉相关图每个频带中的幅值最大频率分量作为表征当前频带特性的特征参量,于是所有频带的特征参量便构成了表征当前语音段特性的特征矢量;我们采用DCT变换进一步消除各个特征参量之间的相关性,压缩特征矢量的维数.有效性试验表明,该种特征矢量基本上反映了输入语音的谱包络特性;抗噪声性能实验表明,在高斯白噪声和汽车噪声干扰下,该种特征参数比LPCC和MFCC有较个的相对失真;基于矢量量化的文本无关话者辨识表明,对于叁种类型的噪声干扰该种特征参数在低信噪比下都获得了较好的识别结果(本文来源于《应用声学》期刊2001年06期)

张松滨[6](1991)在《应用对数面积比参数做非限定内容的话者辨识》一文中研究指出本文应用对数面积比参数,进行了非限定内容话者辨识的实验研究。应用语噪声法获得了稳定的个人语音长时间平均谱。实验用语音为任意找来的10s左右的一小段文章。16名男性、4名女性参加了实验,平均识别率为80%,且话者落在前5名候选人中的概率为95%以上。(本文来源于《哈尔滨电工学院学报》期刊1991年01期)

话者辨识论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

1引言在多个说话人语音以及复杂的声环境中,辨识和跟踪某一个说话人的语音并提取语音信息,是语音识别技术走向应用面临的重要课题和难题。技术上是从接收的语音信号中提取某些特征,利用这些特征和一定的判据将语音信号进行分类。迄今,所取得的效果并不令人满意。但是,听觉系统却有很

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

话者辨识论文参考文献

[1].郑建炜,王万良,郑泽萍.GMM与RVM融合的话者辨识方法[J].计算机工程.2010

[2].罗海风,龙长才.多话者环境下说话人辨识听觉线索研究[C].中国声学学会2009年青年学术会议[CYCA’09]论文集.2009

[3].毕竞.应用于视频内容分析的话者辨识系统[D].北京邮电大学.2008

[4].刘鸣,戴蓓倩,李辉,陆伟,李霄寒.鲁棒性话者辨识中的一种改进的马尔科夫模型[J].电子学报.2002

[5].戴明扬,徐柏龄.基于听觉模型的话者特征参数提取及其在噪声背景下的话者辨识[J].应用声学.2001

[6].张松滨.应用对数面积比参数做非限定内容的话者辨识[J].哈尔滨电工学院学报.1991

标签:;  ;  ;  ;  

话者辨识论文-郑建炜,王万良,郑泽萍
下载Doc文档

猜你喜欢