导读:本文包含了语音确认论文开题报告文献综述及选题提纲参考文献,主要关键词:说话人确认,短语音,高斯混合模型,身份向量
语音确认论文文献综述
王铮,傅山[1](2019)在《基于改进身份向量提取的短语音说话人确认》一文中研究指出针对现有i-vector说话人确认系统在测试语音为短语音时性能下降的问题,对短语音i-vector估计的不确定性进行分析,改进了i-vector提取中Baum-Welch统计量的计算.该方法利用赋予权重的历史测试信息以及通用背景模型中的参数信息来增加用于短语音Baum-Welch统计量计算的说话人个性信息.将改进统计量用于i-vector提取,针对不同时长短语音的实验表明,新系统的性能优于当前i-vector系统,等错误率(EER)和检测代价函数最小值(min DCF)分别下降了13~19%和8~23%.(本文来源于《小型微型计算机系统》期刊2019年11期)
[2](2018)在《KD436:基于动态密码语音的身份确认系统及方法》一文中研究指出通过对动态密码语音中的密码内容及请求人身份的双重识别,实现对操作人身份合法性的双重验证。需要认证时,系统会随机产生一组动态码(如6位或8位数字)要求用户朗读,系统对用户读出的声音进行语音识别,并将识别的内容与发出的动态码数字进行比对,同时系统对用户的发音进行声纹比对,两种认证手段都通过时才判断认证通过。专利号:ZL 2013 1 0123555.0(本文来源于《科技创新与品牌》期刊2018年01期)
张圣,郭武[3](2016)在《采用通用语音属性建模的说话人确认》一文中研究指出本文提出采用通用语音属性的方法来进行自动语音识别的声学模型建模,并将其应用到说话人识别的全变量空间建模中.首先将发音方式和发音位置两种属性联合构成通用语音属性的基本单元用于声学建模,在此基础上采用深度学习算法建立语音识别的声学模型;用此声学模型来获得说话人识别的每帧声学特征对应的后验概率,将这个后验概率作为全变量空间分析的零阶统计量,在此基础上完成说话人识别中的i-vector建模及识别.在NIST 2012的说话人识别评测任务中,提出的算法能够取得与主流算法相当的识别水平.进一步,当我们把基于通用语音属性的DNN/i-vector系统与目前主流的系统进行得分域的融合,相对于最好的单系统,男声等错误率平均下降了12.1%,女声等错误率平均下降了14.4%.(本文来源于《小型微型计算机系统》期刊2016年11期)
陈丽萍[4](2016)在《说话人确认中语音段差异建模相关问题的研究》一文中研究指出随着说话人确认技术发展至今,复杂信道下的长时语音段的说话人确认技术已经日趋成熟,为其实用化奠定了基础。其中,建立在高斯混合模型-通用背景模型的基础之上的全局段差异建模,建模方式简便,在应用于说话人确认系统的过程中,结合高效的后端非说话人差异补偿模型,如概率线性区分性分析模型(Probabilistic Linear Discriminant Analysis, PLDA),自提出以来就成为了当前说话人领域的主流技术。全局段差异建模的思想在于将特定的语音段中所包含的异于所有语音段共同包含的共性信息(主要为发音内容),即该语音段的段差异(Session Variability),用一个固定长度的低维向量进行表达,即段差异向量。段差异向量中包含了发音内容以外的差异,包括非说话人差异(主要为信道差异)和说话人差异。在段差异向量之上,需要对其进一步建模消除说话人无关的差异对说话人辨认的影响,因此,全局段差异建模的核心问题在于提取语音段中的段差异以及在后端对非说话人差异进行补偿,从而提取到语音段中有利于说话人判别的说话人信息。本文针对段差异的建模和说话人差异的提取及判别方面进行了一系列的研究,主要内容如下:第一,通过全局段差异建模虽然能够获得关于语音段中的段差异的整体上的表达,但是却忽略了存在于语音段中的细节性的差异,因此我们提出利用局部段差异建模的方法提取存在于语音段中的不能被全局段差异建模所表达出的局部段差异,用于说话人确认。在局部段差异建模中,我们分别针对每一个高斯和每一个声学特征的维度中包含的段差异进行建模提取,即高斯局部差异建模和维度局部差异建模。进一步的,在维度局部差异建模中,我们提出对声学特征的维度进行不同方式的绑定,然后再提取绑定的维度组合中的局部段差异。由于局部段差异模型与全局段差异模型分别从不同的角度对语音中的段差异进行建模,二者之间存在一定的互补能力,使得我们可以在系统和模型两个层面分别融合,从而获得比单独的模型更优的性能。第二,在全局段差异建模中,当用于测试和模型训练的语音段在文本上保持一致时,全局段差异建模对于语音的段差异差异拥有良好的建模能力,如长时语音段的文本无关以及短时语音段的文本相关的说话人确认。而当存在文本不匹配的问题时,例如针对短时短时语音段的文本无关的说话人测试中,由于全局段差异建模无法针对文本进行段差异建模,导致说话人的判别受到文本差异的影响。我们在局部段差异建模的思想基础之上,借助语音识别中的基于深层神经网络的声学模型对语音帧以音素状态进行聚类,并以此为基础提取音素相关的局部段差异。在该建模方式中,我们分别采用单音素和叁音素声学模型,在针对不同的音素提取到的局部段差异向量之上,根据测试用的语音段中包含的音素对局部段差异向量进行挑选并用于说话人判别,由此进行音素相关的说话人判别,解决短时语音段中的文本不匹配问题。在音素之上,我们进一步探索利用语音识别器的识别结果,以词为对象进行段差异提取并判别说话人,完善基于发音内容的段差异提取及说话人判别的研究。第叁,当前基于全局段差异模型的后端信道补偿的主流技术PLDA是一个线性的概率模型,在本文中,我们针对后端信道补偿模型进行了一系列的改进研究。首先,对于PLDA,我们提出一个与现有的说话人得分计算模型等价的建立在自适应的说话人模型上的得分计算模型,在此模型基础之上,针对多语音段注册说话人的任务中,不同说话人注册语音段数量不同以及同一个说话人的不同语音段之间不同程度的重迭的现象,提出利用说话人因子的先验分布参数进行模型注册以取代传统的后验分布参数,以此来解决这两个问题对于得分计算带来的影响。此外,我们在说话人自适应模型的基础之上,引入信道自适应,在每一组测试中,将PLDA模型自适应到测试语音段的信道空间之中,进而计算得分,通过这种方式,我们可以考虑到不同测试的具体信息,从而提升系统的性能。其次,我们引入深层神经网络用来提取存在于全局段差异向量中的非线性的深层说话人信息,用于说话人判别,达到改善系统性能的目的。(本文来源于《中国科学技术大学》期刊2016-05-01)
谢文宾[5](2016)在《基于语音特征学习的说话人确认与帕金森诊断》一文中研究指出语音特征是一种重要的生物标记物,已经广泛用于说话人识别、疾病诊断等领域。其中,说话人确认与帕金森疾病诊断是语音特征近年来应用研究的热点和难点。虽然相关研究取得了许多正面的进展,极大的显示了其应用潜力,但在特征压缩、样本优选、分类器优化等方面,还存在一定的问题,而这些方面都是提高语音特征学习质量的重要环节。基于此,本文在相关课题资助下,针对说话人确认和帕金森疾病诊断这两个具体应用问题,研究了其语音特征压缩、样本优选、分类器优化等环节,提出了叁种改进算法,实现了识别性能的提高。相关主要工作如下:(1)提出了一种多类型语音特征封装式进化特征选择框架算法,同时,基于该框架算法,给出了一种具体的实现方式—四类型语音特征封装式遗传特征选择算法,为该框架算法给出了具体实现范例。本框架算法的提出,有利于解决目前缺乏相关方法标准化框架研究的问题。(2)提出了一种极低信噪比环境下基于多类型语音特征学习的说话人确认算法。首先设计了低信噪比下提取多种类型语音特征的方法,尤其是引入了基音频率提取算法。然后设计了基于CAGA和GMM-UBM的特征选择分类集成模型,通过对提取的特征进行选择实现融合,用于说话人确认。本算法的提出实现了面向极低信噪比环境下的说话人确认算法,有助于解决在这一应用领域中存在的语音提取质量低的问题。(3)提出了基于语音样本重复剪辑算法和随机森林的帕金森症诊断算法,通过样本重复剪辑算法实现对语音样本的优选,通过引入随机森林实现对样本的集成学习。该算法实现了对语音样本的优选,提高了样本的质量,将为目前基于语音的帕金森症诊断研究提供新的研究思路和方法参考。本文为相关研究者提供了方法参考,为提高基于语音特征学习的模式分类研究提供了新的思路,具有重要的研究意义。(本文来源于《重庆大学》期刊2016-04-01)
许云飞,周若华,颜永红[6](2014)在《基于PLDA的多信道多语音说话人确认研究》一文中研究指出在NIST SRE 2012年评测和实际应用中,可以用说话人的多个语音样本来注册说话人模型,并且这些语音样本取自于各种各样的信道。本文基于PLDA,尝试了多种打分方法,并提出一种新的得分规整技术,在NIST SRE 2012核心测试集上,EER平均提升26.0%,MinCost平均提升12.4%。(本文来源于《网络新媒体技术》期刊2014年01期)
杨顺辽[7](2012)在《基于说话人确认系统的语音处理综合实验》一文中研究指出针对传统语音处理课程教学中,实验内容相互独立没有形成有机整体的特点,以具有一定实用价值的问题——说话人确认出发,使计算机能够"闻声识人"。将先修课程与本课程、课内与课外实验、基础与扩展实验相结合,培养学生综合运用有关知识和系统分析的习惯。通过基于VisualC++编程完成有关实验内容,使学生在掌握有关基本理论和方法的同时,能直观地感受各处理环节的必要性以及在实际问题中的设计方法,从而提高学生分析和解决实际问题的能力。同时,也增加了实验的综合性、趣味性和可拓展性。(本文来源于《高校实验室工作研究》期刊2012年03期)
高二中,李辉,郭立,许敏强[8](2011)在《基于语音质量的话者确认方法研究》一文中研究指出针对传统的手机电话语音的说话人确认中,未考虑训练语音和测试语音信号本身质量对识别效果的影响问题,采用语音质量测量的方法对GMM-UBM方法进行改进,提出了利用多维基音参数,将基音偏离作为语音信号质量测量准则的方法,对GMM-UBM系统短时谱参数评分过程进行修正,得到基于语音信号质量的评分方法.通过在NIST SRE 2006 1side数据库中男性话者的实验表明,采用语音质量的评分方法能够有效提高系统的识别率,系统的等误识率和检测代价函数都有一定程度的改进.(本文来源于《中国科学技术大学学报》期刊2011年11期)
高二中[9](2011)在《对话电话语音的话者确认研究》一文中研究指出文本无关的话者确认是目前说话人识别中的一个重要研究方向,为此,美国国家标准与技术署从1996年开始组织了说话人识别评测,用于衡量当前说话人识别技术的发展水平。他为每个参赛单位提供了统一的数据,测试平台以及评测规则等,并且设立了许多子任务,用于探索和研究不同语音条件下的研究方法。对话电话语音的说话人确认作为NIST SRE的一个子任务,具有重要的研究意义。本文从基本的单话者话者确认技术入手,介绍了单说话人确认的系统框架并且对其中各个部分予以详细的介绍,随后,根据对话语音话者确认与单话者确认上的异同,从两个方面对识别系统进行了深入的工作。针对对话语音说话人确认与单话者确认的不同点,对话语音话者确认需要将语音先切分聚类,该操作是将对话语音话者确认转化为常规单话者确认的关键,因此,本文详细介绍了目前常用的切分聚类方法,以及其中的不足之处,并且给出了将其合适的应用于确认的一些改进方案。针对对话语音话者确认与单话者确认的共同点,单话者确认系统性能的改进措施也会使得对话语音确认系统的性能相应得到改进,本文借用语音质量测量的概念,引入了新的评分准则,对系统的识别性能有较大程度的提高。本文提出了两种适合于后续确认过程的对初步切分聚类语音的再处理方法,一,提出了二次提纯的方法,由于语音的纯净度是影响识别性能的关键因素之一,对原始语音的切分聚类结果不再追求寻找准确的说话人转化点,而是追求话者语音切分的纯度,将纯净度低的语音部分予以抛弃,只保留纯净度高的部分作为确认系统的输入,从而提高确认系统的性能。二,采用基于融合策略的切分方法,将利用不同的方法切分的结果通过对比,找出判定结果相同的部分,利用此部分语音分别训练两个话者的模型,对判定结果不同的部分重新归类,最终得到准确的两个话者的语音。本文利用语音质量测量的概念,提出了GMM-UBM框架下新的基于语音信号质量的系统评分方法,通过利用辅助信息,对每一条测试语音动态的衡量其与话者模型的适配度(质量值),并利用所得到的该值调整系统的评分,使得系统的识别性能有了较大的改进。本文建立了一个性能稳定的对话电话语音的说话人确认系统,大量实验表明,所建立的系统具有良好的效果和鲁棒性。(本文来源于《中国科学技术大学》期刊2011-05-01)
江雪峰[10](2011)在《关键词识别中语音确认技术的研究》一文中研究指出关键词识别是语音识别中的一个很重要研究领域,关键词识别在语音识别中灵活性好,而且具有很高的应用价值。在许多自动语音识别应用程序中常常需要对验证部分假设识别的正确性提供一种确认机制。而语音确认正是这样一个过程,它用来验证从语音识别器识别出来结果的可靠性。本文对几种关键词检测技术和语音确认技术进行了研究,这些技术都有很广的应用。本文的研究重点为关键词识别系统的检出策略和确认方法。在对垃圾模型关键词检测技术的研究下,提出了一种在HMM训练阶段在连续语音中定义竞争集的方法,该方法在恒定的时间内,回朔每一个单词结束的有效相对路径并与真正的语音片段相比较来确定每个特定的分段是否应该属于竞争集;在viterbi搜索中使用了一趟策略,与以前的两趟策略,这使得即节省了空间又有效地提高了确认的准确度,并且还可以使用语音确认来纠正一些识别错误。在研究假设检验中,提出了基于竞争模型的加权似然比融合算法,这种算法区分了不同竞争集的得分,有效地提高了识别效果。最后提出VQ与SVM结合的方法来进行语音纠错,这样既充分利用了SVM在分类上的优势,VQ的运算速度又比较快,也避免了将待测语音用所有SVM模板分类造成的庞大运算量。通过一系列实验证明了所提出的方法在一定程度上优于改进前方法。(本文来源于《华北电力大学(北京)》期刊2011-03-01)
语音确认论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
通过对动态密码语音中的密码内容及请求人身份的双重识别,实现对操作人身份合法性的双重验证。需要认证时,系统会随机产生一组动态码(如6位或8位数字)要求用户朗读,系统对用户读出的声音进行语音识别,并将识别的内容与发出的动态码数字进行比对,同时系统对用户的发音进行声纹比对,两种认证手段都通过时才判断认证通过。专利号:ZL 2013 1 0123555.0
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音确认论文参考文献
[1].王铮,傅山.基于改进身份向量提取的短语音说话人确认[J].小型微型计算机系统.2019
[2]..KD436:基于动态密码语音的身份确认系统及方法[J].科技创新与品牌.2018
[3].张圣,郭武.采用通用语音属性建模的说话人确认[J].小型微型计算机系统.2016
[4].陈丽萍.说话人确认中语音段差异建模相关问题的研究[D].中国科学技术大学.2016
[5].谢文宾.基于语音特征学习的说话人确认与帕金森诊断[D].重庆大学.2016
[6].许云飞,周若华,颜永红.基于PLDA的多信道多语音说话人确认研究[J].网络新媒体技术.2014
[7].杨顺辽.基于说话人确认系统的语音处理综合实验[J].高校实验室工作研究.2012
[8].高二中,李辉,郭立,许敏强.基于语音质量的话者确认方法研究[J].中国科学技术大学学报.2011
[9].高二中.对话电话语音的话者确认研究[D].中国科学技术大学.2011
[10].江雪峰.关键词识别中语音确认技术的研究[D].华北电力大学(北京).2011