导读:本文包含了说话人认证论文开题报告文献综述及选题提纲参考文献,主要关键词:说话人认证系统,语音唇动一致性,人脸认证,多模态融合
说话人认证论文文献综述
张星伟[1](2017)在《基于语音唇动一致性的多模态说话人身份认证系统》一文中研究指出如今,信息安全越来越成为人们关注的焦点,单一的密码验证早已被时代所淘汰,主流的身份验证手段是以“what you know”和“what you have”为主,如手机验证码、邮箱验证等辅助验证方式。而人类本身的很多生物特征从“who you are”的原则出发,具有唯一性和可测量性,并且具有便于采集、认证隐蔽、识别效果好和冒认成本高的特点。因此,生物信息可作为新的认证模式进行应用。本实验室内研制的远程说话人认证系统是以中国老年人社保金领取中身份认证功能为需求背景的项目,具有声纹认证、抗录音回放攻击等主要功能,本文将在原有的说话人认证系统之上,增加语音唇动一致判断、假体检测、人脸识别等功能,进一步提升该系统的准确性和鲁棒性,保证用户的信息安全。本文的具体工作如下:1、说话人认证系统的整体框架再设计,在原有的系统框架上进行改进,设计语音唇动一致性检测模块、人脸认证模块、多模态融合认证模块,重新调整了系统内功能模块间的接口,使得系统可以完整运行并实现认证功能。2、语音唇动一致性算法的工程实现,将音视频数据通过预处理模块、特征提取模块、得分判决模块的处理,每个模块包括图像和音频两条线路,根据类型不同对应不同接口,得到置信度评分,通过对比阈值完成语音唇动一致性判断。另外,在原有算法的基础上,进行了部分改良使之更加适应于当前说话人系统。3、人脸认证方法设计,本系统基础的人脸识别方法是基于Fisher准则,利用LDA算法进行数据分类,通过计算未知样本和已有样本之间的欧式距离作为判定依据。本文在人脸认证基础上,尝试了与人脸识别共同计算的方法,并从实验结果证明,新的融合方法一定程度上提升了原有方法的准确性。4、多模态融合认证方法的应用,利用声纹认证模块和人脸识别模块的结果参数进行进一步准确性提升。本文采用自适应加权融合方法,利用阈值的改变影响系统认证决策的侧重面,同时可以一定程度上克服声纹与人脸认证的天生缺陷。(本文来源于《华南理工大学》期刊2017-04-13)
杨静波[2](2016)在《融合说话人识别和人脸识别的身份认证》一文中研究指出在个人身份信息安全问题突显的今天,单模态生物特征下的身份认证技术因其自身的局限性,已经不能够满足人们的需要。利用多模态生物特征进行身份认证的技术已成为当今社会的研究热点。论文实现了说话人识别和人脸识别,并根据语音的信噪比和外界光照条件在决策层对说话人识别的结果和人脸识别的结果进行融合,以提高身份认证的正确率,从而弥补说话人识别和人脸识别对环境噪声和环境光照条件的不同要求。论文的主要工作如下:1、实现了说话人识别。采用基于高斯混合模型(Gaussian Mixture Model,GMM)的说话人识别方法,对不同说话人的训练语料经过预加重、分帧、加窗后,提取训练语料的梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)作为特征向量,训练得到每个说话人的声学模型,组成所有说话人的GMM模型库。在识别阶段,对输入的待识别说话人的语音信号,提取声学特征MFCC,并将特征向量与GMM模型库进行匹配,并根据匹配概率获得识别结果。实验结果表明,本文实现的说话人识别能够在纯净语音下达到92.8%的识别率。2、实现了人脸识别。采用GMM分类器进行人脸识别。在训练阶段,首先对人脸进行图像预处理,然后采用基于肤色人脸区域检测方法完成人脸检测,接着对人脸图像进行归一化,并采用基于主成分分析的特征提取算法提取人脸特征,最后根据特征训练得到每个人的GMM,从而生成GMM人脸模型库。识别阶段,对识别者的人脸图像经过人脸检测和特征提取后,将得到的人脸特征向量与GMM人脸模型库进行概率匹配,设定系统分类阈值后,获得识别结果。实验表明,本文实现的人脸识别能够在人脸图像高信噪比的条件下达到78.1%的识别率。3、实现了融合说话人识别和人脸识别的身份认证。采用决策层融合方法,将说话人识别和人脸识别的识别结果进行融合得到融合后的识别结果。设定了外界语音信号的信噪比阈值和图像亮度平均值阈值,采用分段式处理方法获得融合权重。当语音信号信噪比小于信噪比阈值,则身份认证依靠人脸识别完成;当外界图像亮度平均值小于亮度平均值阈值,则身份认证依靠说话人识别完成。实验结果表明,在高信噪比且良好光照的情况下,融合后的平均识别正确率比单独的说话人识别正确率提高了1.55%,比单独的人脸识别正确率提高了17.41%。在低信噪比且光照条件差的情况下融合后的平均识别正确率比单独人脸识别正确率提高了73.22%。(本文来源于《西北师范大学》期刊2016-05-01)
张洁凯[3](2015)在《远程说话人认证系统的设计与实现》一文中研究指出人类生物学特性一般具有唯一、可测量、遗传性或终身不变的特点。因此,生物识别技术相对传统的身份识别方法具有很大的优势。其中语音身份认证,在用户友好性,使用便利性、采集简易性、远程适应性和认证隐蔽性都表现更佳。而随着信息通信和互联网技术的快速发展,在移动手持设备与家庭计算机都十分普及的今天,具有远程访问功能的系统也受到广泛的关注。综合以上两点,研制一个远程的基于语音的说话人认证系统是具有重大的实用意义。以中国老年人社保金领取中身份认证功能需求为应用背景,针对目前说话人认证应用系统上的适用性不强、抗回放攻击弱,人机交互不友好、实际认证准确率不高的一系列问题,本文将研究设计一个新型的远程说话人认证系统。本文的工作如下:研究了有助于提高远程说话人认证系统服务质量的几点关键技术,包括说话人认证识别算法、抗回放攻击相关理论的模块设计与实现;以语音交互为基础的人机交互设计;为了提高实际应用说话人认证的准确率,在人机数据接口处对语音采集功能进行相关的质量控制策略设计;还有基于LAMP(Linux+Apache+My SQL+Python)架构的网络服务器设计。通过分析社保金领取对于认证功能的需求,设计出一套分为身份信息注册、认证数据注册、说话人认证叁个阶段的系统流程,并规划出由信息处理中心,电话中心和计算机客户端组成的系统框架。根据系统架构,从服务器到终端依次设计部署系统各个模块,具体工作包括:基于LAMP架构服务器的部署和基于My SQL的数据库设计和实现;基于Dialogic电话语音卡的电话控制中心的物理平台和软件平台的设计和实现;基于MFC框架的计算机C/S架构客户端的设计和实现。全面的系统评估,包括系统功能测试和性能测试,为远程说话人认证系统的研究提供可靠地实验数据,也确保了系统的实用性。(本文来源于《华南理工大学》期刊2015-04-20)
贺前华,潘伟锵,胡永健,朱铮宇,李艳雄[4](2015)在《说话人认证录音回放检测方法综述》一文中研究指出基于生物特征的身份认证已得到学术界及企业的高度重视,指纹、人脸识别应用已非常普遍,但对于非现场身份认证,语音相对其他生物特征,具有用户接受程度高、拾音设备简单、随时随地可用、数据量小、计算复杂度低等优势,因此基于声纹的身份认证系统应用越来越广泛。另一方面,由于录音回放攻击简单易行,不需要任何专业知识,且随着廉价、高质量的录音/播放装置的日益增多,回放录音与原始音的相似度越来越高,已成为声纹认证系统最主要的攻击手段之一,因此如何识别录音回放等攻击成为说话人认证系统必须面对的问题。本文对录音回放检测方法进入了全面的介绍,通过对各种方法的分析,表明其研究尚处于起步阶段,但需求日益旺盛。(本文来源于《数据采集与处理》期刊2015年02期)
代亚丽[5](2014)在《防录音回放攻击的说话人认证算法及系统设计》一文中研究指出说话人认证技术是声纹识别技术研究的热点之一,其在养老金保险系统、门禁系统、远程身份认证系统等信息安全方面都得到了广泛的应用。然而,随着科技的发展,录制说话人的声音比较方便且使用简单,使得录音回放攻击对说话人身份认证的信息安全系统产生了很大的威胁。因此,研究防止录音回放攻击的说话人认证系统具有非常大的意义和迫切的需求。本文在分析现有说话人识别算法的基础上,研究了基于GMM模型和HMM模型的说话人认证系统及其仿真实现;在分析区分回放语音与原始语音方法的基础上,提取能正确表达原始语音和回放语音之间区别的特征信息,研究了基于SVM的防录音回放攻击检测系统,最终设计实现了防回放攻击检测的说话人认证总体系统。本文的主要工作内容如下:(1)分析了现有说话人认证的预处理过程,重点对语音信号进行去噪和增强的算法进行研究,编程实现了该算法并分析了该算法的实现效果;实现了语音特征参数差分MFCC的提取,分析了现有防止录音回放攻击检测的方案,研究依据信道模式噪声的长时特征来区分两种语音的不同。(2)在研究GMM和HMM基本理论、最大期望算法、K-Means聚类算法、Baum-Welch算法、Viterbi算法及概率最大化等理论技术的基础之上,分别完成了基于GMM模型和基于HMM模型的说话人认证系统的设计,完成了整个系统的训练和识别,并通过实验验证并分析了两种模型在不同的模型参数、不同语音时长下的训练和识别性能对比分析。(3)在分析SVM分类原理算法的基础上,研究分析了语音信号的信道模式噪声的提取方法和提取信道模式噪声的长时特征的算法,并对提取出的特征值进行基于SVM的训练和分类,实验分析了该算法的可行性。(4)设计实现了说话人认证防录音回放攻击检测的总体系统。该系统能完成基于GMM和HMM模型的说话人认证的训练和识别过程,实现基于SVM的防录音回放攻击检测,并且实现基于GMM和HMM模型的说话人认证与前端防回放攻击检测和后端防回放攻击检测的不同结合,并完成了包括特征提取效率、训练效率、识别效率及识别率的系统性能评估。(本文来源于《武汉理工大学》期刊2014-04-01)
黄奋,马皓,邓菁[6](2014)在《说话人识别技术在社保系统中的远程身份认证应用研究》一文中研究指出为了方便老年人在家完成社保养老生存证明,本文探讨了说话人识别技术作为一种远程身份认证手段可行性,提出了一种在社保12333系统中的说话人防录音假冒的认证方式,并给出了一种说话人远程语音采集和认证的业务实施方案。本文中的说话人识别系统采用了基于联合因子分析的高斯混合模型-通用背景模型系统,结合TNorm分数归一化算法,在采集的老年人电话语音数据库上,等错误率为2.8%,相对于传统的高斯混合模型-通用背景模型系统,等错误率相对下降了61.64%。(本文来源于《电子技术与软件工程》期刊2014年02期)
赵耿,李旭飞,张永生[7](2012)在《基于人工神经网络说话人识别的身份认证方案》一文中研究指出由于CPSO—BP神经网络通过在粒子群优化算法中引入混沌思想,改善了粒子群优化算法摆脱局部极值点的能力,提高了BP网络的计算精度和收敛速度,使得基于BP神经网络的说话人识别其识别率和训练速度都得到较大提高。本文将该识别技术应用到身份认证中,提出了一种新的基于生物特征的身份认证方案,通过对其性能的分析研究,新的方案是安全有效的。(本文来源于《北京电子科技学院学报》期刊2012年04期)
李旭飞[8](2012)在《说话人识别在身份认证中的应用研究》一文中研究指出信息时代,信息安全成功上位,并与核技术、空间技术齐名,成为新时期叁大支柱技术之一。一个国家没有信息安全,就没有政治、经济、军事等方面的安全。而网络,作为信息的主要载体,其安全是信息安全的核心。网络安全为国家的信息和通信保密安全提供保障,身份认证技术则是网络安全的第一关。生物特征认证技术提供了比传统身份认证技术更为简单便捷的方式,它避免了人们记忆许多复杂的密码和口令,也避免了USBKey等物理证件被复制、窃取。一直以来,声纹在身份认证生物特征领域比起DNA、指纹长期被冷落,是因为其识别率不高,难以将声纹特征参数与说话人一一对应起来。但随着语音识别技术的如日中天,声纹识别技术方兴未艾,为基于声纹生物特征的身份认证打破了尴尬局面,基于说话人识别的身份认证便迎来了光明前景。本文通过对说话人识别技术的系统研究,针对传统模型算法DTW因小失大的缺陷,将其对齐方式由两端扩展到叁点,设计了一个特定文本说话人识别系统,并结合软硬件测试了其可用性。最后将说话人识别应用到通信身份认证中,引入可信任的第叁方,提出了两种基于说话人识别的身份认证方案,通过对其性能的研究分析,新的方案是安全有效的。(本文来源于《西安电子科技大学》期刊2012-12-01)
刘镝,孙冬梅,裘正定[9](2011)在《一种基于关系度量融合框架的说话人认证特征级融合算法》一文中研究指出探讨了说话人认证特征级融合策略的可行性.根据关系度量融合框架,构建该策略认证系统.通过与传统融合、单模态算法比较,本算法性能优于以上算法.为进一步分析特征级融合算法优于现有融合算法的原因,本文利用最大Kullback-Leibler距离计算融合算法融合信息量.该距离弥补了传统Kullback-Leibler距离不具有对称性的缺憾,更加精准地获取信息量.分析结果验证了本算法实验结论,说明特征级融合可获取比现有匹配分数级融合更多的信息量,从而取得更优精度.(本文来源于《自动化学报》期刊2011年12期)
陆亮[10](2010)在《多信道条件下的说话人认证》一文中研究指出自动说话人识别(Automatic SpeakerRecognition,简称ASR)又称为声纹识别,是语音信号处理中的重要组成部分,也是作为一种重要的生物信息而被广泛研究的热点之一。说话人识别是指通过一个说话人的语音而识别出说话人身份的过程,根据最终完成任务的不同,说话人识别又分为说话人确认(Speaker Verification)和说话人辨识(Speaker Identification)两种。由于在实际的说话人识别应用场景会引入多种不同的录音设备以及传输设备,使得说话人识别系统的鲁棒性不够高,严重影响了它的实用价值。这个问题,在说话人识别领域又成为多信道问题,是相关研究人员的工作重点。本课题将详细论述文本无关条件下说话人识别技术的基本原理以及研究现状,在详细论述和设计说话人识别技术中主流的GMM-UBM系统建模方法和系统的同时,本文也将阐述说话人识别领域中最新的基于支持向量机(Support Vector Machine)的建模原理以及系统设计。针对上面提到的说话人识别系统中严重影响系统性能的信道不匹配现象,本文将从特征域,模型域以及得分域对信道补偿技术进行详细的论述,并对其中的一些技术提出自己的想法和改进意见。本课题在剑桥大学开发的源码HTK语音识别工具的基础上构建说话人识别确认系统,本系统对比了在特征域、模型域等多种不同技术的系统性能,并最终采用了PLP感知线性预测静态及动态参数、RASTA滤波、特征映射、特征变换、自适应模型、得分归一化等技术使系统达到了优良的性能,达到了本领域中公布的系统性能中的前列。本课题研究主要针对电话信道下的说话人识别确认系统,但本课题所涉及的许多技术及思想对于其他条件下的说话人确认系统、说话人辨认系统、乃至语音识别系统都有参考、借鉴及应用价值。(本文来源于《北京邮电大学》期刊2010-03-15)
说话人认证论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在个人身份信息安全问题突显的今天,单模态生物特征下的身份认证技术因其自身的局限性,已经不能够满足人们的需要。利用多模态生物特征进行身份认证的技术已成为当今社会的研究热点。论文实现了说话人识别和人脸识别,并根据语音的信噪比和外界光照条件在决策层对说话人识别的结果和人脸识别的结果进行融合,以提高身份认证的正确率,从而弥补说话人识别和人脸识别对环境噪声和环境光照条件的不同要求。论文的主要工作如下:1、实现了说话人识别。采用基于高斯混合模型(Gaussian Mixture Model,GMM)的说话人识别方法,对不同说话人的训练语料经过预加重、分帧、加窗后,提取训练语料的梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)作为特征向量,训练得到每个说话人的声学模型,组成所有说话人的GMM模型库。在识别阶段,对输入的待识别说话人的语音信号,提取声学特征MFCC,并将特征向量与GMM模型库进行匹配,并根据匹配概率获得识别结果。实验结果表明,本文实现的说话人识别能够在纯净语音下达到92.8%的识别率。2、实现了人脸识别。采用GMM分类器进行人脸识别。在训练阶段,首先对人脸进行图像预处理,然后采用基于肤色人脸区域检测方法完成人脸检测,接着对人脸图像进行归一化,并采用基于主成分分析的特征提取算法提取人脸特征,最后根据特征训练得到每个人的GMM,从而生成GMM人脸模型库。识别阶段,对识别者的人脸图像经过人脸检测和特征提取后,将得到的人脸特征向量与GMM人脸模型库进行概率匹配,设定系统分类阈值后,获得识别结果。实验表明,本文实现的人脸识别能够在人脸图像高信噪比的条件下达到78.1%的识别率。3、实现了融合说话人识别和人脸识别的身份认证。采用决策层融合方法,将说话人识别和人脸识别的识别结果进行融合得到融合后的识别结果。设定了外界语音信号的信噪比阈值和图像亮度平均值阈值,采用分段式处理方法获得融合权重。当语音信号信噪比小于信噪比阈值,则身份认证依靠人脸识别完成;当外界图像亮度平均值小于亮度平均值阈值,则身份认证依靠说话人识别完成。实验结果表明,在高信噪比且良好光照的情况下,融合后的平均识别正确率比单独的说话人识别正确率提高了1.55%,比单独的人脸识别正确率提高了17.41%。在低信噪比且光照条件差的情况下融合后的平均识别正确率比单独人脸识别正确率提高了73.22%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
说话人认证论文参考文献
[1].张星伟.基于语音唇动一致性的多模态说话人身份认证系统[D].华南理工大学.2017
[2].杨静波.融合说话人识别和人脸识别的身份认证[D].西北师范大学.2016
[3].张洁凯.远程说话人认证系统的设计与实现[D].华南理工大学.2015
[4].贺前华,潘伟锵,胡永健,朱铮宇,李艳雄.说话人认证录音回放检测方法综述[J].数据采集与处理.2015
[5].代亚丽.防录音回放攻击的说话人认证算法及系统设计[D].武汉理工大学.2014
[6].黄奋,马皓,邓菁.说话人识别技术在社保系统中的远程身份认证应用研究[J].电子技术与软件工程.2014
[7].赵耿,李旭飞,张永生.基于人工神经网络说话人识别的身份认证方案[J].北京电子科技学院学报.2012
[8].李旭飞.说话人识别在身份认证中的应用研究[D].西安电子科技大学.2012
[9].刘镝,孙冬梅,裘正定.一种基于关系度量融合框架的说话人认证特征级融合算法[J].自动化学报.2011
[10].陆亮.多信道条件下的说话人认证[D].北京邮电大学.2010