导读:本文包含了发音错误检测论文开题报告文献综述及选题提纲参考文献,主要关键词:英语口语测试系统,语音信号,检测,发音错误
发音错误检测论文文献综述
谢雪梅[1](2018)在《英语口语测试系统发音错误智能检测技术研究》一文中研究指出在英语口语测试系统设计中,为提高口语发音错误的智能检测能力,提出一种基于语音信号频谱检测技术的英语口语测试系统发音错误智能检测方法。采集英语口语测试系统发音的语音信号,对语音信号进行匹配滤波处理,去除干扰噪声,对提纯的英语语音信号进行自适应波束聚焦处理,增强有用语音信号的强度,采用相关频谱检测方法,提取语音口语测试系统的发音语音信号的频谱,根据频谱差异性实现语音发音错误检测。仿真结果表明,采用该方法进行英语口语测试系统发音错误智能检测性较好,检测准确率较高,具有很好的抗干扰能力和纠错能力。(本文来源于《自动化与仪器仪表》期刊2018年12期)
黄浩,徐海华,王羡慧,吾守尔·斯拉木[2](2015)在《自动发音错误检测中基于最大化F1值准则的区分性特征补偿训练算法》一文中研究指出为提高自动发音错误检测性能,提出一种区分性特征补偿训练算法.该方法将高斯后验概率矢量经过线性变换后作为偏移量补偿至传统的谱特征.将经过正确度标注的语音数据库上的发音错误检测F1值的最大化作为变换参数的训练准则.推导了目标函数对变换参数的偏导数公式,并利用无约束参数优化例程L-BFGS更新变换参数.发音错误检测实验表明该方法能够有效增大训练和测试集的F1值.并且训练和测试集的精确度、召回率也都有明显提高.在特征优化的基础上进行模型参数训练,检错性能较单独的区分性特征训练、单独的区分性模型训练都有进一步改进.(本文来源于《电子学报》期刊2015年07期)
袁桦,史永哲,赵军红,刘加[3](2014)在《基于JSM和MLP改进发音错误检测的方法》一文中研究指出针对发音错误检测的发音字典生成提出基于联合序列多阶模型(Joint-sequence multi-gram,JSM)和多层神经感知(Multi-layer perception,MLP)的方法.首先使用JSM模型对发音错误进行建模,将标准发音和错误发音组合为发音对,表示它们之间的对应关系,再使用N元文法来统计各发音对之间的关系,描述错误发音对上下文关系的依赖.最后使用MLP对发音对之间的关系进行重新建模,以学习到在相似的上下文条件下发生的相似的错误.实验证明使用MLP对高阶模型进行概率重估能有效的平滑概率空间,提高了发音错误检测的性能.(本文来源于《自动化学报》期刊2014年12期)
热米拉·艾山江[4](2014)在《发音错误检测中的区分性训练的研究》一文中研究指出在语音识别领域中,区分性准则的指导下对声学模型参数进行优化的方法已经在广泛使用,这些区分性准则以减少语音识别系统训练参数的期望误差为目标。实际应用来看这些区分性准则较产生式训练准则对系统识别性能有明显的改进。由于区分性准则的这些特性,研究人员开始研究在区分性准则指导下对声学特征进行线性变换,优化特征参数,从而达到提高识别系统性能指标的方法。该方法已经在语音识别系统的识别性能的优化上表现出了较高的有效性。在发音检错中,系统最终数据应该与评测专家的检错的评判标准尽可能的保持一致性,因此发音检错任务中的系统性能评价指标与语音识别不同。由于上述原因语音识别里中的优化性能较好的区分性训练准则在发音检错中的优化效能并不理想。F1值最大化准则就是一种面向发音检错系统提出来的区分性训练准则,近期实验结果表明较其他区分性准则,基于F1值最大化的系统参数训练方法确实使发音检错系统的性能大大提高。特征提取模块中的特征的性能直接影响发音检错性能的,因此从特征提取模块中出发来改善整个发音检错系统的性能也是一种系统改善方法。在本论文为了改善发音检错系统的性能,把上述的语音识别里的通过线性变换和区分性原理进行特征优化的思想应用到发音检错系统的性能优化上。提出了一种区域相关的区分性特征补偿算法。该方法将高斯空间的高维后验概率矢量经过线性变换作为偏移量补偿至传统的谱特征。将发音错误检测系统的性能指标值F1值的最大化作为变换参数的训练准则,对变换矩阵进行优化。推导了目标函数对线性变换参数的偏导数计算公式,并利用无约束参数优化L-BFGS进行变换参数更新。实验结果表明该方法在增大训练集和测试集上的F1值表现出了有效性。与此同时,训练集和测试集上的的精确度、召回率也都有明显的改进。利用优化后的特征,进行进一步的模型参数训练,与利用原始特征的区分性训练和基线模型的检错结果进行比较,比较结果来看我们提出的方法明显提高了检错性能。(本文来源于《新疆大学》期刊2014-06-30)
袁桦,蔡猛,赵军红,张卫强,刘加[5](2014)在《发音错误检测中基于多数据流的Tandem特征方法》一文中研究指出针对发音错误检测中标注的发音数据资源有限的情况,提出在Tandem系统框架下利用其他数据来提高特征的区分性。以中国人的英语发音为研究对象,选取了相对容易获取的无校正发音数据、母语普通话和母语英语作为辅助数据,实验结果表明,这几种数据都能够有效地提高系统性能,其中无校正数据表现出最好的性能。同时,比较了不同的扩展帧长,以多层神经感知(MLP)和深度神经网络(DNN)作为典型的浅层和深层神经网络,以及Tandem特征的不同结构对系统性能的影响。最后,多数据流融合的策略用于进一步提高系统性能,基于DNN的无校正发音数据流和母语英语数据流合并的Tandem特征取得了最好的性能,与基线系统相比,识别正确率提高了7.96%,错误类型诊断正确率提高了14.71%。(本文来源于《计算机应用》期刊2014年06期)
黄浩,王建明,哈力旦.阿布都热依木,吾守尔.斯拉木[6](2013)在《自动发音错误检测中基于F_1值最大化的声学模型训练方法》一文中研究指出为了提高计算机辅助语言学习中自动发音错误检测系统的性能,提出一种声学模型的区分性训练方法。该方法将经过正确度标注的非母语语音数据库上的发音错误检测的F_1值的最大化作为模型参数的训练准则。采用Sigmoid函数对F_1值函数进行平滑构造目标函数,并利用构造弱意义辅助函数的方法以及扩展Baum-Welch形式的参数更新公式进行优化。提出在模型参数更新与音素门限同时优化的策略保证目标函数增长的单调性。发音错误检测实验表明该方法能够有效地增大训练和测试数据检错的F_1值。同时训练数据和测试数据上的精确度、召回率以及检测正确度都有明显改进。(本文来源于《声学学报》期刊2013年06期)
王建明[7](2013)在《发音错误检测中声学模型训练准则的比较研究》一文中研究指出本论文研究的是针对新疆非母语说话人语音数据集的发音错误检测技术,众所周知,发音检错技术是计算机辅助语言学习系统性能的重要体现,如何提高新疆非母语说话人汉语普通话发音错误检测系统的性能对广大少数民族汉语学习者意义重大。文中以新疆维吾尔族说话人语音数据库为例,利用少量的新疆非母语说话人的语料,通过对传统发音错误检测声学模型的改进和训练,得到了能够有效提高发音检错系统性能的区分性训练算法。本论文的主要工作如下:首先,本文简单介绍了常用的发音错误检测度量归一化对数似然比(Goodness of Pronunciation,GOP)算法以及评判系统检错性能的重要指标F1值计算方法。还重点介绍了最大似然估计(Maximum Likelihood Estimation,MLE)训练准则,对新疆非母语语音库进行MLE训练,并计算出其检错声学模型的F1值,为对比本文所提出检错算法的有效性奠定了基础。其次,将传统语音识别中的区分性训练准则应用到发音错误检测系统中,通过对常用区分性训练算法的分析,选择了应用较为广泛的最小音素错误估计训练准则(Minimum Phone Error,MPE),并用实验验证了 MPE区分性训练准则可以有效的提高对检错数据的音素识别率,但对提高系统检错性能的帮助并不大,说明现有的区分性训练准则并不能有效的提高发音错误检测系统的性能。最后,本文在MLE、MPE声学训练模型分析的基础上,提出了以最大化F1值为目标函数的区分性训练准则(Maximum-score Criterion,MFC),通过建立经过专家标注过的新疆非母语说话人语音数据库,构造出最大化F1值的目标函数,并提出了采用构造弱意义辅助函数的方法对目标函数进行优化及参数更新,通过采用阈值迭代更新的方法确保了目标函数随迭代次数的不断提高而增长。该区分性训练算法能够根据新疆少数民族发音数据库的人工标注结果自动学习专家的发音错误评判标准,实验结果表明该方法能够有效的提高发音错误检测系统的性能。(本文来源于《新疆大学》期刊2013-06-30)
刘明辉,黄中伟[8](2013)在《结合高斯混合模型和VOT特征的音素发音错误检测》一文中研究指出结合高斯混合模型(GMM)和嗓音起始时间(VOT)特征的普通话音素发音错误检测,提出了一种结合语音声道特征信息和音源特征信息的发音错误检测方法。其中GMM用于反映声道特征信息的MFCC参数的建模与评测,并直接对大部分音素的发音质量直接进行错误检测。对于少数通过MFCC参数和GMM难于检测区分的辅音音素,则通过反映VOT信息的音源特征参数进行区分。实验表明,该方法在训练数据有限的情况下取得了较好的性能,非常适合用于聋人语言康复的计算机辅助训练。(本文来源于《科学技术与工程》期刊2013年07期)
安丽丽,吴延年,刘志,刘润生[9](2012)在《一种基于检错音网络的发音错误检测新算法》一文中研究指出该文通过将计算机辅助语言学习(Computer Assisted Language Learning,CALL)系统的标准发音网络加入插入和删除路径的方法提出了一种发音错误检测新算法:检错音网络(Error-Detecting Network of Pronunciation,EDNP)错误检测算法。该算法首先对待测语音进行EDNP错误检测,然后通过对检错音网络的二级识别结果使用一级多候选词图进行错误召回的策略,进行错误检测,该算法易于实现并具有平台无关性。实验结果表明:该文提出的EDNP错误检测方法在中国四级考生语音测试库上使删除错误虚警率和漏报率分别达到7.38%和12.25%,插入错误虚警率和漏报率分别达到4.94%和26.17%,且客观评分与专家评分相关度比强制对齐方法的相关度提高了4.29%。(本文来源于《电子与信息学报》期刊2012年09期)
袁桦,钱彦旻,赵军红,刘加[10](2012)在《基于优化检测网络和MLP特征改进发音错误检测的方法》一文中研究指出该文基于优化的检测网络和多层感知(multi-layerperception,MLP)特征,提出一种可以更加准确地检测出错误发音类型的方法。首先,从第二语言学习的语音库中提取出基本的发音规则以及组合的发音规则,并相应地计算它们发生的先验概率,再将这些具有先验概率的规则用于构建基于多发音的扩展检测网络。然后在检测过程中,引入基于发音特征的MLP特征来描述发音概率,替代了传统的语音声学特征。最后使用基于MLP特征的GMM-HMM框架从检测网络中识别出最可能的发音音素串。实验表明:该方法将音素识别正确率提高了3.11%,错误类型准确率提高了7.42%。(本文来源于《清华大学学报(自然科学版)》期刊2012年04期)
发音错误检测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
为提高自动发音错误检测性能,提出一种区分性特征补偿训练算法.该方法将高斯后验概率矢量经过线性变换后作为偏移量补偿至传统的谱特征.将经过正确度标注的语音数据库上的发音错误检测F1值的最大化作为变换参数的训练准则.推导了目标函数对变换参数的偏导数公式,并利用无约束参数优化例程L-BFGS更新变换参数.发音错误检测实验表明该方法能够有效增大训练和测试集的F1值.并且训练和测试集的精确度、召回率也都有明显提高.在特征优化的基础上进行模型参数训练,检错性能较单独的区分性特征训练、单独的区分性模型训练都有进一步改进.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
发音错误检测论文参考文献
[1].谢雪梅.英语口语测试系统发音错误智能检测技术研究[J].自动化与仪器仪表.2018
[2].黄浩,徐海华,王羡慧,吾守尔·斯拉木.自动发音错误检测中基于最大化F1值准则的区分性特征补偿训练算法[J].电子学报.2015
[3].袁桦,史永哲,赵军红,刘加.基于JSM和MLP改进发音错误检测的方法[J].自动化学报.2014
[4].热米拉·艾山江.发音错误检测中的区分性训练的研究[D].新疆大学.2014
[5].袁桦,蔡猛,赵军红,张卫强,刘加.发音错误检测中基于多数据流的Tandem特征方法[J].计算机应用.2014
[6].黄浩,王建明,哈力旦.阿布都热依木,吾守尔.斯拉木.自动发音错误检测中基于F_1值最大化的声学模型训练方法[J].声学学报.2013
[7].王建明.发音错误检测中声学模型训练准则的比较研究[D].新疆大学.2013
[8].刘明辉,黄中伟.结合高斯混合模型和VOT特征的音素发音错误检测[J].科学技术与工程.2013
[9].安丽丽,吴延年,刘志,刘润生.一种基于检错音网络的发音错误检测新算法[J].电子与信息学报.2012
[10].袁桦,钱彦旻,赵军红,刘加.基于优化检测网络和MLP特征改进发音错误检测的方法[J].清华大学学报(自然科学版).2012