导读:本文包含了韵律建模论文开题报告文献综述及选题提纲参考文献,主要关键词:维吾尔语,语音合成,韵律结构,声学特征分析
韵律建模论文文献综述
古力米热·依玛木,姑丽加玛丽·麦麦提艾力,玛依努尔·阿吾力提甫,艾斯卡尔·艾木都拉[1](2017)在《维吾尔语韵律建模》一文中研究指出对维吾尔语的韵律结构进行了全面的研究,从维吾尔语语音合成(text to speech,TTS)语音库中提取了音节的时长、能量、基频均值、最大值、最小值和基频范围等韵律特征参数,分析了其在音节处于不同韵律层次时的变化规律。提取了语音数据中韵律边界前后的音节延长量、音高重置和无声段等声学特征参数,并对它们的分布规律进行了统计分析。实验结果表明:不同韵律层级之间时长延长量和音高差值随着边界层级的提高而增加;韵律词边界之间没有显着地停顿,韵律短语和语调短语层级边界之间的平均停顿时长分别是154.2和212.8ms。(本文来源于《清华大学学报(自然科学版)》期刊2017年12期)
张磊[2](2013)在《河北省方言的声学特征和韵律建模对英语学习者的负迁移》一文中研究指出在语言学习过程中,目标语学习者很容易受到母语思维的负迁移作用,加强这一问题的研究,对提高学习者有重要的作用。(本文来源于《青年与社会》期刊2013年06期)
郭威彤[3](2009)在《西安方言的声学特征分析和韵律建模的研究》一文中研究指出方言语音的转换是人机交互领域的一个重要研究课题。为实现方言语音的转换,需要建立方言语音的韵律模型。为此,论文分析研究了西安方言的特点,对比了普通话和西安话的语音差异,建立了普通话到西安话转换的韵律模型。论文的研究结果对于揭示普通话与西安方言之间的内在关系、实现方言语音的合成具有重要的理论意义和应用价值。论文的主要研究成果和创新如下:1.设计了一个西安方言语料库。通过分析普通话和西安方言的声韵调特点,利用《方言调查字表》设计了能够体现西安方言发音特点的文本语料库,并录制了普通话和西安方言平行的语音语料。语料库由单音节、二字词、负载句和语句组成。单音节涵盖了四种声调的所有的声韵母搭配;二字词由声调的20种组合形式构成;负载句的形式为“X说X这个X”。共设计了160个音节、488个词、19个负载句和23个语句。2.对比分析了西安方言和普通话的声学特征。通过对手工标注过的语料库进行统计相关的声学参数,分析了负载句、单音节、双音节的普通话和西安话的静态和动态声调特点,并从不同的角度分析了它们的声学参数变化情况,通过实验验证了普通话和西安话的声调调值规律,总结了从普通话到西安方言转换的声调映射规律。3.提出了一种新的方言转换方法。利用Pitch-Target韵律模型对基频曲线进行参数化建模,对模型参数进行线性变换,用变换后的模型参数生成新的基频曲线,从而得到转换后的方言语音。MOS语音评测结果显示,该方法的平均MOS得分达到:阴平4.1,阳平4.6,上声3.3,去声4.5。4.提出了一种建立西安方言字调模型的方法,建立了将声调的五度值转换为基频包络的归一化的西安方言字调模型。利用字调模型产生西安方言的基频曲线,进而通过修改普通话的基频曲线实现普通话到西安方言的转换。论文分别建立了单字模型和双字模型来转换各种声调的方言语音。实验结果表明,单字的MOS得分最低在4.7分以上,ABX最低测试结果72.5%;双字的MOS百分比(认为转换最好)最低在70%以上,ABX最低测试结果73%,优于基于Pitch-Target模型的方言转换方法。(本文来源于《西北师范大学》期刊2009-05-01)
地里木拉提·吐尔逊,姑丽加玛丽·麦麦提艾力,艾斯卡尔·艾木都拉[4](2008)在《维吾尔语韵律建模方法初探》一文中研究指出作为小数民族语言信息处理的核心技术之一,近年来维吾尔语音合成技术取得了巨大的进步,但在语音合成系统中,由于韵律建模研究工作的水平不高,阻碍了合成语音自然度的进一步提高。本文通过研究维吾尔语韵律特点和建立大规模维吾尔语音语料库的基础上,分析了维吾尔语的韵律特征受语境信息影响的情况,并获得了对维吾尔语韵律特征产生重要影响的语境参数,从而提出了适合于大语料库的维吾尔语韵律训练模型,并初步探讨了如何将其进一步应用到高自然度的维吾尔语语音合成系统中。(本文来源于《第八届中国语音学学术会议暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会论文集》期刊2008-04-18)
于剑,黄力行,陶建华[5](2008)在《汉语对话语气韵律建模方法》一文中研究指出为使得合成系统所生成的语音更加自然,构建了一个普通话对话语气韵律模型。借鉴现有陈述语气韵律模型的研究成果,针对对话语气的特点进行扩展,生成具有对话语气韵律特征的基频曲线。与陈述语气相比,对话语气具有较快的语速和较窄的调域,然而仅通过变换语速和调域却无法模拟出对话语气的特征。对话语气中音节内部基频曲线无法完成其原先固有的调形,这种现象称为"未完成现象"。为了模拟这种现象,利用分类树预测一个音节是正常音节还是未完成音节,并在基频曲线生成模型中对未完成音节进行特殊处理,使之生成具有对话语气韵律特征的基频曲线。听辨实验证明,基于本文所提出韵律模型合成的语音表现更加自然和口语化。(本文来源于《清华大学学报(自然科学版)》期刊2008年S1期)
贺培刚[6](2008)在《汉语TTS中的韵律建模与合成方法研究》一文中研究指出随着计算机技术的进步和其他相关学科的发展,在过去的几十年间,语音合成技术有了迅猛的发展,涌现出了大量的新理论和新技术。在现阶段,语音合成技术主要是以文语转换系统(Text-To-Speech,TTS)为研究重点。这是一种将输入的文本转换为语音输出的技术。TTS系统一般由文本分析、韵律控制、语音合成和基元库四个模块组成。这四个模块并不是相互孤立的,每一个模块的性能都对最终输出语音的质量有很大的影响。对合成系统输出语音音质的评价是多方面的,但主要集中在输出语音的清晰度,可懂度和自然度这叁个方面。当前,TTS系统的输出语音在清晰度和可懂度方面已经达到了比较高的水平,而在语音的整体自然度方面还有待提高。本文主要研究了韵律控制和语音合成这两个模块,希望通过对这两个模块的研究与改进来提高合成语音的自然度。韵律控制模块对合成语音的自然度有很大的影响,对这部分的研究包括多个方面,这里选择韵律建模作为研究重点。韵律模型可以将一些定性的高层韵律信息转换为定量的声学参数,以便提供给后面的语音合成模块使用。本文运用人工神经网络技术设计并实现了一个用于预测汉语音节基频曲线、时长和停顿的模型。实验表明,这个模型在一定程度上能够较好的反映汉语陈述句中音节的基频曲线、时长和停顿的变化情况。语音合成模块负责最终语音的输出,现在普遍采用波形拼接技术。在选择最优的合成基元序列的同时,此模块也需要对其中一些语音波形做适当的修正,以使合成语音听上去更加流畅自然。本文在研究了最优基元选择算法的同时,也研究了一种基于傅立叶变换的语音频谱平滑算法。此算法能够较好的进行语音频谱平滑并且在一定程度上避免了传统算法使合成语音质量有较大下降的问题。为综合验证算法的性能,本文构建了一个简易的TTS系统,在其中采用了上面介绍的算法。听音测试表明,此系统的合成语音自然度较高。(本文来源于《山东大学》期刊2008-03-09)
于剑,黄力行,陶建华[7](2007)在《汉语对话语气韵律建模方法的研究》一文中研究指出本文构建了一个普通话对话语气韵律模型。在构建该对话语气韵律模型的过程中,本文借鉴了现有陈述语气韵律模型的研究成果,同时针对对话语气所独有的特点对其进行了扩展。与陈述语气相比,对话语气最明显的特点在于其具有较快的语速和较窄的调域,然而仅仅通过变换语速和调域却仍然无法模拟出对话语气的特征。本文指出,对话语气与陈述语气的差别通常体现在:对话语气中音节内部基频曲线往往无法完成其原先固有的调形,本文将这种现象称为"未完成现象"。为了模拟这种现象,本文首先利用分类树预测一个音节是正常音节还是未完成音节,并通过在基频曲线生成模型中对未完成音节进行特殊处理,使之能够生成具有对话语气韵律特征的基频曲线。听辨实验证明,基于本文所提出韵律模型合成的语音表现更加自然和口语化。(本文来源于《第九届全国人机语音通讯学术会议论文集》期刊2007-10-01)
邵艳秋,穗志方,韩纪庆,王志伟[8](2007)在《小规模情感数据和大规模中性数据相结合的情感韵律建模研究》一文中研究指出建立好的情感韵律模型是合成情感语音的重要环节,而在情感语音的研究过程中,一个必须面对的现实问题就是通常情感数据量相比于中性数据量要少得多.将一个含有高兴、生气、悲伤3种情感语音的小规模数据库和一个较大规模的中性语音数据库相结合,进行情感韵律建模研究.对影响情感的韵律参数进行了分析,建立了基于人工神经网络的情感韵律模型.针对情感数据量相对于中性数据量的不足而导致的过拟合现象,提出了3种解决办法,即混合语料法、最小二乘融合法和级联网络法.这些方法都在不同程度上扩大了情感语料的作用,使得情感预测效果都有所提高.尤其是级联网络法,将中性模型的结果作为级联网络的一个输入,相当于扩大了情感模型的特征空间,更加强化了情感模型各输入特征的作用,在3种情感的各韵律参数生成中效果是最好的.(本文来源于《计算机研究与发展》期刊2007年09期)
屈小刚[9](2006)在《汉语嵌入式TTS系统中的韵律建模和语音合成方法》一文中研究指出随着计算机技术和信息技术的飞速发展,如何使人机界面更加自然和友好成为相关机构的研究热点,其中,语音交互方式备受人们关注。语音交互中非常重要的一项技术就是语音合成,本文着重研究语音合成技术中的音库设计,韵律建模和合成算法。 语音合成在高配置机器(如大型机,工作站等)上的应用已经非常广泛,但是由于嵌入式系统的资源限制,基于大语料库的语音合成方法难以在嵌入式系统上实现。因此,如何平衡音库容量和合成音质之间的矛盾便成了问题的核心所在。本文根据汉语音节的特点,提出了一种嵌入式音库的设计算法。在对样本之间失真度的测量上采用了符合人耳感知特性的MFCC参数,测量最小失真度使用了动态规划(DP)技术来优化匹配过程。根据对汉语中有调音节的出现频率的分析,确定了音库的最终结构。选取音节作为基元,采用改进的k均值聚类算法(MKM算法)。同时考虑到基元的后续处理,增加了候选基元,从而优化了基元库质量。 在人们的交流过程中,韵律隐含着文字所不能表达的信息,因此在汉语语音合成系统中,韵律建模的作用相当重要。相对于概率模型和决策树模型来说,神经网络有着强大的非线性映射能力和自学习能力,因此,这里选用神经网络来训练韵律模型。网络的输入参数主要从文本中获得,同时为了表达不同含义的需要加入了重音及其相关信息。根据汉语音节的特点可以归纳出17个有用的参数,重音参数不能直接从文本中获得,因此参考相关资料,提出了调域系数(TRR)和音节时长组合的方法来检测,实验表明能降低漏检率和提高召回率。根据参数的重要性不同将参数划分为两组矢量,对重要性较高的矢量采用增加加权层来提高网络输出的精度,从而构成了叁组输入矢量。神经网络的中间层采用了高斯径向基函数对输入矢量进行映射,高斯函数的中心为该子空间的质心,径向宽度参数为该子空间中所有样本与(本文来源于《山东大学》期刊2006-04-06)
唐仕喜,李洪波,武光利,于洪志[10](2005)在《藏语语音合成系统韵律建模规律初步研究》一文中研究指出语音是人类相互交流和通信最方便快捷的手段,而语音中的韵律包含了说话人的意图信息,在帮助听者理解语言及意图时十分有用。对于韵律的研究是语音合成技术中的重要研究课题。该文从藏语语音音节结构、发音特点出发,进而通过对其语谱图等的进一步研究,从藏文构字、藏文分词、重音、音渡与声调等方面总结了藏语语音韵律建模的基本规律,为藏语语音合成系统韵律建模提供直接理论基础。(本文来源于《第十届全国少数民族语言文字信息处理学术研讨会论文集》期刊2005-07-01)
韵律建模论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在语言学习过程中,目标语学习者很容易受到母语思维的负迁移作用,加强这一问题的研究,对提高学习者有重要的作用。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
韵律建模论文参考文献
[1].古力米热·依玛木,姑丽加玛丽·麦麦提艾力,玛依努尔·阿吾力提甫,艾斯卡尔·艾木都拉.维吾尔语韵律建模[J].清华大学学报(自然科学版).2017
[2].张磊.河北省方言的声学特征和韵律建模对英语学习者的负迁移[J].青年与社会.2013
[3].郭威彤.西安方言的声学特征分析和韵律建模的研究[D].西北师范大学.2009
[4].地里木拉提·吐尔逊,姑丽加玛丽·麦麦提艾力,艾斯卡尔·艾木都拉.维吾尔语韵律建模方法初探[C].第八届中国语音学学术会议暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会论文集.2008
[5].于剑,黄力行,陶建华.汉语对话语气韵律建模方法[J].清华大学学报(自然科学版).2008
[6].贺培刚.汉语TTS中的韵律建模与合成方法研究[D].山东大学.2008
[7].于剑,黄力行,陶建华.汉语对话语气韵律建模方法的研究[C].第九届全国人机语音通讯学术会议论文集.2007
[8].邵艳秋,穗志方,韩纪庆,王志伟.小规模情感数据和大规模中性数据相结合的情感韵律建模研究[J].计算机研究与发展.2007
[9].屈小刚.汉语嵌入式TTS系统中的韵律建模和语音合成方法[D].山东大学.2006
[10].唐仕喜,李洪波,武光利,于洪志.藏语语音合成系统韵律建模规律初步研究[C].第十届全国少数民族语言文字信息处理学术研讨会论文集.2005