语音合成系统论文-华凯晨,王晖,张振宇,侯凯博,赵晨光

导读:本文包含了语音合成系统论文开题报告文献综述及选题提纲参考文献，主要关键词:语音交互,语音识别,Speech,SDK

语音合成系统论文文献综述

华凯晨,王晖,张振宇,侯凯博,赵晨光^[1]（2019）在《基于语音合成的残疾人辅助交互系统的设计与实现》一文中研究指出智能人机交互正作为一种新型沟通手段,逐渐走进人们的生活。近几年,语音技术逐渐改变人们的生活和工作方式。语音控制能实现交互高效、流畅、无缝,语音识别与合成技术是核心。笔者基于语音交互中的相关问题,提出Speech SDK平台残疾人辅助交互系统设计方案,有利于残障人士通过语音控制进行操作,希望通过探讨可以促进智能人机交互技术的推广应用。(本文来源于《信息与电脑(理论版)》期刊2019年16期）

希吉尔^[2]（2019）在《面向蒙古语语音合成系统的蒙古族人名读音研究》一文中研究指出已搭建好的蒙古语语音合成系统已经能合成任意长度的文本,且清晰度、可懂度和自然度到了较高水平。但是,由于蒙古族人名的结构、来源及读音的复杂性,如何正确机读蒙古族人名是当前合成系统中亟待解决的关键问题之一。本文建立28938蒙古族人名库的基础上,运用语料库语言学的方法研究了如何在合成系统中正确机读蒙古族人名的问题。全文由导论、正文(共叁章)、结论、参考文献和结语等五个部分组成。导论部分主要概括了蒙古族人名的以往研究概况、选题缘由、选题意义及研究方法等。第一章,阐述了建立蒙古族人名库的过程及在还原人名时所遇到的问题。第二章,简述了蒙古语语音合成研究概况,并详细论述了蒙古族人名的特殊写法和特殊读法对蒙古语语音合成系统的影响。第叁章,简单介绍了蒙古语语音合成平台,并对蒙古族人名的合成情况进行了分类分析研究。结论部分,归纳总结了本论文的研究内容,并指出了本文未能涉及的相关内容,以待今后进一步研究。(本文来源于《内蒙古大学》期刊2019-06-01）

尹晴^[3]（2019）在《基于发音动作特征的中文语音合成系统研究与实现》一文中研究指出语音合成技术也叫文语转换技术,能够将文字转换成语音的形式输出,是人机交互中必不可少的一部分。在当今的智能音箱、智能家居、车载导航等许多人工智能应用场景中都离不开语音合成技术。基于语料库的波形拼接语音合成方法目前已有较高的可懂度和自然度,但在进一步提高听感质量上仍有待加强,尤其是基元的拼接产生的声音突变现象需要进一步改善,造成声音突变的主要原因是传统的语音合成系统不能使前后基元之间具有足够的协同发音的音联性。因为协同发音是源自于人体发声器官的自然连续运动,所以本文从发音动作的角度进行波形拼接语音合成,所做的工作如下:首先,为了使语料库的基元能充分地涵盖汉语不同协同发音情况下的声音变体,本文基于对汉语协同发音类型的总结,设计并建立了满足变体覆盖率的语料库,并基于研究的协同发音标注方法,使用电磁发音仪(Electro magnetic articulography,EMA)数据对语料库中每一个基元进行发音动作的标注。高质量的语料库也是语音合成的基础。然后,为了得到输入文本对应的体现协同发音特征的发音动作参数,本文构建了隐马尔科夫模型(Hide Markov Model,HMM),使模型输出的发音动作参数具有音联的过渡连续性。能充分反应音联效果的发声动作参数也是下一步基元选择的依据。最后,为了能准确地从语料库里挑选出最佳基元,本文基于代价计算理论设计了适用于发音动作特征的代价计算法,并且将获得的每一个最佳基元经过平滑算法进行处理和拼接,从而使整个语音合成系统输出连接过渡性更好的声音。本文从客观和主观两个角度对合成声音的效果进行评价,并且使用现阶段常用的基于上下文信息的波形拼接语音合成方法作为对照。实验结果显示,基于发音动作特征的波形拼接语音合成方法能使合成语音在基元拼接处的过渡效果更自然,更能满足协同发音的音联要求。(本文来源于《重庆邮电大学》期刊2019-05-20）

宋吉峰,周智成,谢代钰,陈新凌,张旻钰^[4]（2019）在《语音合成技术在电力调度自动化系统中的应用》一文中研究指出电力调度自动化系统中的语音报警功能作用重大。传统人为录音方式繁杂,错误率较高,因此供电公司必须提高重视,及时更新电力调度自动化系统,利用先进的语音合成技术,开发语音合成系统。语音合成(TTS)系统具有众多特点和优势,包括可提供多种语种、合成众多音色、语气表现力较强、短语合成效果显着、数值和数字辨别度高、批量处理预录音、支持MP3格式背景音乐、远程监控图形界面、语音报警准确性高、升级便利、免语音维护及语音合成迅速等。因此,需利用传输控制协议客户-服务器方式实现语音合成技术在电力调度自动化系统中的应用。客户端运作TTS语音软件时,硬件把关器必须为客户端提供支持,而服务器端包括数据采集和监控服务器。(本文来源于《通信电源技术》期刊2019年04期）

蔡文彬,魏云龙,徐海华,潘林^[5]（2018）在《混合单元选择语音合成系统的目标代价构建》一文中研究指出合成语音的基元是通过最小化目标代价和拼接代价来选取。由于拼接基元涉及复杂的语言学、声学特性,如何选择能准确描述基元信息的声学特征(或语言学特征)并构建相应目标代价是提高合成语音质量的关键。从声学特征和声学模型两个方面对目标代价构建进行了探究。实验结果表明,经过相似语料训练后微调的深度声学网络模型,预测的瓶颈特征更能表征拼接基元特性,从而指导目标代价筛选理想候选单元,提高合成语音的质量。(本文来源于《计算机工程与应用》期刊2018年24期）

闵波,王广军,朱海荣,邵新,王瑞^[6]（2018）在《支持语音合成的PubMed生物医学文献检索系统设计与实现》一文中研究指出移动互联网的快速发展不断推动着科技文献检索与阅读模式的转变。随着大数据、人工智能等新技术的应用,新的信息服务越来越趋向智能化与个性化。通过整合PubMed E-utilities与百度人工智能开放平台语音合成应用接口,构建了一个支持音频播放的生物医学文献检索系统,在传统文献检索的基础上提供音频服务,实现从文献可读到有声可听,促进文献阅读时人机分离,实现随时随地听文献,帮助科研人员更好地利用日常碎片化时间进行文献跟踪学习。(本文来源于《中华医学图书情报杂志》期刊2018年12期）

刘明辉,徐莉^[7]（2018）在《工业控制计算机系统中的语音合成技术》一文中研究指出随着计算机技术的不断发展和顺利升级,工业控制领域在这一技术的引导下取得了良好效果,尤其是语音合成技术,该技术通过发挥基本优势来满足系统的应用需要,这对工作效率提高、系统完善有重要意义。本文首先对相关理论简要介绍,然后重点分析了该系统中的语音合成技术。(本文来源于《中国新通信》期刊2018年12期）

冯浩然^[8]（2018）在《基于HMM的马来语语音合成系统设计与实现》一文中研究指出通过计算机或特殊设备由人为的工艺流程生成出使人能听得懂的话音称之为语音合成。目前,主流的语音合成系统采用了基于统计参数的语音合成方法,该方法具有合成效率高,对不同语音情境、风格、语言的依赖度小等优点。马来语属于南岛语系印度尼西亚语族,广泛使用于马来西亚联邦、印度尼西亚、文莱、菲律宾、新加坡等国家,使用人数约有2亿多人。本文采用基于隐马尔科夫模型(HMM)的统计参数语音合成技术,探索马来语语音合成系统的实现方法。本文的主要工作有:(1)查阅大量关于语音合成的文献,总结了隐马尔科夫模型(HMM)的原理、基于HMM的语音合成系统框架和马来语语音合成研究现状。(2)以440MB的发音语料和402KB的文本语料为基础,从中挑选了1000句作为马来语语音合成语料库,并对其进行了音子列表的确定、音子自动切分、上下文属性和问题集的设计,完成数据准备工作。(3)通过Cygwin平台,运用HTS语音合成工具包,对准备好的数据进行马来语语音合成系统的声学模型训练和后端合成框架的构建,最后根据STRAIGHT合成器生成其马来语语音文件。实验结果表明,基于HTS的音子自动切分能节省大量人工语料库标注的时间,提高语音合成效率,其切分结果也能满足合成系统要求,而且利用HTS工具包能切实可行的搭建完成马来语语音合成系统。未来需要投入精力研究系统改善,以期对自然度、可懂度和音质方面的逐步改善。(本文来源于《云南大学》期刊2018-05-01）

颜科先^[9]（2018）在《基于HMM的汉语情感语音合成系统的实现与改进》一文中研究指出随着信息技术的发展,智能化移动设备应用越来越普及,人们对人机语音交互提出了更为多样化的需求。本文以开发应用系统为目的,研究基于隐马尔可夫模型的情感语音合成,探索提高语音合成自然度以及情感表现度的方法。论文的主要工作包括如下:1、为实现实验内容,构建了情感语音数据库。针对中文语音,甄选、采集、录入了四种不同情感的语音及相应的文本资料。分析了情感语音的特征,根据其特征,录入采集并构建了情感语音数据库。通过构建的情感语音数据库,进一步研究分析各个情感语音之间的特征及关系。2、构建了基于HMM的情感语音合成系统,描述了决策树模型的算法,使计算机能够自主进行情感语音合成方面的训练,能够根据语料库的更新来进行更深层次的训练,并详细介绍了情感语音合成基线系统的实现过程。3、针对中文情感语音表述特点,为进一步提高情感语音合成的感情色彩,在原有的情感语音合成方面,对合成参数进行了相应的改进,实现合成语音中情感程度的调节。实验结果表明,改进后的中文情感语音合成系统相较于基线系统在情感表达效果方面有了明显提升,达到了预期的研究目标。(本文来源于《云南大学》期刊2018-05-01）

伍烛梅^[10]（2017）在《基于HMM的傣语语音合成系统研究》一文中研究指出语音合成通俗来说就是利用计算机或者电子设备将文字信息变成具有一定自然度和可懂度的声音信息输出的过程。语音合成虽说有很长的研究历史,也有很多研究语音合成的国内外学者,但大多数的合成研究集中在中英文语言,而很少有对少数民族语言进行的合成研究。在国内,汉语普通话的语音合成技术已经比较成熟、已实现产品化并已经被运用到各个领域,藏语、维吾尔语等少数民族语的语音合成技术也已处于产品化阶段,而云南少数民族语的语音合成研究还未得到应有的重视,傣语语音合成研究目前还无人问津。为了填补傣语语音合成研究的空白,本文以开发傣语文语转换应用系统为目的,针对合成语音自然度不高的问题,研究傣语语音合成系统及其改进方法。本论文的主要工作包括:1.对基于HTS-2.0平台的STRAIGHT提取的基频参数进行分析和改进。针对提取基频参数发生倍频、半频、浊音清化叁种错误的问题,本文基于短时平均幅度差函数法(AMDF)利用MATLAB平台开发了一个校对基频错误的工具。并利用基于数学形态学的滤波器对修改结果进行平滑处理,得到最终的基频参数。实验结果表明,本文开发的校对工具能够有效地校对错误的基频,改善合成效果。2.利用HTK工具包对1244句傣语语料进行音子自动切分,并基于音频及其TextGrid文件利用Praat软件优化自动切分标注。关于傣语的音子自动切分标注音子与时间信息未对齐、停顿时间过长或过短、韵律标注与实际有出入以及缺少声母的问题,本文利用Praat软件,对切分错误的音子进行重新对齐,对缺少声母的音节添加零声母“w”并根据音频标注韵律边界信息。实验结果表明,通过对自动切分标注结果的修正,合成的语音自然度有了很大的提高。3.基于傣语语音合成基线系统,本论文分析了合成语音的音质和谱参数,提出了改进的时长模型并重新选择了音频的谱参数训练声学模型。对于合成语音过于平淡以及节奏感不强的问题,本文选取了内插特性较好的LSP参数作为声学模型的训练数据进行谱参数建模。同时,在现有的时长模型上增加了音素时长的决策树模型,在合成时,系统对每个状态时长和音素时长模型同时进行决策,然后,根据两者的权重生成最终的时长模型。实验结果表明,利用改进的傣语语音合成系统合成的傣语语音在可懂度、自然度以及韵律方面都有了很大提升。(本文来源于《云南大学》期刊2017-03-01）

语音合成系统论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

已搭建好的蒙古语语音合成系统已经能合成任意长度的文本,且清晰度、可懂度和自然度到了较高水平。但是,由于蒙古族人名的结构、来源及读音的复杂性,如何正确机读蒙古族人名是当前合成系统中亟待解决的关键问题之一。本文建立28938蒙古族人名库的基础上,运用语料库语言学的方法研究了如何在合成系统中正确机读蒙古族人名的问题。全文由导论、正文(共叁章)、结论、参考文献和结语等五个部分组成。导论部分主要概括了蒙古族人名的以往研究概况、选题缘由、选题意义及研究方法等。第一章,阐述了建立蒙古族人名库的过程及在还原人名时所遇到的问题。第二章,简述了蒙古语语音合成研究概况,并详细论述了蒙古族人名的特殊写法和特殊读法对蒙古语语音合成系统的影响。第叁章,简单介绍了蒙古语语音合成平台,并对蒙古族人名的合成情况进行了分类分析研究。结论部分,归纳总结了本论文的研究内容,并指出了本文未能涉及的相关内容,以待今后进一步研究。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

语音合成系统论文参考文献

[1].华凯晨,王晖,张振宇,侯凯博,赵晨光.基于语音合成的残疾人辅助交互系统的设计与实现[J].信息与电脑(理论版).2019

[2].希吉尔.面向蒙古语语音合成系统的蒙古族人名读音研究[D].内蒙古大学.2019

[3].尹晴.基于发音动作特征的中文语音合成系统研究与实现[D].重庆邮电大学.2019

[4].宋吉峰,周智成,谢代钰,陈新凌,张旻钰.语音合成技术在电力调度自动化系统中的应用[J].通信电源技术.2019

[5].蔡文彬,魏云龙,徐海华,潘林.混合单元选择语音合成系统的目标代价构建[J].计算机工程与应用.2018

[6].闵波,王广军,朱海荣,邵新,王瑞.支持语音合成的PubMed生物医学文献检索系统设计与实现[J].中华医学图书情报杂志.2018

[7].刘明辉,徐莉.工业控制计算机系统中的语音合成技术[J].中国新通信.2018

[8].冯浩然.基于HMM的马来语语音合成系统设计与实现[D].云南大学.2018

[9].颜科先.基于HMM的汉语情感语音合成系统的实现与改进[D].云南大学.2018

[10].伍烛梅.基于HMM的傣语语音合成系统研究[D].云南大学.2017

标签：语音交互; 语音识别; Speech; SDK;

语音合成系统论文-华凯晨,王晖,张振宇,侯凯博,赵晨光

语音合成系统论文文献综述

语音合成系统论文开题报告

语音合成系统论文参考文献

猜你喜欢