导读:本文包含了语音语料库论文开题报告文献综述及选题提纲参考文献,主要关键词:远程教育,TAN网络,标注者评估模型,藏语语音语料库
语音语料库论文文献综述
裴欢欢[1](2019)在《面向西藏地区初中远程教育的语音语料库构建》一文中研究指出在现代信息技术的普及和支持下,远程教育的发展得到了巩固和加强,实现教育资源的优质化、共享化和公平化,是我国各级各类学校以及各民族地区对教育的追求。我国藏族地区由于交通、地理位置等因素影响,中小学教育资源相对于其他地区相对匮乏,而远程教育所具有的跨时空、提高资源利用率的特性弥补了藏区地域等方面限制,扩大了受众群体,让藏区学生能够随时随地的学习,实现全国教育信息化。远程教育平台中语音语料库是教学资源,尤其是少数民族语言教学资源中必不可少的模块,其中藏语中学的教学语音信息资源较少,语音语料库不够具有针对性,而语音学标注专家也比较缺乏,标注大量的中小学藏语教学语音资源是一件十分费时费力的工作。为了建立优质的语音语料库,在本文中采用基于TAN网络的标注者评估模型预测标注者的标注数据的准确度,以便为使具有较高标注信任度的数据进入语料集,抑制差标注者的标注噪声数据进入数据集;又使得标注者通过共享数据学习他人的标注经验,提高标注水平,最终标注质量得到控制。本文阐述了贝叶斯网络和藏语语音标注系统的相关原理,以及应用在藏区中学远程教育中的必要性。根据录音内容进行人工标注,利用MATLAB工具对标注者可信数据开展基于TAN网络的标注者评估模型的构建,控制语音语料库仅接受可信度高的标注者标注的语音数据,实现标注者辅助学习模型,构建优质的藏语中学远程教育语音语料库,然后利用Dreamweaver实现藏语初中语文远程教育网站,加强藏族地区远程教学过程中藏语的学习,提高学习者的学习正确率,加速优秀教育资源在藏区的传播,促进藏区教育现代化的进程。(本文来源于《中央民族大学》期刊2019-05-07)
刘凯,田朝阳,齐美,张茜,张滢[2](2019)在《关于建立渤海大学非洲留学生中介语语音语料库的设想》一文中研究指出本文主要探讨建立渤海大学非洲留学生中介语语音语料库的创作思路,分析录音文本设计和语音库标注等问题。录音文本设计力求全面、典型、合理,尽量涵盖所有的音段和超音段的汉语音节,为此我们设计了单音节、双音节、叁音节和四音节四个子库。语音标注体系决定着语音库的建设能否成功,该库采用SAMPA-C汉语音段标注体系,并且采用曹文、张劲松在2009年提出的汉语中介语语音语料库音段标注规范(BLCU-CAPL)对语音偏误进行标注,使使用者通过文本的标注能了解学习者的偏误,为语言研究和语言教学提供支持。(本文来源于《智库时代》期刊2019年16期)
罗亮,李雨虹[3](2018)在《彝族中学生英语语音语料库设计研究》一文中研究指出基于彝族中学生英语语音教学现状的把握可知彝族中学生英语语音语料库设计是一项非常迫切而复杂的研究课题。该文重点论述了四个核心问题:彝族中学生英语语音语料库设计的客观需求、彝族中学生英语语音语料库设计研究的现状、彝族中学生英语语音语料库的基本构成、彝族中学生英语语音语料库的主要设计策略。(本文来源于《海外英语》期刊2018年15期)
徐健[4](2018)在《维吾尔语语音语料库管理平台的研究与实现》一文中研究指出随着自然语言处理技术的发展,语音合成、语音识别、语音翻译、说话人识别也得到了快速的发展。而这些技术都离不开语音语料,它们都需要大规模、高质量的语音语料来进行训练和测试。要得到高质量的语料就需要对语料进行很好的管理,这就需要设计一个维吾尔语语音语料库管理平台。可以集录音、标注、管理为一体的语音语料平台,而且可以让研究维吾尔语相关技术的学者能够播放、查看、查询、统计相关的语音语料,以及对维吾尔语应用工具的下载。为解决维吾尔语语音语料库管理平台方面的设计空缺以及传统的应用软件C/S架构的问题,提出了一种基于在线的维吾尔语语音语料库管理平台。主要研究内容和成果如下:1、结合语音学、声学方面知识,对维吾尔语的音素、编码、音系结构、音节结构、韵律特征、协同发音做了研究。维吾尔语一共有32个音素,采用Unicode编码,得出了音系结构、音节结构、重音韵律、长度韵律、协同发音的规律。2、从发音人规范、数据采集规范、数据存储规范、语料筛选规范、语料标注规范、法律声明6个方面对语料库进行了规范。对发音文本进行了设计,包括文本的获取、文本归正、文种转换、语料筛选。对语音录制进行了设计,包括发音人的确定、语音采集。语音库的标注采用praat软件。其中对文本的获取采用了爬虫技术。3、通过Microsoft Visual Studio 2012开发工具、Asp.net web开发、C#语言、Microsoft SQL Server 2012数据库,以及GridView控件与SqlDataSource的数据绑定把语料显示在页面上、chart控件来显示统计对比分析图、config配置数据连接、audio控件来播放,这些技术来实现语音语料库管理平台的增加、删除、编辑、查询、播放、导出Excel表、查看、下载、上传、用户权限、统计分析等功能。该管理平台已应用到新疆多语种实验室。语音合成12000条语音语料,合成标注6000条。语音识别15000条语音语料,其中电话语音语料3000条、情感语音语料6000条、方言语音语料3000条、其它ASR语音语料3000条,识别标注3000条。4、共同实现了维吾尔语标注平台,主要功能有分配任务、单个上传任务、批量上传任务、留言管理、内容审核、维文和拉丁文转换、播放语音语料。主要技术采用JetBrains PhpStorm 10.0.1编辑器、XAMPP服务器软件、php语言、mysql数据库、CI框架。对密码进行了md5算法加密处理。该平台已应用到新疆多语种实验室,在线标注了18000条句子,其中60个人(30男30女),每人300条。5、共同实现了维吾尔语录音软件,主要功能有录音,音频文件查看、播放、重命名、删除、查询录音数量、查看帮助、任务下载。主要技术采用Eclipse开发软件、java语言、SQLite数据库、Android平台。该录音软件已应用到新疆多语种实验室,20个人(10男10女)都录音了陈述句105条,感叹句137条,问句100条。本文对维吾尔语语音语料库管理平台分别从功能、性能、页面、安全性进行了测试,其中在性能测试中使用了谷歌浏览器的开发者模式对访问平台的5个特征requests、transferred、Finish、DOMContentLoaded、Load进行了测试。与传统的C/S架构的语料库平台相比,此平台界面友好,功能齐全,语音语料的质量有了很大的提高。通过平台测试和运行结果表明,此平台效果更为显着。将收集到的语音识别语音语料在Kaldi上使用各种模型进行训练和测试,得到DNN模型的WER为8.24%,语音识别效果最好。(本文来源于《新疆大学》期刊2018-05-25)
徐健,热依曼·吐尔逊,吾守尔·斯拉木[5](2018)在《在线多语种语音语料库平台的研究与实现》一文中研究指出为解决多语种语音语料库方面的设计空缺以及传统的应用软件C/S架构的问题,提出了一种基于在线的多语种语音语料库平台。首先,研究多语种语音语料库的设计过程,包括语料库的规范、语音文本的设计、语音录制、语音库的标注以及平台总体设计、平台的功能;其次,对管理平台、录音软件、标注平台功能相关技术的实现;最后,在服务器上进行部署平台,用户在浏览器里进行测试。与传统的C/S架构的语料库平台相比,此平台界面友好,功能齐全,语音语料的质量有了很大的提高。平台运行结果表明,此平台效果更为显着。(本文来源于《信息通信》期刊2018年04期)
杨健,李海光,张晓玲[6](2017)在《白语语音语料库建设研究》一文中研究指出白语的使用受到外来经济文化的不断冲击影响,正面临日益消亡的危险境地。针对这个问题,提出建立面向语音识别和语音合成应用的白语语音语料库,对语音语料库建设中涉及的语料采集和处理,语料库系统结构和数据存储结构,语料库用于语言学研究的接口等问题进行了阐述,提出相应的解决方法。(本文来源于《大理大学学报》期刊2017年12期)
金鑫,张克亮[7](2017)在《面向印度英语语音识别的语音语料库构建研究》一文中研究指出0引言2013年,国家主席习近平提出共建"一带一路"重大战略,印度是这一沿线极为重要的关键节点。中印经济贸易的迅速发展必然带来更多的信息交流,包括更多的语音数据,如何更快更好地获取和处理这些语音数据,并让其充分发挥效益,关键在于印度英语自动语音识别(Automatic Speech Recognition,ASR)技术的提高。本文以探索一种低成本、高效率和高质量的印(本文来源于《中国声学学会2017年全国声学学术会议论文集》期刊2017-09-22)
李柳娜,张娜[8](2017)在《语音语料库在语音教学中的作用研究》一文中研究指出语音学习是英语学习中的一个重要方面,语音语料库为英语语音教学提供了一个新的平台。但是,怎样在语音教学中利用语音语料库提高语音教学效果是英语教学中的一大难题。语音语料库已经成为语音研究和语音教学中重要技术手段。本文从语音教学的角度探究语音语料库的现状,提出学习语音的重要意义以及语音语料库建立的意义,举例说明引入语音语料库在教学中的运用,展现语音语料库在语音教学中的重要性和起到的积极作用。(本文来源于《当代教育实践与教学研究》期刊2017年07期)
黄晓辉,李京,马睿[9](2018)在《藏语口语语音语料库的设计与研究》一文中研究指出基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时,包含音素、半音节、音节、藏文字以及语句共5层标注信息的藏语拉萨话口语语音语料库。统计结果显示,该语料库在保留口语语音自然属性的同时,对音素、半音节等常用语音建模单元也有均衡的覆盖,为基于藏语口语语音数据的语音识别技术研究提供了可靠的数据支撑。(本文来源于《计算机工程与应用》期刊2018年13期)
严晓雯[10](2017)在《基于语音语料库的《长生殿》及其英译本的韵律音系学研究》一文中研究指出《长生殿》作为中国四大经典戏剧之一,具有极高的艺术成就,也成为昆曲、京剧的传统曲目。文献研究表明,以往对于《长生殿》的研究多集中于戏剧主题和戏剧创作意义等,而对于其翻译的研究较少,且多着重于翻译策略或美学再现方面。戏剧翻译相关研究主要关注戏剧原文与译文对等、戏剧翻译作品中语用要素再现和翻译的文化对比等,而将戏剧翻译与韵律音系学结合的较少。因此,本研究以中国传统戏剧经典《长生殿》的经典曲目《定情》和《惊变》为例,结合韵律音系学理论与研究方法,分析唐明皇、杨贵妃、高力士叁个主要角色语言的韵律特征,并且比较杨宪益、戴乃迭和许渊冲、许明两个英译本中对这叁个角色语言韵律特征的表现,分析韵律特征对人物塑造的影响,探究哪一个译本更加适用于舞台表演,从而构建戏剧翻译的韵律音系学评价体系。为保证研究客观性,本文采用数据驱动的研究方法,选取洪升《长生殿》中《定情》和《惊变》为源语文本,杨宪益、戴乃迭(杨译)和许渊冲、许明(许译)的两个英译本为目的语文本,借助语音合成软件InterPhonic 6.0完成文字-音频转换。研究选择时长、音高和音强作为分析参数,借助Praat 6.0软件提取文件时长、最大音高、最小音高、平均音高、最大音强、最小音强。作为数据驱动研究,本研究中数据差异引导研究关注点,并且根据数据追踪不同译本的韵律再现效果,从而构建基于韵律音系学的戏剧翻译评价体系。研究结果表明:(1)在时长方面,杨译本叁个人物的唱词大多比许译本短,与原文较为一致,更能准确地再现剧中人物的性格特征和情感基调。(2)在音高层面上,本研究主要考查了音高起伏度的变化。相比杨译本,许译本整体调域变化最为明显,更强调音高大幅变化,益于表现情感起伏;并且音高起伏位置、幅度与原文一致性更高。但也为演员在短时间内再现音高变化增加了困难。(3)音强方面,由于中英文固有的差异,两个译本的音强都比原文低得多,大多只有原文的叁分之一至一半。比较而言,杨译本更接近原文,音强曲折变化更多。(4)在重构人物方面,杨译本的一些表达与原文更接近,而许译本对不同角色话语的翻译具有内在一致性。本研究运用语料库手段,以韵律音系学为理论框架,比较研究中国传统名剧《长生殿》及其翻译的韵律特征和戏剧特征,构建戏剧翻译的韵律音系学评价体系,对于推动中国传统戏剧及其翻译研究和中国文化传播具有重要价值。(本文来源于《江苏大学》期刊2017-06-01)
语音语料库论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要探讨建立渤海大学非洲留学生中介语语音语料库的创作思路,分析录音文本设计和语音库标注等问题。录音文本设计力求全面、典型、合理,尽量涵盖所有的音段和超音段的汉语音节,为此我们设计了单音节、双音节、叁音节和四音节四个子库。语音标注体系决定着语音库的建设能否成功,该库采用SAMPA-C汉语音段标注体系,并且采用曹文、张劲松在2009年提出的汉语中介语语音语料库音段标注规范(BLCU-CAPL)对语音偏误进行标注,使使用者通过文本的标注能了解学习者的偏误,为语言研究和语言教学提供支持。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
语音语料库论文参考文献
[1].裴欢欢.面向西藏地区初中远程教育的语音语料库构建[D].中央民族大学.2019
[2].刘凯,田朝阳,齐美,张茜,张滢.关于建立渤海大学非洲留学生中介语语音语料库的设想[J].智库时代.2019
[3].罗亮,李雨虹.彝族中学生英语语音语料库设计研究[J].海外英语.2018
[4].徐健.维吾尔语语音语料库管理平台的研究与实现[D].新疆大学.2018
[5].徐健,热依曼·吐尔逊,吾守尔·斯拉木.在线多语种语音语料库平台的研究与实现[J].信息通信.2018
[6].杨健,李海光,张晓玲.白语语音语料库建设研究[J].大理大学学报.2017
[7].金鑫,张克亮.面向印度英语语音识别的语音语料库构建研究[C].中国声学学会2017年全国声学学术会议论文集.2017
[8].李柳娜,张娜.语音语料库在语音教学中的作用研究[J].当代教育实践与教学研究.2017
[9].黄晓辉,李京,马睿.藏语口语语音语料库的设计与研究[J].计算机工程与应用.2018
[10].严晓雯.基于语音语料库的《长生殿》及其英译本的韵律音系学研究[D].江苏大学.2017