音节自动标注论文-何向真,李亚超,马宁,于洪志

音节自动标注论文-何向真,李亚超,马宁,于洪志

导读:本文包含了音节自动标注论文开题报告文献综述及选题提纲参考文献,主要关键词:藏文,分词,序列标注,最大熵

音节自动标注论文文献综述

何向真,李亚超,马宁,于洪志[1](2015)在《基于音节标注的藏文自动分词研究》一文中研究指出分词是藏文信息处理的基础性关键问题,是把连续的藏文音节序列组合成词序列的过程。针对藏文分词中的特殊问题,把藏文分词问题看成判断音节在词中的位置过程,分别实现了基于最大熵、条件随机场、最大间隔Markov网络模型等模型下的分词系统,并在同等条件下进行了实验对比。实验结果表明,在当前四字位的标注集下,基于条件随机场的藏文分词系统取得了最好的分词结果,同时其他序列标注模型也取得了较好的效果,说明基于音节标注的分词方法可以较为有效地处理藏文分词问题。(本文来源于《计算机应用研究》期刊2015年07期)

韩虎[2](2008)在《汉语连续语音的音节自动标注算法研究及实现》一文中研究指出对连续语音语料库进行切分或标注是整个连续语音识别系统的基础和前提,而且也是一项非常重要的工作,因为它对语料库的充分利用有重要作用,对连续语音识别系统的性能有重要影响。传统的切分或标注语音库的方法是靠人工手工完成,这种方式不但工作效率很低、工作量太大,而且切分数据的准确性也得不到保证,所以一种能够自动、准确切分或标注语音库的方法显得特别有意义和研究价值。在近几年使用隐马尔可夫模型的语音识别已经成为主导,从已经发表的相关论文的数量和在重要的语音会议上所作的讲座的数量就可以证明。此方法之所以如此受欢迎,其原因有以下几点,一是其内在的统计的(数学上准确)框架,二是从有限的训练集语音数据估计出模型参数的训练算法的易用性和可用性,叁是结果识别系统的灵活性,可以改变模型的大小、类型或者结构来配合特殊的话语、声音等等,最后是整个识别系统实现的简单性。本文通过对隐马尔可夫模型的研究,提出了汉语连续语音音节自动切分的方法。这种音节自动标注算法,可以将存在大量协同发音现象的连续语音切分成一个个音节。在本文中也将此方法与采用其它技术实现的自动标注方法进行对比,在本文中所实现的其它技术包括基于归并的音节切分自动机,最大熵模型。在连续语音上的切分实验结果说明这种基于HMM的音节自动标注算法是准确而可靠的。(本文来源于《哈尔滨工业大学》期刊2008-12-01)

周俏峰,蔡莲红[3](1995)在《音节数据库基音自动标注工具的研究》一文中研究指出本文给出了一个小波变换和自相关算法相结合的基音周期检测算法,以及如何确定基音周期起始点的方法,并以此研制了一个基音周期的自动标注工具,用于语音合成数据库的标注,计算速度快,计算结果准确。(本文来源于《小型微型计算机系统》期刊1995年10期)

音节自动标注论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

对连续语音语料库进行切分或标注是整个连续语音识别系统的基础和前提,而且也是一项非常重要的工作,因为它对语料库的充分利用有重要作用,对连续语音识别系统的性能有重要影响。传统的切分或标注语音库的方法是靠人工手工完成,这种方式不但工作效率很低、工作量太大,而且切分数据的准确性也得不到保证,所以一种能够自动、准确切分或标注语音库的方法显得特别有意义和研究价值。在近几年使用隐马尔可夫模型的语音识别已经成为主导,从已经发表的相关论文的数量和在重要的语音会议上所作的讲座的数量就可以证明。此方法之所以如此受欢迎,其原因有以下几点,一是其内在的统计的(数学上准确)框架,二是从有限的训练集语音数据估计出模型参数的训练算法的易用性和可用性,叁是结果识别系统的灵活性,可以改变模型的大小、类型或者结构来配合特殊的话语、声音等等,最后是整个识别系统实现的简单性。本文通过对隐马尔可夫模型的研究,提出了汉语连续语音音节自动切分的方法。这种音节自动标注算法,可以将存在大量协同发音现象的连续语音切分成一个个音节。在本文中也将此方法与采用其它技术实现的自动标注方法进行对比,在本文中所实现的其它技术包括基于归并的音节切分自动机,最大熵模型。在连续语音上的切分实验结果说明这种基于HMM的音节自动标注算法是准确而可靠的。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

音节自动标注论文参考文献

[1].何向真,李亚超,马宁,于洪志.基于音节标注的藏文自动分词研究[J].计算机应用研究.2015

[2].韩虎.汉语连续语音的音节自动标注算法研究及实现[D].哈尔滨工业大学.2008

[3].周俏峰,蔡莲红.音节数据库基音自动标注工具的研究[J].小型微型计算机系统.1995

标签:;  ;  ;  ;  

音节自动标注论文-何向真,李亚超,马宁,于洪志
下载Doc文档

猜你喜欢