短语边界论文-孙妍

短语边界论文-孙妍

导读:本文包含了短语边界论文开题报告文献综述及选题提纲参考文献,主要关键词:原型范畴,连续统,词,短语

短语边界论文文献综述

孙妍[1](2019)在《谈汉语短语、词和语素的边界问题》一文中研究指出原型范畴理论之下词法与句法没有明显界限,汉语也是如此。但传统的二分法无法对范畴边界部分的非典型成员做出很好的定位。因此,我们尝试在连续统观念下对词和短语的关系进行描述,提出了4个测定双音复合结构凝固性的标准,由此可描述出典型词到典型短语之间的渐变过程。正因为复合结构本身是一个连续统,那么其构成成分——语素和词之间也不存在明显界限。在此前提下,我们进一步提出了从黏着语素到词之间的连续统。(本文来源于《成都师范学院学报》期刊2019年08期)

汪丹丹[2](2018)在《一种基于多属性模糊决策的英文韵律短语边界预测方法》一文中研究指出对于各类TTS(Text to Speech)系统而言,能否准确地预测韵律短语边界对TTS系统的效果有着关键性的影响.目前常使用决策树来做韵律短语边界预测,但这种方法受到了训练数据的均衡性以及决策算法本身无法达到全局最优的制约.为了改善预测效果,在传统的决策树方法之上,将决策树使用的聚类属性与模糊决策相结合,提出通过多属性模糊决策方法来预测英文韵律短语边界.实验表明,使用这种方法后,效果比基于决策树的预测方法的效果有较大提升,F-Score由64. 4%提升到69. 3%,不可接受率也从28. 6%降低到21. 4%.(本文来源于《西安文理学院学报(自然科学版)》期刊2018年06期)

王娟[3](2017)在《语音韵律短语边界处的声学表现及语音停顿识别》一文中研究指出语句韵律结构信息在语音合成与语音识别中非常重要。在语音合成中,自然度与可懂度是两个重要的指标,当前可懂度已经达标,但是自然度还是不够,这是因为计算机无法准确的对语句信息中的韵律进行识别。在语音识别中,要实现人机自然交流,让计算机能够读懂人的语言,并精确辨别语句含义或说话人,从而将说话人语句转换为机器语言,并按照语句含义进行准确操作,这就需要计算机能够准确识别语句中的语音停顿并对语句进行自动划分。所以,语句的韵律信息非常具有研究意义,而韵律是一个感知概念,语音中包含的韵律信息比文本更加准确。所以本文从声学角度出发,直接从语音中提取声学特征参数,对韵律短语边界处的声学特征参数进行分析,并基于所得的声学特征构建模型,实现基于语音的语音韵律停顿识别。本文主要工作有以下叁部分:(1)文本处理及音频特征提取对文本语料进行分词,通过分词去除不可能存在的韵律边界,基于汉字—拼音字典将分词后的语句转换为其对应的拼音串。基于语音语料,获取声学参数,如:语音短时能量、短时幅度、短时过零率、基频、质心、谱熵、信息熵、语音声母韵母等音节时长等,提取其相关波形曲线或数据。(2)语音韵律边界处的声学表现分析基于上述声学特征的相关波形曲线或数据,对语音停顿处的声学表现进行初步分析;然后基于声学特征参数的组合或转换,对汉语语音韵律边界处的各种声学表现进行进一步的分析。(3)基于声学特征的语音停顿识别首先根据韵律边界处的声学表现,构建候选声学特征集,然后通过特征选择选择合适的声学特征构建特征模板;最后利用支持向量机模型实现韵律停顿的自动识别,并对实验结果进行分析。(本文来源于《山西大学》期刊2017-06-01)

李枭[4](2017)在《基于文本和语音特征的汉语韵律短语边界预测》一文中研究指出目前,语音合成技术在公共信息咨询与发布、语音应答、手机语音服务、主持文稿校对、残疾人辅助等许多方面得到广泛应用。可懂度和自然度是衡量语音合成质量的主要指标,合成高可懂度、高自然度的语音,一直是语音合成所追求的目标。现阶段合成语音的可懂度已经达到了较高的水平,但自然度还不够理想,主要问题是语音表达中语句节奏感较差,机器味太重,情感中缺少轻重缓急和抑扬顿挫。因此,实现恰当的韵律切分,正确地把握话语的韵律结构,是加强合成语音节奏感、提高其自然度的关键。针对提高合成语音的自然度问题,本文的主要工作是通过研究汉语的韵律结构,实现对韵律短语边界的自动预测。本文主要研究内容有:(1)韵律短语边界处文本与语音特征的分析与提取目前,研究人员对韵律短语边界预测大多数采用的都是词、词性、词长等代表性的文本特征,但是单从文本特征进行韵律短语边界预测的效果并不理想,因此本文提出了基于文本与语音组合特征的汉语韵律短语边界预测方法,通过统计分析韵律短语边界处的文本与语音特征,利用不同模型的特征选择算法,选取模型最优特征集进行模型的训练与预测。(2)基于文本特征的韵律短语边界预测从人工标注的语料中提取文本特征,主要包含有:词、词性、词长等常见的文本特征,通过分析条件随机场模型中的原子特征、组合特征,确定sCRF模型的特征模板,构建基于sCRF的韵律短语边界预测模型。通过对最大熵模型原理的介绍,利用最大熵方法也建立了韵律短语预测模型,并对预测结果进行了对比分析。(3)基于文本与语音组合特征的韵律边界预测在文本特征的基础上加入语音特征,包括音节延缩比、韵母时长延缩比、音节类型、无声段相对时长、声调类型等特征。通过对提取特征的分析,选取最优的特征选择算法,分别利用最大熵与条件随机场方法建立不同的韵律短语边界预测系统,与基于文本特征的预测实验结果进行对比分析。(本文来源于《山西大学》期刊2017-06-01)

黄贤军,郑海洋,吕士楠,杨锦陈[5](2016)在《韵律短语边界对降阶和焦点后音高骤降的影响》一文中研究指出通过设计特定声调组合和语境的实验室语句,考察了韵律短语边界对语句中降阶和焦点后音高骤降的影响规律,以及降阶和焦点的作用域。结果发现,在由两个韵律短语组成的语句中,韵律短语边界会阻断前一短语中的降阶作用,降阶的作用域是韵律短语。焦点的实现与降阶不同:焦点后的正向音高降低作用会跨越韵律短语边界,使得后一韵律短语的高音线明显降低;如果后一韵律短语中有降阶,则焦点的跨边界音高降低作用会与降阶作用累积在一起,产生更低的高音线,说明焦点的作用域是语调短语。但当后一韵律短语也出现焦点时,音高重置阻断了前一短语中焦点的正向音高降低作用,此时两个焦点分别独立地实现。(本文来源于《声学学报》期刊2016年04期)

韩朝阳,刘国兵,王跃武[6](2015)在《一种新型英语基本名词短语识别方法——基于边界概率与N_Gram词性串规则相结合》一文中研究指出英语基本名词短语识别是一种重要的基础性自然语言处理活动,其识别准确率与召回率直接影响其它相关自然语言处理活动效果。在分析、总结几种具有代表性基本名词短语识别方法的基础上,提出了一种新型识别方法,其核心是:把边界概率与N_Gram词性串规则相结合作为识别判断条件,以"假拟中心词"为起点,分别向左、向右识别出当前"假拟中心词"所在基本名词短语的左、右边界。实验证明,该方法的识别准确率为97.13%、召回率为98.75%,FB=1为97.93%。(本文来源于《软件导刊》期刊2015年08期)

孟红霞,白学军,闫国利,姚海娟[7](2015)在《词边界信息对读者阅读歧义短语时眼跳策略的影响》一文中研究指出采用Eye Link 2000眼动仪,选取60个歧义短语,要求大学生被试阅读包含有歧义短语的句子。句子的呈现设置了四种条件:正常无阴影、词间阴影、歧义阴影和字间阴影,以探讨词边界信息是否影响读者阅读歧义短语时的注视位置效应。结果发现:读者对歧义短语的首次注视位置在四种条件下基本一致;词边界信息影响读者对歧义短语的再注视概率。结果表明,词边界信息对歧义短语的影响主要体现在眼跳行动(即"where")的晚期阶段。(本文来源于《心理科学》期刊2015年04期)

冯志茹[8](2015)在《基于语块的汉语韵律短语边界识别研究》一文中研究指出科技在进步,时代在发展,在这个“读图”和“听音”的时代,语音技术深入到人们生活的各方各面,让机器说话已不是幻想。然而,目前语音合成的质量仍不是很高,主要表现在:合成的语音自然度低、节奏感差,所以,语音合成自然度的进一步提高是目前亟待解决的问题。本文的研究工作主要针对汉语韵律结构中的韵律短语识别展开。韵律结构是以句法结构为基础的。通过对大量语料的分析可以看出,韵律结构和句法结构之间存在着一定的联系。由于语块本身可以反映出一定的句法信息,且人们在朗读或说话时往往是以语块为基本单位的,语块的切分可以把句法上相关的词进行整合,所以本文提出将语块结构这种非递归嵌套的浅层句法结构应用于韵律短语的预测。本文的主要工作包括以下几个方面:(1)语块的定义及获取目前对韵律层级的划分所使用的特征多为词、词性和词长。基于这些特征的局限性和韵律结构与句法信息之间的紧密联系,在对汉语语块结构与韵律结构之间的关系进行比较研究的基础上,本文定义了8种适用于韵律短语边界识别的语块类型,并归纳总结了语块的处理规则,通过语块之间结合紧密度的度量,实现了语块的归并,生成了最终的语块结构。(2)基于语块和条件随机场的韵律短语识别本文将语块结构这种非递归嵌套的浅层句法结构应用于韵律短语的预测,提出了一种基于语块信息,并利用条件随机场CRFs对韵律短语进行识别的方法。首先基于语块结构抽取、选择模型特征,然后利用CRFs训练构建模型用于韵律短语的识别。(3)基于语块和AdaBoost-SVM集成算法的韵律短语识别由于寻找一种较强的分类算法用于韵律短语的识别较为困难,基于强、弱学习算法的等价性问题,利用集成学习方法能够使多个准确率略高于随机猜测弱分类器进行加权融合,形成一个强学习算法,达到比强分类器更好的分类效果,所以,本文使用AdaBoost集成学习算法,以SVM作为基分类器,通过对训练语料多次随机抽取,经过多次训练更改权重,训练生成多个基分类器,最终将这几个基分类器进行加权投票的方法集成,形成一个新的强分类器完成对韵律短语的预测。本文分别使用CRFs、CRFs+语块、SVM、SVM+语块、AdaBoost-SVM+语块的方法实现了韵律短语边界的识别模型,并将各个模型的性能进行了对比,重点考察了使用语块信息与否时的模型性能。实验结果显示,在各种不同的方法下,引入语块结构后,模型的性能均比之前有了较为明显的提升。这就证明,语块信息能够在韵律结构的识别研究中得到应用并做出积极有效的贡献。(本文来源于《山西大学》期刊2015-05-01)

孟红霞,白学军,闫国利[9](2014)在《词边界信息对读者阅读歧义短语时眼跳策略的影响》一文中研究指出拼音文字阅读过程中,读者对一个单词的首次眼跳经常落在该词开头的1/4处,被称为偏向注视位置。当首次眼跳落在单词的中心部位时,再注视该词的概率最小,此位置被称为最佳注视位置。两个位置的发现表明,读者眼跳选择的目标是单词。那词的哪些因素影响偏向和最佳注视位置呢?大量研究发现,词间空格(即词边界信息)是一个很重要的影响因素。但是,并不是所有的文字都有词边界信息,例如中文。有研究者将词边界信息(插入词间空格)引入中文,结果发现,词边界信息能够有效地引导读者的眼动行为(Zang et al.,2013a)。中文中存在一些特殊短语,如"专科学生","专科"是一个词,"科学"是一个词,"学生"又是一个词,把这类短语称为"歧义短语"(spatially ambiguous words)。如果将词边界信息引入到歧义短语中,是否也产生一定的促进作用?本研究选取60个歧义短语,并用60个歧义短语造句。设置了四种词边界信息条件:正常无阴影条件(根据Bai等人(2008)的研究,阴影与空格有同样的词切分作用)、词间阴影条件、歧义阴影条件和字间阴影条件。在实验条件间按照拉丁方顺序形成4组实验材料,每个被试阅读其中的一组。每组包含60个句子,每种条件下15个句子,每组内句子随机呈现。采用SR Research Eye Link2000 Eyetracker记录56名被试阅读实验句时的眼动轨迹。结果发现,读者在阅读四种条件下的歧义短语时,表现出相似的眼动模式,即单次注视事件中,读者对歧义短语的首次注视倾向于落在中间位置,多次注视事件中,首次注视倾向于落在歧义短语的开始位置,并且当首次注视落在开始位置时,再注视歧义短语的概率最高。本研究还发现,词边界信息影响读者对歧义短语的再注视概率,即字间阴影条件下,读者的再注视概率最高。结果表明,词边界信息对歧义短语的影响主要体现在歧义短语加工的晚期阶段。(本文来源于《第十七届全国心理学学术会议论文摘要集》期刊2014-10-10)

杨晓春,霍亚凤[10](2013)在《师范院校英语专业学生对英语语调短语边界的感知与理解》一文中研究指出依据Halliday(1967)的英语语调叁重系统理论,以语调短语划分(Tonality)为切入点,考察师范院校英语专业学生对英语语调短语边界的感知及理解情况。结果表明:师范院校英语专业学生能够较好的感知到对比组中两个句子语调短语边界位置的不同,但不能较好地理解由于语调短语边界不同而引起的两个句子在意义上的不同。(本文来源于《新余学院学报》期刊2013年02期)

短语边界论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

对于各类TTS(Text to Speech)系统而言,能否准确地预测韵律短语边界对TTS系统的效果有着关键性的影响.目前常使用决策树来做韵律短语边界预测,但这种方法受到了训练数据的均衡性以及决策算法本身无法达到全局最优的制约.为了改善预测效果,在传统的决策树方法之上,将决策树使用的聚类属性与模糊决策相结合,提出通过多属性模糊决策方法来预测英文韵律短语边界.实验表明,使用这种方法后,效果比基于决策树的预测方法的效果有较大提升,F-Score由64. 4%提升到69. 3%,不可接受率也从28. 6%降低到21. 4%.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

短语边界论文参考文献

[1].孙妍.谈汉语短语、词和语素的边界问题[J].成都师范学院学报.2019

[2].汪丹丹.一种基于多属性模糊决策的英文韵律短语边界预测方法[J].西安文理学院学报(自然科学版).2018

[3].王娟.语音韵律短语边界处的声学表现及语音停顿识别[D].山西大学.2017

[4].李枭.基于文本和语音特征的汉语韵律短语边界预测[D].山西大学.2017

[5].黄贤军,郑海洋,吕士楠,杨锦陈.韵律短语边界对降阶和焦点后音高骤降的影响[J].声学学报.2016

[6].韩朝阳,刘国兵,王跃武.一种新型英语基本名词短语识别方法——基于边界概率与N_Gram词性串规则相结合[J].软件导刊.2015

[7].孟红霞,白学军,闫国利,姚海娟.词边界信息对读者阅读歧义短语时眼跳策略的影响[J].心理科学.2015

[8].冯志茹.基于语块的汉语韵律短语边界识别研究[D].山西大学.2015

[9].孟红霞,白学军,闫国利.词边界信息对读者阅读歧义短语时眼跳策略的影响[C].第十七届全国心理学学术会议论文摘要集.2014

[10].杨晓春,霍亚凤.师范院校英语专业学生对英语语调短语边界的感知与理解[J].新余学院学报.2013

标签:;  ;  ;  ;  

短语边界论文-孙妍
下载Doc文档

猜你喜欢