导读:本文包含了基于的译文获取论文开题报告文献综述及选题提纲参考文献,主要关键词:复杂名词短语识别,双语实例库,机器翻译,短语译文获取
基于的译文获取论文文献综述
薛丽花[1](2016)在《基于多策略的汉语复杂名词短语译文获取技术研究》一文中研究指出名词短语在句子中广泛使用且占有重要地位。在翻译过程中,获取名词短语的译文可以在很大程度上为理解句子提供帮助和参考。本文在分析了名词短语结构的基础上,提出复杂名词短语的概念。汉语复杂名词短语译文获取工作对于跨语言检索以及汉英机器翻译等应用具有直接的指导意义和应用价值。综合目前现有的机器翻译方法的优势,本文提出了基于多策略的汉语复杂名词短语译文方法。由于实例库是基于实例方法的必要前提,本文通过人工和自动两种方式构建了双语短语库。另外,本文还采用人工书写方式定义了翻译模板,为基于模板方法提供模板库。最终本文实现了汉语复杂名词短语的识别和译文获取工作,相较于单一译文获取方法,提升了译文质量。主要工作包括:第一,构建双语短语库,为基于实例获取短语译文方法提供实例库。本文提出了自动和人工两种方式,完成了包含23万双语短语对的双语实例库构建。在人工构建过程中,本文提出了适用于本文的汉语复杂名词短语标注规范。在自动构建过程中,提出了双语短语自动获取方法和引入词聚类特征的汉语复杂名词短语识别方法。第二,本文实现了翻译模板制定。通过分析双语短语库中短语对的组成结构,本文采用人工书写方式制定了200条翻译模板,用作基于模板获取短语译文的模板库。第叁,实现了汉语复杂名词短语的英文译文获取。综合基于统计、基于实例和基于翻译模板等方法在获取译文方面的优势,本文提出了基于多策略的汉语复杂名词短语译文获取方法。实验结果显示,相较于本文基线系统NiuTrans,本文提出的基于多策略获取到的短语译文BLEU值提高了3.8个百分点。(本文来源于《沈阳航空航天大学》期刊2016-03-01)
诺明花,吴健,刘汇丹,丁治明[2](2011)在《汉藏短语对抽取中短语译文获取方法研究》一文中研究指出该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,词法句法相关技术不成熟,该文提出藏文词串频率统计方法(TSM)和藏文词序列相交算法(TIA)两种方法来获取藏语译文。其中TSM抽取1-1连续和非连续短语准确率达到90%左右,但遗漏1-n情况。TIA能够抽取1-n连续和非连续藏文语块,准确率达到81%。(本文来源于《中文信息学报》期刊2011年03期)
杨沐昀,石振勇,朱俊国,李生,赵铁军[3](2010)在《基于WEB检索的论文标题译文获取》一文中研究指出现有的论文标题译文通常由统计机器翻译或者通过辅助翻译得到,这两种方法对于标题的译文获取有明显的不足。本文在分析了汉语标题的特点及WEB译文获取技术后,提出了一种基于WEB检索的论文标题译文获取方法。实验表明,通过该方法获取的论文标题译文能够达到与Google在线翻译相同的质量。(本文来源于《第六届全国信息检索学术会议论文集》期刊2010-08-12)
王辰,宋国龙,吴宏林,张俐,刘绍明[4](2009)在《基于序列相交的短语译文获取》一文中研究指出短语译文获取技术是基于实例的机器翻译(EBMT)中的核心技术之一,其准确率直接影响到EBMT系统的性能。该文提出了一种基于序列相交的短语译文获取方法,该方法将句子视为词的序列,利用对中日句对齐语料库中包含待译短语的所有源语句子对应的目标语句子进行序列相交的方式,在不需要词对齐、句法分析及词典等资源的情况下,通过充分挖掘句对齐双语语料库的信息,获得高质量的短语译文。实验表明,该方法获得的短语译文准确率超过80%。(本文来源于《中文信息学报》期刊2009年01期)
周瑜玲,胡卓婷[5](2008)在《从关联理论视角分析《尺素寸心》译文中最佳关联的获取》一文中研究指出关联理论和关联翻译理论是以一种新的视角和途径揭示语言使用的本质特征的理论,为翻译的研究带来了新的思路。该文着重依据此理论对文化翻译研究的启示以及其在David Pollard翻译的余光中的《尺素寸心》的译本中的实际应用,总结翻译过程中取得最佳关联的几种常用方法。提出译者必须根据不同的文化语境在信、达、雅标准下,对原文进行灵活处理,以取得最佳的语用等值效果。(本文来源于《牡丹江教育学院学报》期刊2008年06期)
王辰,宋国龙,吴宏林,张俐,刘绍明[6](2008)在《基于序列相交的短语译文获取》一文中研究指出短语译文获取技术是基于实例机器翻译系统EBMT中的核心技术之一,短语译文获取技术的性能直接影响到EBMT的性能。当前主要的短语译文获取方法过于依赖词对齐结果,只能从词对齐库中得到短语译文结果:有些方法利用句法分析结果,存在代价高、翻译精度低等问题。该文提出了一种基于序列相交的短语译文获取方法.只需要句对齐双语语料库,不需要词对齐、句法分析及词典等资源。实验表明.该方法具有较高的准确率。(本文来源于《第四届全国学生计算语言学研讨会会议论文集》期刊2008-07-01)
刘鹏远[7](2008)在《基于知识自动获取的无指导译文消歧方法研究》一文中研究指出这是个互联网的世界,使用高效的搜索引擎在互联网获取信息已经成为当代人们获取信息的最重要手段。在日益国际化的信息中,不同种语言之间的理解与处理一直存在着难以逾越的鸿沟,这就形成了人们对机器翻译、跨语言信息检索与处理的迫切需求。目前对此研究仍有诸多难题亟需解决,其主要之一就是,如何为源语言多义词选择语义正确对应的目标语译文词汇的问题,称之为译文消歧。译文消歧及与之相似的在单语范畴内的词义消歧一直是自然语言处理领域基础研究课题,它也是自然语言处理技术的重点和难点之一。针对译文消歧及词义消歧的现状,通过对各类无指导消歧方法的比较分析,本文认为,目前无指导译文消歧的关键问题是消歧知识的自动获取与利用、克服数据稀疏及双语语义词典建设。因此,本文没有在机器学习算法、消歧特征选择等问题上做过多的研究与探讨,而是充分关注与挖掘无指导译文消歧方法中最核心的内容——知识获取,利用这些消歧知识来完成无指导译文消歧任务,同时克服数据稀疏问题。由此思想出发,本文提出了一系列逐步递进的无指导译文消歧知识获取以及消歧的创新方法,这些创新方法均利用了国际标准语义评测语料进行评测与对比分析,并均超过了以往可比较的最好无指导系统。最后,本文还进行了另一个关键问题的研究,即双语语义词典的自动构建。本文具体研究内容包括以下几个方面:1.自动获取带标记目标语语料,并直接形成译文消歧模型,提出利用该模型进行译文消歧的方法。在此基础上,提出了等价伪译词概念以及等价伪译词的构造方法,并以此实现无指导的译文消歧。最后在国际语义评测数据集Senseval-2 ELS上进行了实验与比较;2.通过对双语语料库间接关联的观察,提出利用双语词汇间接关联度的完全无指导译文消歧方法。在计算间接关联度的过程中充分利用了Web资源,设计了Web的词汇间接关联度(Web_IA)的计算方法,在消歧过程中利用了叁种不同的决策方法进行决策。随后,针对基于间接关联方法的不足,本文将整个Web视为语义词典,直接利用Web进行双语词汇语义相关度(WBR)的定义分析以及计算。经过对WBR方法在一个经改造处理的标准语义相关度测试集上的比较实验,证明该方法可行后,设计了基于WBR的完全无指导译文消歧方法,并在同一个国际标准语义评测数据集Semeval2007上的task5与基于Web_IA方法做了详细的对比实验;3.通过对歧义词同义词集合内词汇语句序列的观察,提出了一种基于Ngram语言模型以及Web挖掘的无指导译文消歧方法。该方法认为歧义词不同词义所对应的N-gram语言模型模式不同,且利用的是语言模型知识而非语义知识。随后在同一个标准集上的对比评测表明,该方法取得了极为优异的性能。性能超过了该任务可比较最好无指导系统TorMD12.8%(Pmar值),最后,还进行了基于语言模型的方法与基于语义模型的方法的详细比较及性能上限的讨论;4.研究了利用WordNet、HowNet以及大规模双语平行语料库自动生成面向译文消歧的的双语词典的方法。该方法充分利用大规模平行语料库内丰富的词汇对齐知识以及各项统计信息,利用WordNet及HowNet语义资源的相似度计算,形成了一部同时带有双语语义信息及语料库统计信息的词典。综上所述,本文基本上给出了面向知识自动获取的无指导译文消歧的一整套解决方案,特别是其中基于Web的各种方法,为自然语言处理中的难题之一——译文/词义消歧,在基于Web搜索的研究思路上进行了初步探索。(本文来源于《哈尔滨工业大学》期刊2008-06-01)
彭家海,朱咸会[8](2007)在《读者期望从文学译本中获取的是优化——以《麦田里的守望者》为文本谈译文的优化目标》一文中研究指出本文从读者的角度出发阐述了目前翻译界争论不休的关于翻译的异化与归化问题,从翻译的时代性、文学作品翻译的特殊性方面进行论证,提出对于文学作品的翻译,译者应该做到的是优化,从而满足读者的需求。(本文来源于《南方论刊》期刊2007年09期)
基于的译文获取论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
该文从法律法规和公文领域汉藏语料中对待翻译汉语短语提取藏语译文。目前普遍采用的短语对抽取方法需要依赖于词性或句法分析等资源或词对齐技术。考虑现阶段藏文资源不足,词法句法相关技术不成熟,该文提出藏文词串频率统计方法(TSM)和藏文词序列相交算法(TIA)两种方法来获取藏语译文。其中TSM抽取1-1连续和非连续短语准确率达到90%左右,但遗漏1-n情况。TIA能够抽取1-n连续和非连续藏文语块,准确率达到81%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
基于的译文获取论文参考文献
[1].薛丽花.基于多策略的汉语复杂名词短语译文获取技术研究[D].沈阳航空航天大学.2016
[2].诺明花,吴健,刘汇丹,丁治明.汉藏短语对抽取中短语译文获取方法研究[J].中文信息学报.2011
[3].杨沐昀,石振勇,朱俊国,李生,赵铁军.基于WEB检索的论文标题译文获取[C].第六届全国信息检索学术会议论文集.2010
[4].王辰,宋国龙,吴宏林,张俐,刘绍明.基于序列相交的短语译文获取[J].中文信息学报.2009
[5].周瑜玲,胡卓婷.从关联理论视角分析《尺素寸心》译文中最佳关联的获取[J].牡丹江教育学院学报.2008
[6].王辰,宋国龙,吴宏林,张俐,刘绍明.基于序列相交的短语译文获取[C].第四届全国学生计算语言学研讨会会议论文集.2008
[7].刘鹏远.基于知识自动获取的无指导译文消歧方法研究[D].哈尔滨工业大学.2008
[8].彭家海,朱咸会.读者期望从文学译本中获取的是优化——以《麦田里的守望者》为文本谈译文的优化目标[J].南方论刊.2007