导读:本文包含了复述生成论文开题报告文献综述及选题提纲参考文献,主要关键词:搭建
复述生成论文文献综述
王海燕[1](2019)在《给复述搭建支架,促进英语素养生成》一文中研究指出复述,顾名思义就是将文本重新叙述一遍,它有利于学生英语综合能力的生长。学生在复述的时候,需要很好的记忆能力、理解能力、甚至逻辑思维能力与想象能力等。由于文本的难度不一,学生的认知不一,教师在学生进行复述时,需要搭建一定的支架,让他们能流畅地表达、自由地叙述、渐渐地生长。(本文来源于《中学生英语》期刊2019年34期)
刘小雪[2](2019)在《基于句子表示的复述检测与生成研究》一文中研究指出随着深度学习的快速发展,自然语言处理基础技术不断成熟,人们越来越关注语义理解的相关研究。应用中判断机器是否理解自然语言的标准之一是相同语义的不同表达,即复述。复述任务在机器翻译、摘要生成、信息检索、信息抽取和自动问答等多项自然语言处理任务上被广泛应用,有着极其重要的研究价值。复述研究主要分为复述检测和复述生成两个研究方向。复述检测是判断两个句子是否具有相同的语义信息的分类任务,复述生成则是研究多样化表达方式的自然语言句子的生成任务,要求生成的句子具有相同的语义含义。复述研究与语义理解息息相关,自然语言句子的多样性和复杂性,导致相同的词语在不同的语境下含义不同,相同的句意也可以对应不同的表达,这为复述研究带来了挑战。早期的复述技术依赖于规则模板,需要根据语言设计规则,耗时费力并且可扩展性差。随着深度学习技术的成熟,基于注意力机制的端到端的序列生成模型成为复述生成的研究热点之一。这种方法强调通过训练数据学习序列间具体的映射关系,并不能很好做到语义理解。不同于此类工作,本文认为语义理解的基础是能建模普适性句子表示,并通过此表示得到满足复述问题的结果。本文立足于语义理解的研究,研究通过集成学习得到增强的句子表示的方法,并将其应用于复述检测和复述生成的研究,主要工作如下:1.本文对句子表示和语义理解相关研究进行了大量的调研,针对不同表示方法的特点,本文选择其中的五种作为基础句子表示模型,提出一种基于门控机制的集成表示模型。在复述检测和语义理解基线任务上的实验结果表明,本文提出的集成方法能获取相较于基础表示模型更好的表示。2.表示与生成一直是自然语言处理的研究难点,不同于序列到序列的建模方式,本文将上述的表示模型应用在复述生成任务上。基于先表示、后生成的思想,填补了从深度语义表示到复述生成研究方向的空缺,利用集成表示建立起从表示到复述生成上比较强的一个基线模型。实验结果表明,本文可以得到多种语义相似表达方式不同的复述句子。3.本文实现了一个基于句子表示的复述检测和生成系统,该系统主要有复述检测、复述生成功能,同时利用集成表示方法,扩展短语相似度等基础自然语言辅助功能。系统能更好的展示本文的研究结果,有助于对表示和复述研究的思考。(本文来源于《南京大学》期刊2019-05-20)
柔特[3](2019)在《藏文陈述句复述生成研究》一文中研究指出复述是相同语义的不同表达方式,在自然语言中非常普遍,它反映了人类语言的灵活性、多样性和复杂性。复述研究主要包含叁个内容:一是复述抽取,即从原文中抽取关键词,重新组合这些字或词并使语义与原句相同;二是复述识别,即从语料中找出语义相同的句子或段落等不同的语言单元。叁是复述生成,给定一个输入,输出一个相同语义的文本。复述方式包括短语到短语、句子到句子等等长复述,也有从词到短语、从短语到句子的不等长度的复述。本文主要研究的是藏文陈述句复述生成。首先对藏文句子进行分类并抽取陈述句,然后对句子进行语义分析,在此基础上构建藏文复述句语料库,最后通过机器学习自动生成藏文复述句。本文包括如下5个主要问题和解决方法:1.基于循环卷积神经网络的藏文句类分类方法研究藏文句类分类是藏文语言学和自然语言处理领域中尚未关注的一个研究点,鲜见于有关文献。本文的研究对象为藏文陈述句复述自动生成,其存在的主要问题是藏文句子的句类自动分类问题。问题的难点是其他语言的传统句类的分类方法不适用于藏文的句子分类,因为藏文没有特殊的标点符号来识别不同的句子种类。本文在充分分析藏文不同句类特征信息的基础上,提出了以藏文句子语境信息和特征功能为识别和分类依据,采用循环卷积神经网络对藏文句子进行识别和分类。实验结果表明:对藏文句类识别和分类的平均准确率达85.61%、召回率达86.54%、F值达85.59%。2.基于空洞卷积网络的藏文句子语义分割方法研究当前藏文句义的研究内容和方法停留在句法分析上,因此,对藏文句义理解的研究还没有一个具体的研究方法,且在藏文句义理解的研究方面与其他语言相比存在着很大的差距。研究藏文复述生成,首先要解决的问题是在理解原文句义后才能生成藏文陈述句复述。其问题的主要难点是在其他语言句子语义分割中通常以词为分割单元,然而,如果对藏文进行以词为单元的分割时,由于颗粒度过细,会产生或造成很多词汇歧义和语义序列解码的不稳定性问题。本文在分析藏语语言特性和语言编码组合规律的基础上,提出了一种新的语义单元分割方法。该语义单元长度介于词义之上句义之下,使语法、语义、语境融为一体。然后采用空洞卷积神经网络对藏文句子进行语义分割。实验结果表明:空洞卷积网络模型对语义分割的准确率达到了92.39%。3.基于藏文语序和语义词典的复述句语料构建方法研究机器学习中,数据资源的规模与质量直接影响学习结果。本文在研究过程中需要较大规模的藏文数据资源用于生成藏文陈述句复述研究。然而,解决此问题的难点在于,目前国内外还没有一个公开、大规模、高质量的藏文数据资源用于机器学习,更没有复述句的数据集。为解决藏语复述句的数据资源匮乏问题,本文提出了利用藏文语序变换和藏文语义词典等方法来构建藏语复述语料资源。实验结果表明人工评测后基于语序变换的藏文复述生成准确率为97.31%;且基于藏文语义词典的复述生成准确率为93.33%。4.基于注意力机制的藏文复述句生成研究近年来,随着复述研究成果应用到机器翻译、自动问答、信息检索、信息抽取、文本生成及阅读理解等相关研究,这使越来越多的研究者和研究机构开始关注并重视复述研究工作。然而,目前还没有找到利用注意力机制对藏文陈述句复述句生成进行研究的相关文献。本文试图将注意力机制应用到藏文陈述句复述自动生成研究中,以扩充现有藏文复述句的数据资源。本文在以上已构建的复述数据资源的基础上,提出了基于注意力机制的藏文复述句自动生成方法。实验结果表明:藏文复述句生成结果的BLEU值为40.38%。5.基于注意力机制的藏文新词释义自动生成研究随着人类社会的进步和科学技术的发展,新的术语和词汇不断涌现。目前的藏文新词术语的释义已无法满足人们的需求,因此,为解决这一问题,本文尝试利用机器学习方法对藏文新词术语进行自动释义。本文提出了一种基于注意力机制的藏文新词术语释义自动生成方法。实验结果表明,词典原文释义生成准确率为87.17%,新词释义生成准确率为80.32%。本文利用各种方法构建了较大规模的藏文复述句的数据资源,并尝试利用这些数据资源对藏文复述的自动生成进行基于机器学习方法的研究。本研究取得了较好的初步成果,希望这些成果能对藏文自然语言理解研究提供借鉴。(本文来源于《青海师范大学》期刊2019-04-01)
曹雨,张宇,刘挺[4](2019)在《中文复述问句生成技术研究》一文中研究指出自动问答系统允许用户以自然语言进行提问,问题的形式多样、结构复杂,对系统的理解能力提出了极高要求。问句复述生成技术可将提出的复杂问句改写成一系列与之语义相同但形式不同的问句,避免了用户提问的不规范,可大大降低系统对问句的理解和处理难度,对于提升自动问答系统的效果有着重要意义。本文提出了一种基于模板匹配的复述问句生成方法,该方法可有效保留问句的结构特征和语义特征。引入功能标签,突出问句的结构特征;引入依存关系,提高了问句模板的泛化性能;引入候选排序,大幅提升了生成结果的准确率。通过与已有的生成方法进行对比试验,证实了该方法的有效性。(本文来源于《智能计算机与应用》期刊2019年01期)
宁丹丹,陈惠鹏,秦兵[5](2018)在《基于序列到序列模型的句子级复述生成》一文中研究指出句子复述是指将一个句子换一种表达方式,意思与之前一样。复述在自然语言处理中应用广泛,例如被应用在信息检索、自动文摘、信息抽取、句子翻译等任务中。本文主要研究句子级复述生成的相关内容,首先尝试了基本seq2seq模型用于句子复述,并尝试在encoder阶段采用双向LSTM,而且在此基础上加入注意力机制,比较句子生成结果,可以得出加入注意力机制的模型生成的效果要好。此外本文提出复制机制和覆盖机制对模型进行改进,其中复制机制旨在解决原句中出现人名、地名等特殊词汇的情况,这样情况研究希望模型可以对词进行复制,不进行改变,实验结果证明,复制机制对这一情况有所改善,句子生成效果较好,最后,针对seq2seq普遍存在的重复问题,在复制机制的基础上加入覆盖机制,有效改善了生成句子的重复问题。对于模型生成结果,采用BLEU值进行评价。(本文来源于《智能计算机与应用》期刊2018年03期)
柔特,才让加,孙茂松[6](2018)在《基于语序变换的藏文复述句生成方法》一文中研究指出机器理解藏文语句存在灵活性差和复杂性高的问题。为此,针对藏文相同语义句子的不同表达方式,设计复述句自动生成方法。通过对藏文句型结构、句子内部组块进行分析,利用全排列递归算法生成复述句。实验结果显示,与其他语言复述生成方法不同,该方法根据藏文句子中组块数量的不同,通过一个句子可以生成一个或多个,甚至上千个句义相同的复述句并且准确率达到93.4%,可应用于藏汉机器翻译、机器翻译评测和藏文问答系统等领域。(本文来源于《计算机工程》期刊2018年04期)
曹雨[7](2017)在《中文复述问句生成技术研究》一文中研究指出随着计算机科学的快速发展,网络已成为人们日常获取信息和知识的重要途经,网上的数据急速增加,用户很难快速地从搜索引擎中获得自己所需的有效信息。自动问答系统的出现允许人们用自然语言的方式进行提问,将用户所需的答案直接返回,便捷而高效。在自动问答系统的问句理解部分,复述生成技术可将用户以自然语言提出的复杂问句改写成一系列与之语义相同但形式不同的问句,这些问句中有一部分结构规则,避免了用户提问的不规范性,可大大简化系统对问句的理解和处理难度,对于提升自动问答系统的效果有着重要意义。当前缺乏大规模高精度的中文复述问句语料,我们选用百度知道的“相似问题”作为本次研究的数据来源,但该资源中很多并不符合中文使用规范,需要对复述语料资源进行重新构建,以便后续的技术研究。本文研究内容分为中文复述语料资源库的构建方法和中文问句复述生成方法两部分。中文问句复述生成方法又分为:基于模板匹配的问句复述生成方法和基于序列到序列的问句复述生成方法。首先,本文提出利用关键词提取方法和相似度计算方法进行中文复述语料资源库的构建。利用基于词引力值排序的关键词方法对问句进行关键词抽取,若一个相似问题对对应的关键词相同,则将其视为复述;利用基于句子间相似及相异信息的CNN模型对相似问题进行相似度计算,若其得分高于阈值,则将其视为复述。实验证明,两种方法对于提高语料库的准确率都是有效的,且相似度计算方法优于关键词提取方法。其次,本文提出一种基于功能词和依存关系的模板匹配生成方法。在该复述生成方法中采用分词、词性标注、命名实体识别、功能标签替换等方法提取问句模板,保留每个问句的特有成分,所得到的模板不仅包含一定的结构信息,更包含了语义及上下文信息。同时我们通过依存关系分析,引入了句式简化方法,提高了问句模板的兼容性。对于某一原始问句,改写后通过候选生成句抽取模块进行评价。实验证实,本文提出的基于模板匹配的问句生成方法较现有的其他复述模板表达方法更为有效。最后,本文提出一种基于序列到序列的问句复述生成方法,将复述生成任务视为一种机器翻译任务,在基础的Sequence to Sequence结构上,分别采用双向LSTM和残差LSTM模型对学习到的内容进行更深层次的表示,并引入注意力机制,使得解码过程中的每个时刻都有能力获取到上下文信息,提高了输出序列和输入序列的相关性。实验证实了引入注意力机制的残差LSTM方法对于该复述生成任务的有效性。(本文来源于《哈尔滨工业大学》期刊2017-06-01)
金冬梅[8](2014)在《渗透、生成、复述、拓展——谈培养小学生英语“语篇意识”四部曲》一文中研究指出在当前的小学生英语教学中,学生普遍存在着"语篇意识"欠缺的问题。主要从渗透、生成、复述以及拓展等四方面对小学生英语的"语篇意识"进行分析与解读,从而培养学生的"语篇意识"。(本文来源于《新课程学习(上)》期刊2014年12期)
和为,刘挺[9](2013)在《基于分析和生成的复述与SMT语料扩展》一文中研究指出为了解决统计机器翻译语料对调序现象覆盖不足的问题,采用复述方法对语料进行扩展.提出了一种基于依存分析和句子生成的复述方法.对句子进行依存分析得到依存树,然后从依存树生成多个自然语言句子.生成的句子与原句相比没有词汇上的改变,但可以在词序方面进行变换.实验表明方法在不引入额外资源的前提下,有效缓解了语料覆盖不足的问题,提高了机器翻译质量.(本文来源于《哈尔滨工业大学学报》期刊2013年05期)
蓝翔[10](2010)在《采用统计机器翻译模型的复述生成技术研究》一文中研究指出所谓复述,就是对相同语义的不同表达方式,是自然语言中比较普遍的一个现象,它集中反映了语言的灵活性和多样性。近年来,自然语言处理各种底层技术的不断发展和成熟,为复述研究提高了可能,使之受到越来越多的关注。有许多学者针对复述问题展开了大量研究,在英文和日文方面,复述技术已经被成功的应用到信息检索、自动问答、信息抽取、自动文摘以及机器翻译等多个领域,有效地提高了这些系统的性能。复述研究主要分为两大类:一类是复述资源的获取,即从各式语料中基于各种方法抽取复述句对、复述短语、复述模板等不同粒度和形式的复述资源;另一类是复述生成,通常指的是句子级的复述生成,即由计算机自动生成给定句子的复述句。本文重点研究了基于统计模型的复述生成技术。复述生成在自然语言处理的诸多方向均有重要应用,但目前在这方面的研究还很不够。本文通过对复述生成问题本质的分析以及与其它相关研究问题(尤其是机器翻译)的比较,在统计机器翻译模型的基础上进行改进,提出了一种统计复述生成方法。该方法的主要特色体现在以下两方面:(1)该方法可以基于一个统一的统计模型框架,针对不同的复述任务生成复述;(2)该方法可以轻易地结合多种资源来提升复述生成的性能。然而,该方法仍然需要极为丰富的复述资源作为基础,但优质的复述资源往往是很难获得的。因此,本文在此基础上又提出了一种基于枢轴法和多机器翻译引擎生成复述的方法,该方法首先利用多枢轴方法为源语言句子获得候选复述集,然后分别使用基于选择和基于解码的技术,为源语言句子生成复述。实验结果表明,本文提出的方法可以很容易地从一种应用切换到另一种应用,并且生成很有价值的复述句子,而通过多枢轴方法则可以简单高效地获得大量优质的候选复述,从而进一步提高复述生成的性能。(本文来源于《哈尔滨工业大学》期刊2010-06-01)
复述生成论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着深度学习的快速发展,自然语言处理基础技术不断成熟,人们越来越关注语义理解的相关研究。应用中判断机器是否理解自然语言的标准之一是相同语义的不同表达,即复述。复述任务在机器翻译、摘要生成、信息检索、信息抽取和自动问答等多项自然语言处理任务上被广泛应用,有着极其重要的研究价值。复述研究主要分为复述检测和复述生成两个研究方向。复述检测是判断两个句子是否具有相同的语义信息的分类任务,复述生成则是研究多样化表达方式的自然语言句子的生成任务,要求生成的句子具有相同的语义含义。复述研究与语义理解息息相关,自然语言句子的多样性和复杂性,导致相同的词语在不同的语境下含义不同,相同的句意也可以对应不同的表达,这为复述研究带来了挑战。早期的复述技术依赖于规则模板,需要根据语言设计规则,耗时费力并且可扩展性差。随着深度学习技术的成熟,基于注意力机制的端到端的序列生成模型成为复述生成的研究热点之一。这种方法强调通过训练数据学习序列间具体的映射关系,并不能很好做到语义理解。不同于此类工作,本文认为语义理解的基础是能建模普适性句子表示,并通过此表示得到满足复述问题的结果。本文立足于语义理解的研究,研究通过集成学习得到增强的句子表示的方法,并将其应用于复述检测和复述生成的研究,主要工作如下:1.本文对句子表示和语义理解相关研究进行了大量的调研,针对不同表示方法的特点,本文选择其中的五种作为基础句子表示模型,提出一种基于门控机制的集成表示模型。在复述检测和语义理解基线任务上的实验结果表明,本文提出的集成方法能获取相较于基础表示模型更好的表示。2.表示与生成一直是自然语言处理的研究难点,不同于序列到序列的建模方式,本文将上述的表示模型应用在复述生成任务上。基于先表示、后生成的思想,填补了从深度语义表示到复述生成研究方向的空缺,利用集成表示建立起从表示到复述生成上比较强的一个基线模型。实验结果表明,本文可以得到多种语义相似表达方式不同的复述句子。3.本文实现了一个基于句子表示的复述检测和生成系统,该系统主要有复述检测、复述生成功能,同时利用集成表示方法,扩展短语相似度等基础自然语言辅助功能。系统能更好的展示本文的研究结果,有助于对表示和复述研究的思考。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
复述生成论文参考文献
[1].王海燕.给复述搭建支架,促进英语素养生成[J].中学生英语.2019
[2].刘小雪.基于句子表示的复述检测与生成研究[D].南京大学.2019
[3].柔特.藏文陈述句复述生成研究[D].青海师范大学.2019
[4].曹雨,张宇,刘挺.中文复述问句生成技术研究[J].智能计算机与应用.2019
[5].宁丹丹,陈惠鹏,秦兵.基于序列到序列模型的句子级复述生成[J].智能计算机与应用.2018
[6].柔特,才让加,孙茂松.基于语序变换的藏文复述句生成方法[J].计算机工程.2018
[7].曹雨.中文复述问句生成技术研究[D].哈尔滨工业大学.2017
[8].金冬梅.渗透、生成、复述、拓展——谈培养小学生英语“语篇意识”四部曲[J].新课程学习(上).2014
[9].和为,刘挺.基于分析和生成的复述与SMT语料扩展[J].哈尔滨工业大学学报.2013
[10].蓝翔.采用统计机器翻译模型的复述生成技术研究[D].哈尔滨工业大学.2010
标签:搭建;