导读:本文包含了通用语料库论文开题报告文献综述及选题提纲参考文献,主要关键词:卷积神经网络,全局优化,特征表示,事件同指消解
通用语料库论文文献综述
陆震寰,孔芳,周国栋[1](2018)在《面向多语料库的通用事件指代消解》一文中研究指出事件同指消解对篇章理解、信息抽取意义重大。该文在事件抽取完成的基础上聚焦事件同指,给出了一个基于卷积神经网络的事件同指消解完整框架,针对实例分布不均衡问题给出了基于事件语义类别和时态信息的事件兼容性过滤策略。为了最大化适用不同的事件标注策略,提出了最小事件本身描述和事件间关系描述相结合的特征表示方法。针对基于事件对模型进行同指消解产生的局部最优问题,给出了一种全局优化的后处理方案。在KBP2015和ACE2005语料上的各类实验表明,上述叁个解决方案均能有效解决问题,提升整个事件同指消解平台的性能。(本文来源于《中文信息学报》期刊2018年01期)
武洁[2](2017)在《基于多位分析法的商务英语及通用英语语料库差异分析》一文中研究指出多位分析法的应用方式能够促进现实维度中对商务英语及通用英语语料库的应用分析,进而通过差异化的方式理解其中的词汇、语意、内涵等多维度的差异形式。而商务英语也具备其特殊的语境和主旨内容,那么在实际应用过程中不可能完全适用于通用英语语料库。因此,基于多位分析法的理论方式,探析商务英语及通用英语语料库差异问题。(本文来源于《现代职业教育》期刊2017年31期)
索南草[3](2015)在《面向通用语料库构建的藏语谚语类型分类研究》一文中研究指出藏族谚语是藏族人民在长期的生产劳动和生活实践中所集体创造、广为口传的一种言简意赅的语言艺术形式。它的内容十分丰富,涉及社会、历史、生产、自然、日常生活的各个方面。(本文来源于《长江丛刊》期刊2015年28期)
邓静子[4](2015)在《基于英美国家通用语料库的商务英语内涵研究》一文中研究指出本文通过检索Business English在英美3个大型通用语料库中的使用情况,调查商务英语在大众话语中的历时变化及其索引行的拓展内容。研究表明,英美国家的商务英语内涵主要是"以商务为中心、语言为工具";形成了国际商务英语专业和相关配套教材、资格证书。我国的商务英语可以借鉴欧美国家商务英语的成功经验,逐渐转变"以商务英语语言技能为主、商务知识为辅"的教学模式;更着重于商务知识与英语技能的融合式培养,形成具有中国特色的专业发展路径。(本文来源于《教育现代化》期刊2015年12期)
谭芳[5](2015)在《高校基础阶段通用英语课堂话语语料库的生成》一文中研究指出虽然语料库以其信息存储量大、资料真实、检索快捷准确的优势日益受到各个领域学者的青睐,但是耗时费力、程序复杂的口语语料库建设却不多。迄今,专文详述中国国内高校英语课堂话语语料库建库的论文尚未见。本文介绍历时3年建成的高校基础阶段通用英语课堂话语语料库,首先说明该口语语料库研究项目的、研究背景及选题缘起,然后回顾国内外代表性课堂话语语料库的建设,最后介绍高校基础阶段通用英语课堂话语语料库的语料收集过程和处理方法等,讨论该库的特点、功能及其对高校英语教育改革的意义。(本文来源于《外语学刊》期刊2015年05期)
唐萌[6](2015)在《面向汉语辞书编纂的大型通用语料库构建研究》一文中研究指出本文通过对国外面向辞书编纂的语料库成功经验的学习,结合我国语言研究和辞书编纂的实际,选取适合我国语料库建设的方法和途径,制定出一个大型通用的语料库建设方案。论文共分六章,各章节的内容安排如下:第一章绪论。主要介绍了国内外语料库建设的研究现状,并明确了我们建设语料库的意义和价值,以及研究方法和研究思路。国外对于语料库建设早有研究,且已有较为丰富的理论成果和完整科学的系统结构;而我国对于语料库建设的研究起步较晚,同时基本上还局限于专用型语料库,适用范围较小,只为特定词典编纂服务。因而在我国词典学领域急需一个面向汉语辞书编纂的大型通用语料库。它有助于填补了汉语辞书理论的空白,推进中文信息处理的发展,提高辞书编纂的客观性、准确性和科学性。第二章面向汉语辞书编纂的大型通用语料库的设计理念。在Chomsky的理性主义占主导地位的二十世纪中后期,语料库研究方法深得人心。随着WordNet、知网、FrameNet的成功建立,关于大型通用型语料库的设计理念也浮出水面。我们要建立的面向汉语辞书编纂的大型通用语料库的设计理念是大规模和多语体、深度加工和监控语料库。第叁章面向汉语辞书编纂的大型通用语料库的语料采集。语料的采集是建设语料库的一个重要环节,我们先回顾了COBUILD语料库、朗文语料库网络、英国国家语料库、剑桥国际语料库、Sinica语料库五个语料库在语料采集时的成功经验,结合我国实际,明确了面向汉语辞书编纂的大型通用语料库的语料采集分五种语体:口语、小说、新闻、杂志和学术期刊,每种体裁所占比例均为20%。各收7千万字左右,计划建成一个3.5亿字左右的大型通用语料库。第四章面向汉语辞书编纂的大型通用语料库的语料加工处理。我们采用XML格式将文本收录进语料库,对每篇文章的类别、来源、作者、出版时间、标题和正文内容这些信息加以标注。分词系统选择,采用北京大学计算语言学研究所研制的汉语语料库多机加工系统;词语切分与词性标注,采用北京大学2003版词语切分和词性标注规范(俞士汶等,2003)的标准;词法标注,采用最大匹配法;句法标注,采用邱立坤(2012)提出的依存句法的标注体系规范;语义标注,采用Mel’ uk等人创立的语义-篇章理论。第五章面向汉语辞书编纂的大型通用语料库的功能。管理功能、检索功能、统计功能、词义更新功能、辅助释义功能。第六章结论。对本文的研究工作进行了总结,指出了进一步研究的方向。(本文来源于《鲁东大学》期刊2015-06-01)
张英[7](2015)在《基于英语口语语料库的新通用词词表效度研究》一文中研究指出词汇知识在二语或外语学习中必不可少。Blachowicz,Fisher,Ogle和Watts(2006)指出词汇学习是一个复杂的过程。因此,为促进词汇教学,多项研究开发了不同的词汇列表。其中,West(1953)的通用词词表,因其在各类文本中覆盖率高,分布广,成为了最具影响力的通用词词表。即使如此,West(1953)的通用词词表还是存在诸多问题,如年限古老,词汇选择时存在定性原则(可能使词表不客观),以及词族这一词条列举形式。针对West(1953)的通用词词表不足,Brezina和Gablasova(2015)建立了一个新的词表,即,新通用词词表,并表明“新通用词词表能很好的适用于各类笔语与口语文本中”。然而,新通用词词表的源语料库几乎均为笔语语料,口语成分仅占总语料库的0.08%。由于这一笔语与口语语料成分十分不平衡的特点,新通用词词表在口语文本中的有效度仍有待研究。因此,本研究旨在研究新通用词词表在各类口语中的覆盖率,并提出了以下叁个研究问题:1)新通用词词表在多大程度上覆盖不同的口语情境?2)新通用词词表的各频率段在多大程度上覆盖不同的口语情境?3)存在在口语情境为高频词,但却未包含在新通用词词表中的词吗?若存在,有哪些?本研究选取了叁个口语语料库,分别代表不同的语域和正式程度,即,英语学术口语语料库(BASE语料库),开放美国国家语料库中的口语成分语料库(OANC口语语料库)和美国有线电视新闻字幕语料库(CNN字幕语料库)。本研究所选取的语料库分别代表了不同的话语情境,不同的语料库库容及不同时期的语言使用。在语料库数据处理过程中,本研究采用了Stanford Core NLP和Python语言两种软件。研究结果显示,新通用词词表在口语中的覆盖率(从71.35%到78.01%)普遍低于Brezina和Gablasova(2015)以笔语为主的语料库中的覆盖率(约80%)。同时,新通用词词表及其各频率段的覆盖率在各语料库中不稳定,且与口语正式程度呈正相关。结果表明新通用词词表在口语中的有效性比其在笔语中的低。更重要的是,本研究结果挑战了Brezina和Gablasova(2015:17)中“在包含不同笔语和口语文本的语料库中”存在通用核心词汇这一观点。本研究表明用于所有文本类型的常用核心词汇表可能并非必须,而应面向不同的学习者,基于其所需的教学目标,开发相应的基础词汇表。本研究的教学启示主要体现在学习者,教师和教材编写者,及教学研究叁个方面。首先,为提供有效的词汇参考以便学习者自学英语口语,学习者可能需要针对其学习目标的特定口语词汇表。其次,为进行英语口语教学及教材编写,教师和教材编写者可能需要以针对特定学习者及其目标的口语词汇表为导向。最后,为进行更深层次的英语口语研究,如开发更专业的英语口语词汇表,建立针对特定学习者及学习目标的口语词表非常必要。(本文来源于《华中科技大学》期刊2015-05-01)
刘艳红,张军[8](2015)在《基于语料库的通用大学英语教材词汇研究》一文中研究指出本文在回顾国内外的语言教材评估研究和我国大学英语教材评估的困境的基础上,提出了基于语料库的定量与定性相结合的评估方法,以《大学英语课程教学要求》(以下称《要求》)为指导,对我国高校使用的四套大学英语教材的词汇进行对比研究。研究发现,四套教材各具特色,但在词汇量、对《要求》词汇及词组的涵盖和词汇复现等方面存在不同程度的不足,本文期望能为高校根据自身特点选择适合的教材和教师根据教学环境和实际情况对指定的教材进行补充和调整提供参考。(本文来源于《中国外语教育》期刊2015年01期)
刘佳,韩丽娜[9](2014)在《基于语料库的通用学术词表在专业英语学习中的适用性研究——以“学术词表”和环境科学专业为例》一文中研究指出本研究以环境科学为例,基于语料库考察了以Coxhead(2000)编制的"学术词表"(Academic Word List,简称AWL)为代表的通用学术词表在专业学科中的适应性,通过对比AWL词汇与非AWL词汇在环境科学英语语料库及其子库中的覆盖率,讨论AWL在专业学科里的适用性,并借此探讨编制专业学术词表的必要性与可行性。研究发现,AWL虽然适用于环境科学专业,但其中部分词汇不能反映环境科学领域的特征,而非AWL词汇中包含了许多具有环境科学学术意义的词汇。结论认为,应该基于AWL词表编制特定专业的学术词表,帮助学习者专注学习与专业有关的学术词汇。(本文来源于《北京化工大学学报(社会科学版)》期刊2014年01期)
王凤娇[10](2013)在《天津通用公示语翻译语料库研究报告》一文中研究指出近年来,语料库在英汉互译中得到了广泛应用,尤其是涉及到专业术语的翻译,语料库不仅能帮助译者提高翻译速度,而且能提高翻译的准确度。随着中国国际化进程的加快,国内各大城市对公示语双语化的需求越来越普遍。据调查,我们发现现有的双语公示语的英语翻译状况不尽人意,五花八门的翻译不仅给目的语读者带来理解上的偏差,而且也有损我国的国际形象。鉴于此现象,国内双语公示语的语料库建设项目方兴未艾,值得一提的是北京第二外国语学院已经推出了我国第一个通用公示语语料库。同时,我们考虑到每个地方的公示语有其独特性,所以各地方的公示语翻译语料库也应及时的建立。该报告是针对天津通用公示语翻译语料库建设问题及公示语翻译问题进行的尝试性研究和反思。研究报告共分为五个部分:首先是公示语翻译语料库建设项目的介绍;其次是概述公示语翻译及其语料库建设的现状;再次从用语、句式、语篇叁个层次分析公示语这个特殊的文本,为下文公示语翻译的过程做铺垫;随后,将按准备,翻译,分析,入库四个步骤分析探讨通用公示语语料库建设的整个过程;最后总结项目建设的经验教训。本文将所涉及的公示语共分叁类:名称类、警示类、温馨提示类,在翻译目的论的指导下,笔者按照这叁类公示语的不同语言特点和不同目的进行翻译或者对已有对应翻译进行校对。同时详细阐述天津市通用公示语翻译语料库建设的过程及其中遇到的问题。(本文来源于《天津师范大学》期刊2013-04-01)
通用语料库论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
多位分析法的应用方式能够促进现实维度中对商务英语及通用英语语料库的应用分析,进而通过差异化的方式理解其中的词汇、语意、内涵等多维度的差异形式。而商务英语也具备其特殊的语境和主旨内容,那么在实际应用过程中不可能完全适用于通用英语语料库。因此,基于多位分析法的理论方式,探析商务英语及通用英语语料库差异问题。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
通用语料库论文参考文献
[1].陆震寰,孔芳,周国栋.面向多语料库的通用事件指代消解[J].中文信息学报.2018
[2].武洁.基于多位分析法的商务英语及通用英语语料库差异分析[J].现代职业教育.2017
[3].索南草.面向通用语料库构建的藏语谚语类型分类研究[J].长江丛刊.2015
[4].邓静子.基于英美国家通用语料库的商务英语内涵研究[J].教育现代化.2015
[5].谭芳.高校基础阶段通用英语课堂话语语料库的生成[J].外语学刊.2015
[6].唐萌.面向汉语辞书编纂的大型通用语料库构建研究[D].鲁东大学.2015
[7].张英.基于英语口语语料库的新通用词词表效度研究[D].华中科技大学.2015
[8].刘艳红,张军.基于语料库的通用大学英语教材词汇研究[J].中国外语教育.2015
[9].刘佳,韩丽娜.基于语料库的通用学术词表在专业英语学习中的适用性研究——以“学术词表”和环境科学专业为例[J].北京化工大学学报(社会科学版).2014
[10].王凤娇.天津通用公示语翻译语料库研究报告[D].天津师范大学.2013