导读:本文包含了句法依存分析论文开题报告文献综述及选题提纲参考文献,主要关键词:术语抽取,依存句法分析,中文候选术语选取
句法依存分析论文文献综述
俞琰,陈磊,姜金德,赵乃瑄[1](2019)在《基于依存句法分析的中文专利候选术语选取研究》一文中研究指出[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等叁个主要步骤。首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语。[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性。(本文来源于《图书情报工作》期刊2019年18期)
王彬菁[2](2019)在《基于依存句法树方法的微博文本的情感分析研究》一文中研究指出随着移动互联技术的发展,微博作为一种新媒体形式日益成为国内主流的移动社交媒体平台。微博包含海量的信息数据且数据种类多样,即有文档文本数据,也有图片、表情符号、视频动画等非结构化的数据。因此,对各政府部门和企业单位的网络舆情监管提出了艰巨的挑战,有关中文微博文本的情感分析的研究也成为近几年数据挖掘领域的关注方向之一,情感分析研究主要围绕着信息的抽取和情感倾向的判定,均离不开对微博文本的分词工作。本文提出了一种基于依存句法树的情感分析方法。根据不同的词汇间的依存关系,制定了相应的情感短语削减规则。通过分析不同程度词和否定词对情感词的修饰和组合关系,制定了不同的汇聚规则。使用LTP-Cloud(语言技术平台云)进行句法分析,构建依存句法树,通过对句法树的后序遍历逐步汇聚情感向量。使用了为情感值取绝对值的情感判别方法,得到最终的情感类别。(本文来源于《电脑知识与技术》期刊2019年24期)
江爽[3](2019)在《基于依存句法分析的皮肤病实体关系抽取》一文中研究指出文章工作的重点是在语言学的基础上,进行多视图汉语树库的构建以及实体关系的抽取,主要的理论框架是在依存句法的基础上进行的文本挖掘工作,本文的创新点就是将依存句法树库与具体的专业知识相结合,继而在多视图汉语树库的标注平台上进行命名实体的选定以及命名实体关系的归纳总结处理,然后对各类命名实体关系进行依存句法模型的抽取,以展示皮肤病领域中实体间的语义关系。切实将理论与实际相结合,以扩大语料库、丰富语料规模、进一步拓展汉语多视图树库的应用,也使语言学对自然语言处理多作一分贡献,以期为计算机进行其他相关领域如,电子病历等临床领域的命名实体关系抽取时提供一个模板,多做一种尝试。近年来,随着自然语言处理技术的进步与成熟,大量的涉及各个领域的非结构化文本数据,例如:皮肤病、中小学教材专着、电子病历等都可以尝试进行结构化的数据处理,以方便进行文本挖掘。目前大部分的医药文本并不是结构化了的信息数据,包括许多由自然语言描述而成的复杂无结构的文本数据,虽然文本类型的信息数据能够方便详细准确地进行描述概念以及事件等内容,但是大篇幅、无结构的文本数据,同时也为搜索、统计分析等增添了负担、制造了障碍,可能会对数据分析结果的质量造成负面影响。为了能够有效充分利用现有的语言学理论、成熟的分析工具对医药文本进行数据分析和数据挖掘,从而提高医疗数据的价值,对非结构化的文本数据进行结构化的处理,就成为了不少学者关注重点和亟待寻找更好解决方式的问题。因此自然语言处理、信息抽取等相关技术在医学文本上的分析、挖掘中将发挥重要的作用。自然语言处理(natural language processing,NLP)应用于医学文本,也叫医疗语言处理(Medical-language processing,MLP),其基础研究包括分词、词性标注、句法分析、命名实体识别、实体关系抽取、共指消解等内容。深加工语料库(树库)既可以用于研究各种语法现象以及语言的整体特点,本文是在多视图汉语树库(Multi-view Chinese Treebank)平台进行的实体关系抽取工作,本文共分为五个部分,各个部分主要内容介绍如下:第一部分,绪论。主要介绍本文的研究背景、理论基础、研究现状、研究方法以及研究意义。第二部分,多视图汉语树库。主要介绍了多视图汉语树库的构建工作,主要涉及语料的来源、标注体系、标注模型、标注平台的介绍。第叁部分,命名实体及实体关系。主要介绍了实体关系的选取以及实体关系分类。第四部分,实体关系抽取。主要介绍了与实体关系抽取、识别有关的工作。最后部分,结论与展望。概括本文的主要研究内容、研究成果;总结了本文对自然语言处理、语言研究的意义;分析了本文的不足之处并对下一步的工作进行了初步规划。(本文来源于《鲁东大学》期刊2019-06-01)
何龙[4](2019)在《基于依存句法分析的企业税法实体关系抽取方法研究》一文中研究指出随着人工智能技术的不断发展,人机对话系统的构建成了研究领域里的一大热点,人机对话的实现离不开计算机对于文本信息(以下简称“文本”)的处理和理解,从现有的研究来看,计算机对于文本的理解还不够智能化。计算机要实现对文本的智能化处理,需要同时对句法和语义进行分析,遇到歧义时,还要结合上下文的语境进行处理,本文的研究亦是基于上述原则展开的。本文研究重点在于命名实体识别和实体关系抽取,为了取得较好的结果,需要将语法规则和语义分析结合在一起。命名实体的识别,通过知识图谱进行总结和梳理,以一种可视化的形式展现出来,同时在最大程度上确保了命名实体的全面性,方便及时查漏补缺。实体关系抽取,要从语法和语义两个方面入手,为了获取较好的语法规则,本文选用了依存句法对其进行分析。该种方法可以用来处理长难句和歧义句,且可以更好地展现出句子的核心和层次性。同时,实体关系的抽取离不开实体关系词的语义映射,这就需要对实体关系进行语义上的分类,而不单单只停留在语法层面。有了语法层面的规则分析以及语义层面的实体关系分类,就可以更好地理解一句话的真实意图,从而达到对于文本信息的处理和识别。本文研究的领域为企业税法,因此研究的目标则为公司税法领域内所涉及到的相关命名实体以及实体关系,本文参考了六本该领域的专业书籍,同时通过百度词条、百度问答、知乎等平台来搜寻企业所涉及的相关税法,对其中所涉及到的命名实体进行总结、划分和归类。在构建实体关系体系时,针对每一种实体关系,也建立了一个与之相对应的词表。使用“Mind Manager(思维导图)-幕布”作为工具,生成该领域中所涉及到的命名实体及实体间关系,然后以图形的方式将它们表现出来。同时,抽取其中所涉及到的命名实体关系,抽取主要是对句法规则进行总结,对新增的句子进行解析,得出相应的分词,在经过分词、词性标注以及句法分析等步骤后,每个句子都会有一个相对应的句法树,每个句法树都可以用相对应的标签来表示。本文选择企业税法领域作为研究对象,与其重要性是密不可分的。税收来源于民众,而服务于民众。无论是从国家或是政府的财政收入还是社会的经济发展状况来看,税收都起到了举足轻重的作用。而税收的依据就是税法,基于此,笔者认为研究企业税法的社会价值十分重要。同时,现阶段,整个社会进入了一个全民创业期。对于创业者来说,他们急需学习相关的企业税法知识,而本文所做的有关于“企业税法”方面的研究将为他们提供一个了解该领域知识的平台。此外,本文在企业税法实体关系抽取研究的基础上,结合当前的研究热点,将研究内容与自动问答系统结合在一起,使得研究结果能够运用到实践中,也让该研究具有了更多的实际价值。综上所述,本文利用依存句法分析技术和语义分类,将其应用于企业税法领域中,试图实现自动抽取命名实体和实体关系的目的,并以此为基础,提出了一套构建该领域的自动问答系统的构想,希望借助该研究,将其运用到实际的自动问答系统之中。(本文来源于《鲁东大学》期刊2019-06-01)
刘施翌[5](2019)在《基于深度学习的依存句法分析研究模型》一文中研究指出随着互联网技术的高速发展和全球化普及,大量语料呈爆炸式的涌现在网络上,从语料中提取出有价值的信息并进行相应的处理已成为当前计算机领域中的一项重要研究内容,由此自然语言处理技术应运而生。句法分析是自然语言处理领域中的一项关键技术,而依存句法因其简洁明了的表现形式以及对词语之间修饰关系的展现而使得该方法在多个领域都取得了广泛的应用。随着近年来深度学习在计算机各个领域所取得的突破性进展,基于深度学习的依存句法分析模型也为处理句法分析中出现的问题带来了新的解决思路。针对当前依存句法的发展趋势,本文提出设计并实现一种基于深度学习的依存句法联合分析模型。首先,使用基于双向长短期记忆网络对句法结构及序列标注进行统一建模;然后,通过词性标注和深度图相结合来处理依存句法分析问题,可以在较大程度上减少在提取特征时因为词性标注所带来的错误蔓延并解决多层次特征无法获取的问题;最后,使用多个多层感知机分别预测依存弧和依存标签。本文在依存句法分析模型基础上设计的句法分析系统利用React、ES6和SVG等技术实现前端用户界面的显示及用户登录、文本训练、文本预测、依存图的展示等功能,并实现服务器端与客户端数据的交互。联合分析模型遵循依存语法在理论方面的四条公理,通过对数据集的划分、对联合模型的训练来实现对原始文本数据的预测,对比于无标签的依存预测与有依存标签的预测这两种常用的依存句法性能评价标准,实验证实本模型所采用的基于词性标注的分析方法在分析精度上较前两者有明显的提升。(本文来源于《沈阳工业大学》期刊2019-05-29)
魏田田[6](2019)在《语言学理论下依存句法分析结果动宾结构补全方法研究》一文中研究指出计算机语言处理技术是语言学应用领域的基础,随着信息技术的发展,在语言处理方法上的研究日渐成熟。语言是人类交流和传递信息的载体和途径,对人类社会的发展十分重要。进行语言分析是掌握一个语种的基础。句法分析是语言分析的核心,是掌握语言内涵要义的重要过程,也是在语言处理中着重进行的部分。计算机语言处理中应用较为广泛的是语言翻译、特征提取和信息检索等,都需要句法分析的结构基础进行技术支持。句法分析的方法中主流的有中心词分析法和依存句法分析法等,其中依存句法分析法在计算机语言处理中应用较广。研究依存句法分析的主要方法,了解依存句法分析的过程,分析依存句法分析存在的不足,提出应用动宾结构补全依存句法分析结果的方法和作用,以达到改进依存句法分析的目的。(本文来源于《汉江师范学院学报》期刊2019年02期)
吴泰中[7](2019)在《利用依存句法分析辅助增强AMR解析方法研究》一文中研究指出抽象语义表示(Abstract Meaning Representation,AMR)是一种领域无关的句子语义表示方法,它以一个单根有向无环图来表示句子的语义。AMR解析目标是将一个自然语言句子转换成对应的AMR图。目前,针对AMR解析的研究还处于起步阶段。通过对AMR标注句子的实例分析可以发现,AMR图与相应依存句法树之间存在着密切的关联性:目前,现有的依存句法分析器相对AMR解析器具有较高的分析准确性。然而,现有的各种基于深度学习的AMR解析模型大都忽视了有效利用依存句法结构信息提高AMR解析性能。因此,本文针对在AMR解析任务中如何集成和利用依存句法结构信息的方法展开实验性研究。具体地,本文的工作主要包括以下叁个方面:(1)梳理了现有AMR解析技术的研究现状,重点分析并对比了不同AMR解析模型对依存句法信息的利用方式,指出了目前研究的不足。同时,对主流的依存句法分析模型和多任务学习技术也进行了深入分析。(2)设计并实现了依存句法分析基线模型和AMR解析基线模型。依存句法分析基线模型采用基于自注意力的句子编码模型和基于双仿射分类器的预测模型。AMR解析基线模型中,采用基于LSTM-CRF的序列化标注模型实现了语义概念的识别,采用和依存句法分析模型相似的方法实现了语义关系的识别,最后通过贪心解码算法生成AMR图。实验结果表明,本文所设计的基线模型,在保持两者的模型相似性的基础上,具有较好的性能,为联合模型的构建打下了基础。(3)提出了一种在AMR解析任务中使用依存句法特征信息的新方式,建立了融合依存句法分析的AMR解析联合模型。该模型使用了参数共享的方式,使模型可以获取一般性的特征表示,引入了注意力机制使AMR解析充分地利用了依存句法的相关知识,改进了损失函数以缓解梯度不平衡问题,通过预训练的语言模型提升了解析性能。实验结果表明该联合模型在提升AMR解析性能上有很好的效果,相比传统的使用特征模板的方式,更能够有效地利用依存句法的信息。(本文来源于《南京师范大学》期刊2019-03-27)
李源,黄文灿,胡金柱[8](2019)在《一种结构和语义兼顾的综合分析思想在复句依存句法分析中的运用》一文中研究指出针对目前分析复句中分句内成分间依存关系的方法多是从分析语法成分间的关系出发,并通过句子内词与词之间的依存关系来揭示句子的句法结构,但容易忽略语言结构的层次而导致在语义理解上有明显缺陷这一问题,在上述分析过程中引入综合分析法的思想,提出了一种新的汉语依存句法分析方法,并以汉语结构类型模板为桥梁,得到结构和语义兼顾的依存关系分析结果。实验结果表明该方法相较于传统方法在依存关系界定性能上有一定提高。(本文来源于《计算机与数字工程》期刊2019年03期)
丁德智,李玫,李国栋[9](2018)在《基于依存句法分析的资金账户交易画像》一文中研究指出为了提升电网企业资金安全管控能力,有效防范资金安全风险,保障资金高效运转,文章利用企业海量的银行交易流水数据,应用自然语言处理技术,基于依存句法分析的结果设计摘要标签化的提取规则,得到与交易记录有关的交易标签与业务标签。进一步构建出动态完整、实时反映的资金账户交易画像,帮助企业管理人员全面了解账户的历史交易行为,及时发现异常交易风险,辅助管理决策。使用某电网公司6个月的资金交易数据对模型的效果进行测试和评估,获得了平均96%以上的F1值,结果证实了模型具有很好的实用性,能够在电网企业进行推广应用。(本文来源于《电力信息与通信技术》期刊2018年12期)
刘明童,张玉洁,徐金安,陈钰枫[10](2018)在《基于多特征融合编码的神经网络依存句法分析模型》一文中研究指出在基于神经网络的依存句法分析中,对分析栈和决策层信息的表示和利用依然有值得深入研究的空间。针对分析栈的表示,已有工作并没有对单棵依存子树独立编码的表示,导致无法利用各个依存子树的局部特征;也没有对生成的依存弧序列进行编码,导致无法利用依存弧的全局信息。针对决策层的表示,已有工作利用MLP预测转移动作,该结构无法利用历史决策动作的信息。对此,该文提出基于多特征融合编码的神经网络依存句法分析模型,基于依存子树和历史生成的依存弧表示分析栈,利用TreeLSTM网络编码依存子树信息,利用LSTM网络编码历史生成的依存弧序列,以更好地表示分析栈的局部信息和全局信息。进一步提出基于LSTM网络的结构预测转移动作序列,引入历史决策动作信息作为特征辅助当前决策。该文以汉语为具体研究对象,在CTB5汉语依存分析数据上验证所提出的多特征融合编码的神经网络模型。实验结果显示,汉语依存句法分析性能得到改进,在目前公布的基于转移的分析系统中取得最好成绩,在UAS和LAS评价指标上分别达到87.8%和86.8%的精度,表明所提出的对依存子树局部特征及历史依存弧信息和历史决策动作信息的编码方法,在改进依存分析模型性能方面的有效性。(本文来源于《中文信息学报》期刊2018年12期)
句法依存分析论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着移动互联技术的发展,微博作为一种新媒体形式日益成为国内主流的移动社交媒体平台。微博包含海量的信息数据且数据种类多样,即有文档文本数据,也有图片、表情符号、视频动画等非结构化的数据。因此,对各政府部门和企业单位的网络舆情监管提出了艰巨的挑战,有关中文微博文本的情感分析的研究也成为近几年数据挖掘领域的关注方向之一,情感分析研究主要围绕着信息的抽取和情感倾向的判定,均离不开对微博文本的分词工作。本文提出了一种基于依存句法树的情感分析方法。根据不同的词汇间的依存关系,制定了相应的情感短语削减规则。通过分析不同程度词和否定词对情感词的修饰和组合关系,制定了不同的汇聚规则。使用LTP-Cloud(语言技术平台云)进行句法分析,构建依存句法树,通过对句法树的后序遍历逐步汇聚情感向量。使用了为情感值取绝对值的情感判别方法,得到最终的情感类别。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
句法依存分析论文参考文献
[1].俞琰,陈磊,姜金德,赵乃瑄.基于依存句法分析的中文专利候选术语选取研究[J].图书情报工作.2019
[2].王彬菁.基于依存句法树方法的微博文本的情感分析研究[J].电脑知识与技术.2019
[3].江爽.基于依存句法分析的皮肤病实体关系抽取[D].鲁东大学.2019
[4].何龙.基于依存句法分析的企业税法实体关系抽取方法研究[D].鲁东大学.2019
[5].刘施翌.基于深度学习的依存句法分析研究模型[D].沈阳工业大学.2019
[6].魏田田.语言学理论下依存句法分析结果动宾结构补全方法研究[J].汉江师范学院学报.2019
[7].吴泰中.利用依存句法分析辅助增强AMR解析方法研究[D].南京师范大学.2019
[8].李源,黄文灿,胡金柱.一种结构和语义兼顾的综合分析思想在复句依存句法分析中的运用[J].计算机与数字工程.2019
[9].丁德智,李玫,李国栋.基于依存句法分析的资金账户交易画像[J].电力信息与通信技术.2018
[10].刘明童,张玉洁,徐金安,陈钰枫.基于多特征融合编码的神经网络依存句法分析模型[J].中文信息学报.2018