导读:本文包含了依存句法论文开题报告文献综述及选题提纲参考文献,主要关键词:术语抽取,依存句法分析,中文候选术语选取
依存句法论文文献综述
俞琰,陈磊,姜金德,赵乃瑄[1](2019)在《基于依存句法分析的中文专利候选术语选取研究》一文中研究指出[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等叁个主要步骤。首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语。[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性。(本文来源于《图书情报工作》期刊2019年18期)
王彬菁[2](2019)在《基于依存句法树方法的微博文本的情感分析研究》一文中研究指出随着移动互联技术的发展,微博作为一种新媒体形式日益成为国内主流的移动社交媒体平台。微博包含海量的信息数据且数据种类多样,即有文档文本数据,也有图片、表情符号、视频动画等非结构化的数据。因此,对各政府部门和企业单位的网络舆情监管提出了艰巨的挑战,有关中文微博文本的情感分析的研究也成为近几年数据挖掘领域的关注方向之一,情感分析研究主要围绕着信息的抽取和情感倾向的判定,均离不开对微博文本的分词工作。本文提出了一种基于依存句法树的情感分析方法。根据不同的词汇间的依存关系,制定了相应的情感短语削减规则。通过分析不同程度词和否定词对情感词的修饰和组合关系,制定了不同的汇聚规则。使用LTP-Cloud(语言技术平台云)进行句法分析,构建依存句法树,通过对句法树的后序遍历逐步汇聚情感向量。使用了为情感值取绝对值的情感判别方法,得到最终的情感类别。(本文来源于《电脑知识与技术》期刊2019年24期)
刘继明,谭云丹,袁野[3](2019)在《基于平滑逆频率和依存句法的句子相似度计算方法》一文中研究指出综合考虑关键词、词向量及句法结构对句子相似度计算的影响,将平滑逆频率(smooth inverse frequency,SIF)与依存句法相结合以提高句子相似度计算的精准性。SIF的核心思想为利用加权和去除非信息噪音得到的句向量来计算句子相似度。借助哈尔滨工业大学的语言技术平台,将句子的结构信息添加到句子相似度计算中,通过句子中"词语依存关系"叁元组的相似性来度量句子间的相似度。实验结果表明,基于SIF和依存句法的句子相似度计算方法所得的反映准确率和召回率平衡度的指标为84. 4%,与同类的句子相似度计算方法相比,能更为有效衡量句子间的相似程度。(本文来源于《科学技术与工程》期刊2019年20期)
江爽[4](2019)在《基于依存句法分析的皮肤病实体关系抽取》一文中研究指出文章工作的重点是在语言学的基础上,进行多视图汉语树库的构建以及实体关系的抽取,主要的理论框架是在依存句法的基础上进行的文本挖掘工作,本文的创新点就是将依存句法树库与具体的专业知识相结合,继而在多视图汉语树库的标注平台上进行命名实体的选定以及命名实体关系的归纳总结处理,然后对各类命名实体关系进行依存句法模型的抽取,以展示皮肤病领域中实体间的语义关系。切实将理论与实际相结合,以扩大语料库、丰富语料规模、进一步拓展汉语多视图树库的应用,也使语言学对自然语言处理多作一分贡献,以期为计算机进行其他相关领域如,电子病历等临床领域的命名实体关系抽取时提供一个模板,多做一种尝试。近年来,随着自然语言处理技术的进步与成熟,大量的涉及各个领域的非结构化文本数据,例如:皮肤病、中小学教材专着、电子病历等都可以尝试进行结构化的数据处理,以方便进行文本挖掘。目前大部分的医药文本并不是结构化了的信息数据,包括许多由自然语言描述而成的复杂无结构的文本数据,虽然文本类型的信息数据能够方便详细准确地进行描述概念以及事件等内容,但是大篇幅、无结构的文本数据,同时也为搜索、统计分析等增添了负担、制造了障碍,可能会对数据分析结果的质量造成负面影响。为了能够有效充分利用现有的语言学理论、成熟的分析工具对医药文本进行数据分析和数据挖掘,从而提高医疗数据的价值,对非结构化的文本数据进行结构化的处理,就成为了不少学者关注重点和亟待寻找更好解决方式的问题。因此自然语言处理、信息抽取等相关技术在医学文本上的分析、挖掘中将发挥重要的作用。自然语言处理(natural language processing,NLP)应用于医学文本,也叫医疗语言处理(Medical-language processing,MLP),其基础研究包括分词、词性标注、句法分析、命名实体识别、实体关系抽取、共指消解等内容。深加工语料库(树库)既可以用于研究各种语法现象以及语言的整体特点,本文是在多视图汉语树库(Multi-view Chinese Treebank)平台进行的实体关系抽取工作,本文共分为五个部分,各个部分主要内容介绍如下:第一部分,绪论。主要介绍本文的研究背景、理论基础、研究现状、研究方法以及研究意义。第二部分,多视图汉语树库。主要介绍了多视图汉语树库的构建工作,主要涉及语料的来源、标注体系、标注模型、标注平台的介绍。第叁部分,命名实体及实体关系。主要介绍了实体关系的选取以及实体关系分类。第四部分,实体关系抽取。主要介绍了与实体关系抽取、识别有关的工作。最后部分,结论与展望。概括本文的主要研究内容、研究成果;总结了本文对自然语言处理、语言研究的意义;分析了本文的不足之处并对下一步的工作进行了初步规划。(本文来源于《鲁东大学》期刊2019-06-01)
何龙[5](2019)在《基于依存句法分析的企业税法实体关系抽取方法研究》一文中研究指出随着人工智能技术的不断发展,人机对话系统的构建成了研究领域里的一大热点,人机对话的实现离不开计算机对于文本信息(以下简称“文本”)的处理和理解,从现有的研究来看,计算机对于文本的理解还不够智能化。计算机要实现对文本的智能化处理,需要同时对句法和语义进行分析,遇到歧义时,还要结合上下文的语境进行处理,本文的研究亦是基于上述原则展开的。本文研究重点在于命名实体识别和实体关系抽取,为了取得较好的结果,需要将语法规则和语义分析结合在一起。命名实体的识别,通过知识图谱进行总结和梳理,以一种可视化的形式展现出来,同时在最大程度上确保了命名实体的全面性,方便及时查漏补缺。实体关系抽取,要从语法和语义两个方面入手,为了获取较好的语法规则,本文选用了依存句法对其进行分析。该种方法可以用来处理长难句和歧义句,且可以更好地展现出句子的核心和层次性。同时,实体关系的抽取离不开实体关系词的语义映射,这就需要对实体关系进行语义上的分类,而不单单只停留在语法层面。有了语法层面的规则分析以及语义层面的实体关系分类,就可以更好地理解一句话的真实意图,从而达到对于文本信息的处理和识别。本文研究的领域为企业税法,因此研究的目标则为公司税法领域内所涉及到的相关命名实体以及实体关系,本文参考了六本该领域的专业书籍,同时通过百度词条、百度问答、知乎等平台来搜寻企业所涉及的相关税法,对其中所涉及到的命名实体进行总结、划分和归类。在构建实体关系体系时,针对每一种实体关系,也建立了一个与之相对应的词表。使用“Mind Manager(思维导图)-幕布”作为工具,生成该领域中所涉及到的命名实体及实体间关系,然后以图形的方式将它们表现出来。同时,抽取其中所涉及到的命名实体关系,抽取主要是对句法规则进行总结,对新增的句子进行解析,得出相应的分词,在经过分词、词性标注以及句法分析等步骤后,每个句子都会有一个相对应的句法树,每个句法树都可以用相对应的标签来表示。本文选择企业税法领域作为研究对象,与其重要性是密不可分的。税收来源于民众,而服务于民众。无论是从国家或是政府的财政收入还是社会的经济发展状况来看,税收都起到了举足轻重的作用。而税收的依据就是税法,基于此,笔者认为研究企业税法的社会价值十分重要。同时,现阶段,整个社会进入了一个全民创业期。对于创业者来说,他们急需学习相关的企业税法知识,而本文所做的有关于“企业税法”方面的研究将为他们提供一个了解该领域知识的平台。此外,本文在企业税法实体关系抽取研究的基础上,结合当前的研究热点,将研究内容与自动问答系统结合在一起,使得研究结果能够运用到实践中,也让该研究具有了更多的实际价值。综上所述,本文利用依存句法分析技术和语义分类,将其应用于企业税法领域中,试图实现自动抽取命名实体和实体关系的目的,并以此为基础,提出了一套构建该领域的自动问答系统的构想,希望借助该研究,将其运用到实际的自动问答系统之中。(本文来源于《鲁东大学》期刊2019-06-01)
刘施翌[6](2019)在《基于深度学习的依存句法分析研究模型》一文中研究指出随着互联网技术的高速发展和全球化普及,大量语料呈爆炸式的涌现在网络上,从语料中提取出有价值的信息并进行相应的处理已成为当前计算机领域中的一项重要研究内容,由此自然语言处理技术应运而生。句法分析是自然语言处理领域中的一项关键技术,而依存句法因其简洁明了的表现形式以及对词语之间修饰关系的展现而使得该方法在多个领域都取得了广泛的应用。随着近年来深度学习在计算机各个领域所取得的突破性进展,基于深度学习的依存句法分析模型也为处理句法分析中出现的问题带来了新的解决思路。针对当前依存句法的发展趋势,本文提出设计并实现一种基于深度学习的依存句法联合分析模型。首先,使用基于双向长短期记忆网络对句法结构及序列标注进行统一建模;然后,通过词性标注和深度图相结合来处理依存句法分析问题,可以在较大程度上减少在提取特征时因为词性标注所带来的错误蔓延并解决多层次特征无法获取的问题;最后,使用多个多层感知机分别预测依存弧和依存标签。本文在依存句法分析模型基础上设计的句法分析系统利用React、ES6和SVG等技术实现前端用户界面的显示及用户登录、文本训练、文本预测、依存图的展示等功能,并实现服务器端与客户端数据的交互。联合分析模型遵循依存语法在理论方面的四条公理,通过对数据集的划分、对联合模型的训练来实现对原始文本数据的预测,对比于无标签的依存预测与有依存标签的预测这两种常用的依存句法性能评价标准,实验证实本模型所采用的基于词性标注的分析方法在分析精度上较前两者有明显的提升。(本文来源于《沈阳工业大学》期刊2019-05-29)
吴林静,劳传媛,刘清堂,黄景修,巴深[7](2019)在《基于依存句法的初等数学分层抽样应用题题意理解》一文中研究指出数学应用题自动求解,即利用计算机对自然语言描述的应用题进行自动理解和作答,一直是人工智能领域研究的重难点和核心目标之一。针对应用题语义复杂、上下文情景多变、关键参数难以准确识别的问题,提出一种基于依存句法的初等数学分层抽样应用题题意理解方法。通过构建一个面向初等数学分层抽样类应用题的句模库,并结合依存句法来实现分层抽样应用题解题信息的自动抽取。实验研究发现,与仅基于句模的信息抽取方法相比,该方法对不同语义角色的句子的信息抽取准确率均有一定提升,整题理解的准确率从40%上升至68%。(本文来源于《计算机应用与软件》期刊2019年05期)
许建飞[8](2019)在《基于依存句法与情感极性融合的商品评论特征标签抽取研究》一文中研究指出文章以京东商城手机、电脑、美妆、食品4类商品的13 218条评论数据为数据源,通过将依存语法分析与情感极性分析相融合提出一种新的商品评论特征标签抽取方法,不仅解决了抽取算法的鲁棒性不高问题,还提高了抽取结果的准确性。通过实验可知,本文采取的抽取方法的准确率稳定在0.7,召回率和F值均稳定在0.8,总体结果理想,但对于匹配字典的依赖、标签抽取范围狭窄问题有待进一步的研究。(本文来源于《江苏科技信息》期刊2019年13期)
朱佩佩[9](2019)在《基于依存句法的旅游景点评价系统》一文中研究指出现今,旅游已经成为人们放松身心、开拓视野的首选方式。在中国的国民消费中,旅游消费比重逐年增大。各大旅游网站在为消费者提供酒店服务、门票价格及旅游攻略的同时,也为广大网民提供了发表旅游评论的机会。这些评论数据包含了对景点服务、路线或是特色等反馈。这些反馈信息往往能为其他用户做攻略时提供决策支持。但目前网络数据庞大,浏览数据需要花费大量的时间和精力。重庆市的地理环境特殊,形成了饮食、旅游相结合的产业链。纵观去年的中商情报网讯,2018年1-12月游客达到了59723.71万人次创历史新高,同比增长了10.13%。同时,旅游人次的增加带动了重庆市的经济的增长,2018年实现总收入4344.15亿元,比去年增长了31.32%。在此时代背景下,以重庆市的热门旅游景点为例,设计开发了一款基于依存句法的旅游景点评价系统,主要的研究贡献如下。第一,基于Selenium爬虫技术,设计了一套自动获取评论的方案。针对当前单个旅游网站评论数据量有限的问题,利用Selenium工具,获取携程网及马蜂窝网上重庆标志景点的评论数据30000条,并设置定时更新获取的功能,为系统提供了足够的数据支持。第二,合并筛选现有的知网HowNet及台湾大学NTUSD词典得到基础的情感词典,并借助哈工大《信息检索研究中心同义词词林扩展版》词典设计算法完成了扩建。针对当前现有词典数量较少,造成情感分类不准确的问题,借助HowNet及台湾大学NTUSD词典构建了基础情感词典和程度副词词典,并搜索网络构建了否定词词典。基于宋京生提出的汉英从属连词比较的理论,构建了关联词词典,最终形成了包含6440个词语的积极词典,包含负向情感词8110个的消极词典,包含213个词语的程度副词词典,包含18个词语常用否定词典以及47个词的关联词典,词典种类的增加及词典数量的丰富,增加了情感分析的准确度。第叁,基于依存句法并设计计算规则完成对段落级旅游评论的情感分析,在同类算法中提高了分类的准确性。系统借助斯坦福大学的StandFord Parse工具抽取句子的依存关系,并在设计情感规则时考虑否定词和程度副词的共现位置及关联词对句子情感倾向的影响,通过仿真实验,将这种方法与文献[12]中未考虑这些规则的方法结果作对比,情感分类的准确性提高了4%。最后,采用Django框架及HTML5+JavaScript+Python语言完成整个系统的开发工作。鉴于目前的旅游网站如“携程网”“马蜂窝”上只能看到用户对景点的具体评论,缺少用户更感兴趣的景点话题,如景点的价格、服务、交通等却没有直观的展示等问题。系统提供了对特定景点主题的查看,并能够浏览用户对各个主题的情感倾向,为情感分析的可视化搭建了平台。(本文来源于《重庆师范大学》期刊2019-05-01)
魏田田[10](2019)在《语言学理论下依存句法分析结果动宾结构补全方法研究》一文中研究指出计算机语言处理技术是语言学应用领域的基础,随着信息技术的发展,在语言处理方法上的研究日渐成熟。语言是人类交流和传递信息的载体和途径,对人类社会的发展十分重要。进行语言分析是掌握一个语种的基础。句法分析是语言分析的核心,是掌握语言内涵要义的重要过程,也是在语言处理中着重进行的部分。计算机语言处理中应用较为广泛的是语言翻译、特征提取和信息检索等,都需要句法分析的结构基础进行技术支持。句法分析的方法中主流的有中心词分析法和依存句法分析法等,其中依存句法分析法在计算机语言处理中应用较广。研究依存句法分析的主要方法,了解依存句法分析的过程,分析依存句法分析存在的不足,提出应用动宾结构补全依存句法分析结果的方法和作用,以达到改进依存句法分析的目的。(本文来源于《汉江师范学院学报》期刊2019年02期)
依存句法论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着移动互联技术的发展,微博作为一种新媒体形式日益成为国内主流的移动社交媒体平台。微博包含海量的信息数据且数据种类多样,即有文档文本数据,也有图片、表情符号、视频动画等非结构化的数据。因此,对各政府部门和企业单位的网络舆情监管提出了艰巨的挑战,有关中文微博文本的情感分析的研究也成为近几年数据挖掘领域的关注方向之一,情感分析研究主要围绕着信息的抽取和情感倾向的判定,均离不开对微博文本的分词工作。本文提出了一种基于依存句法树的情感分析方法。根据不同的词汇间的依存关系,制定了相应的情感短语削减规则。通过分析不同程度词和否定词对情感词的修饰和组合关系,制定了不同的汇聚规则。使用LTP-Cloud(语言技术平台云)进行句法分析,构建依存句法树,通过对句法树的后序遍历逐步汇聚情感向量。使用了为情感值取绝对值的情感判别方法,得到最终的情感类别。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
依存句法论文参考文献
[1].俞琰,陈磊,姜金德,赵乃瑄.基于依存句法分析的中文专利候选术语选取研究[J].图书情报工作.2019
[2].王彬菁.基于依存句法树方法的微博文本的情感分析研究[J].电脑知识与技术.2019
[3].刘继明,谭云丹,袁野.基于平滑逆频率和依存句法的句子相似度计算方法[J].科学技术与工程.2019
[4].江爽.基于依存句法分析的皮肤病实体关系抽取[D].鲁东大学.2019
[5].何龙.基于依存句法分析的企业税法实体关系抽取方法研究[D].鲁东大学.2019
[6].刘施翌.基于深度学习的依存句法分析研究模型[D].沈阳工业大学.2019
[7].吴林静,劳传媛,刘清堂,黄景修,巴深.基于依存句法的初等数学分层抽样应用题题意理解[J].计算机应用与软件.2019
[8].许建飞.基于依存句法与情感极性融合的商品评论特征标签抽取研究[J].江苏科技信息.2019
[9].朱佩佩.基于依存句法的旅游景点评价系统[D].重庆师范大学.2019
[10].魏田田.语言学理论下依存句法分析结果动宾结构补全方法研究[J].汉江师范学院学报.2019