自然语义论文-张琨

自然语义论文-张琨

导读:本文包含了自然语义论文开题报告文献综述及选题提纲参考文献,主要关键词:自然语言,语义表示,情境信息,多模态建模

自然语义论文文献综述

张琨[1](2019)在《情境感知的自然语言语义表示方法研究》一文中研究指出自然语言是人类沟通与交流的主要方式,以表象的符号表示高度抽象的语义信息。作为人类几千年知识与智慧的结晶,自然语言组织结构复杂,语义表达形式多样。词、短语、句子、段落、文章等都有其各自独有的特点,同时彼此之间也存在着潜在的联系。让模型能够充分理解自然语言,是人工智能完备性问题的重点研究内容之一。要实现这个目标,首先需要解决的问题就是如何表示自然语言的语义。现阶段,基于分布式假设的词向量,以及基于超大规模的语料库与超大规模网络结构的预训练语义表示模型已经取得了优异的成绩。但自然语言的语义理解与表示仍面临着情境信息利用不充分,模型结构复杂,内部机制难以解释等诸多挑战。为此,本文提出利用情境信息来辅助自然语言的语义理解与表示,从情境信息的选择,情境信息的利用以及文本的处理等方面展开深入研究,最终提升模型表示自然语言语义的能力。本文工作与贡献可以概括如下:首先,提出了情境信息丰富的词语义表示方法与情境感知的双重注意力的句子语义表示方法。传统基于分布式假设的词向量表示方法用一个固定向量来表示语义信息,这会导致词义模糊、表达不准确。为此,本文分别从词级别和句子级别对自然语言的语义表示进行研究。一方面,针对词的语义表示缺乏合适情境信息的问题,基于不同情境信息揭示的是词的不同方面语义的发现,通过在大规模语料库中选择不同类型的情境信息训练词向量,实现对词语义更全面的表示。在此基础上,针对具体应用,设计了一种可扩展性良好的神经网络结构,根据具体的语义关系利用注意力机制选择最适合的语义向量表示,实现了对词语义的全面表示与高效利用。实验结果表明本文提出的方法能够显着提高词蕴涵识别的准确率。另一方面,针对句子语义建模过程中情境信息缺失的问题,本文还选择多模态数据(图像信息)作为句子情境信息的补充,利用图像注意力构建句子语义的丰富表达。在此基础上利用句子注意力实现句子之间的语义交互建模,两者相互结合,最终实现句子语义的全面建模与句子语义推理关系的准确识别。在大规模公开标准数据集上的实验也验证了本文提出的方法的有效性。其次,提出了情境信息多层次利用的句子语义表示方法。多模态情境数据(例如图像信息)能够丰富文本的情境信息,但多模态数据形式多样,与句子语义之间存在不同层次的关联。为此,本文从句子语义表示角度提出了图像增强的多层次语义表示框架。分别从词级别、短语级别、句子级别利用图像信息增强对句子语义的准确理解与表示,提升模型表示句子语义以及识别句子间语义推理关系的准确率。更进一步,考虑到图像信息更多的展示视觉特征,与自然语言表达的高度抽象语义存在巨大差异的问题,本文深入研究了图像情境信息的使用方法,提出了一种自适应的图像语义特征抽取器,利用图像的描述句子抽取细粒度的图像语义特征,并设计实现了一种多层次图像增强的语义表示框架。通过融合粗粒度的预训练图像视觉特征与细粒度的图像语义特征实现图像信息的高效利用,进而更为准确地表示句子语义,提升模型的语义表示能力。多个自然语言推理公开标准数据集上的大量实验也证明了本文提出的方法能够有效利用图像实现对句子语义全面准确地表示。最后,提出了情境感知的句子动态阅读表示方法。自然语言是人类最主要的沟通交流方式,因此人类的一些自然语言行为对研究其表示方法有重要的指导与借鉴意义。为此,本文通过借鉴人类阅读习惯,提出了动态阅读的自然语言句子语义表示方法。具体而言,该网络能够根据已掌握的信息动态选择当前状态下最需要关注的一个词,实现对句子中动态变化的重要内容的准确识别。在此基础上,通过不断循环该过程,实现对整个句子语义的准确理解。除此之外,考虑到自然语言的语义表示高度依赖情境信息,情境信息的缺乏会导致语义表示的模糊、不准确。因此,本文提出了局部感知的动态重读网络,在动态重读网络每次只选择一个最重要的词的基础上更进一步,同时选择出帮助理解该重要词的局部情境信息,通过两者的结合,保证对选择出的重点词的准确理解,从而进一步提升模型理解与表示句子语义的能力。多个句子语义匹配任务上的多个不同公开数据集上的大量实验充分证明了本文提出的方法能够准确掌握句子中动态变换的重点内容,实现句子语义的准确理解与表示。(本文来源于《中国科学技术大学》期刊2019-11-01)

杨菊英,江兵,罗佳[2](2019)在《自然语言语义库构建方法研究》一文中研究指出自然语言语义语料库构建是智能云计算环境中实现信息交换的关键步骤,对语义语料库构造技术进行了分析,提出了一种基于词频-逆文本频率(term frequency-inverse document frequency,TF-IDF)和字向量距离的新型网页去重复算法,该方法专注于解决语音识别中的存储问题,为分词和句法分析提供功能支持。该方法可以直接用于语义语料库构建,能提高网页重复数据删除的效率。实验结果表明:该方法能实现云计算平台的语义库构建,且性能优于其他方法,说明了该方法的可行性和有效性。(本文来源于《重庆理工大学学报(自然科学)》期刊2019年10期)

冯雪[3](2019)在《基于外部语义知识补全的自然语言查询》一文中研究指出语义网是依托互联网技术而产生的一类非常重要的资源。目前,语义网中的用户查询仅支持形式化的查询方式,因此需要严格地遵循某种特定的语法规范,从而导致只有熟悉语义网系统和形式语言的专业人士才能正确进行查询操作。为了弥补这一缺陷,提出了一个无指导的自然语言查询系统,它能自动地将自然语言的句子转换成语义网查询支持的形式语言语句,从而方便非专业用户(即普通用户)使用。该系统首先根据语义网自动抽取给定句子中的所有实体和属性,然后将这些实体和属性关联起来形成一个语义关联图,最后通过启发式的方式从图中搜索出一条最优路径,并将这条路径转换成SPARQL语句。该系统最关键的部分在于语义网中的实体和属性覆盖度,它能直接决定语义关联图的好坏,从而影响系统的最终性能。为了提升系统的实用性,进一步利用外部语义网的知识来补全和丰富自然语言句子中所蕴含的信息,优化中间生成的语义关联度,得到更准确的SPARQL语句。最后采用美国地理问题集进行实验以验证该系统以及提出的改进方法,该数据集共包含了880个问句的人工SPARQL语句,是自然语言查询相关工作中一个被广泛认可的数据集。最终实验结果表明:提出的基准系统能够正确回答77.6%的问题,显着优于当前最好的无指导系统;当采用外部语义知识补全后,回答正确率达到78.5%。(本文来源于《计算机科学》期刊2019年08期)

邵岚,姚艳松,李宣[4](2019)在《基于互联网大数据的自然语义分析研究》一文中研究指出随着互联网中的自然语言数量越来越庞大,各种自然语言处理技术在不同行业的需求也日益增长,同时一些新的算法和模型也应运而生。本文首先对这些自然语言处理技术进行了研究与比较,然后应用这些技术于互联网数据上,对比了不同参数下算法的性能,实现了对互联网数据的自动分类。(本文来源于《网络安全技术与应用》期刊2019年01期)

张秀红,刘纪平,王勇,罗安[5](2018)在《面向自然语言空间方向关系查询的语义扩展框架》一文中研究指出由于受空间对象的地理语义差异及空间关系认知差异的影响,目前面向自然语言的空间方向关系查询难以满足人们的应用需求。该文对传统的空间关系叁元组进行语义扩展,提出了面向自然语言空间方向关系查询的扩展框架,通过自定义查询特征提取和推理规则,将用户查询意图从自然语言描述映射为物理计算模型,最后,结合地理本体库、查询规则库和空间数据库,实现了面向自然语言的空间方向关系查询系统。对比分析表明,该文提出的查询扩展框架在查询准确率和查询效率方面均优于传统模型。(本文来源于《地理与地理信息科学》期刊2018年06期)

王禄生[6](2018)在《论刑事诉讼的象征性立法及其后果——基于303万判决书大数据的自然语义挖掘》一文中研究指出对超过303万份一审刑事文书的数据挖掘显示,《刑事诉讼法(2012修正)》实施的五年间,审前羁押、刑事辩护、繁简分流等方面的部分指标已明显好转。然而这些改善只是一系列容易观测到的浅层指标;深度数据挖掘则显示,部分与刑事法治改革效果息息相关的深层指标并未同步改善,我国刑事司法改革陷入了"治本困境"。这具体表现在羁押措施的生成机制与隐性功能高度固化、律师刑辩状况改善陷入形式化困境、刑事诉讼效率提升面临结构性障碍。从成因来看,刑事诉讼"象征性立法"导致的"权利虚化"与"权力异化"是症结所在。(本文来源于《清华法学》期刊2018年06期)

上官明霞,朱珊珊,陈晓亮,王晶华,郭光[7](2018)在《基于融合自然语言处理的语义分析方法研究》一文中研究指出面对电力复杂的数据环境下,传统单一的数据分析技术已经无法满足现实应用精准需求,需集多种策略优势为一体的模型综合处理数据信息。针对目前的发展瓶颈,采用融合性自然语言处理技术预测设备行为发展趋势,提取数据语义,通过小波分解法去除词义噪声,利用贝叶斯先验知识模型来推导后验概率,从而作为神经网络动态权值变化及语义预测分布的依据。通过实验测试证明了这种预测方法的可靠性及优越性。(本文来源于《计算机与网络》期刊2018年20期)

肖娇[8](2018)在《基于功能磁共振成像的自然视频编码与语义网络分析》一文中研究指出大脑是人类最重要的信息处理中心,视觉信息的获取和理解是人类对外界感知和认识的主要途径,对视觉信息的解读成为探索大脑对外界信息处理机制的一种重要方式,是神经信息科学领域的研究热点。而探索大脑的语义信息理解机制为视觉信息解读提供了新的研究思路和方法。功能磁共振成像技术由于能够获取高空间分辨率的大脑功能活动图像而成为大脑视觉信息解读的主要途径之一。针对大脑语义信息理解机制问题,本文主要借助fMRI技术来对自然视频任务条件下的大脑语义网络进行探索研究。着重研究了自然视频语义特征的视觉编码模型和大脑体素对词语类别的预测响应,并在编码模型的基础上结合fMRI特征选择方法构建大脑语义网络,以及利用复杂网络分析方法来对大脑语义网络及WordNet词语连接网络进行分析,主要工作包括以下叁点。1.构建了一种基于自然视频语义特征的视觉编码模型,并利用该模型来分析大脑体素对语义信息的预测响应。通过对视频中的对象及动作进行标注并借助WordNet词语层次关系来构建视频刺激语义特征,使用机器学习中的模型构建方法来获得视觉编码模型。结果表明,提取的语义特征能够有效表征视频刺激信息。另外,编码模型的性能及大脑体素对不同语义信息的预测响应具有明显的差异表明大脑语义网络构建的有效性。2.在视觉编码模型的基础上结合fMRI特征选择方法构建大脑语义网络。从复杂网络统计特征的角度来对大脑语义网络及WordNet词语连接网络进行异同点分析。结果表明,不同被试大脑语义网络之间的相似度很高,而与WordNet词语连接网络具有较大的差异。3.从复杂网络社区检测的角度来对大脑语义网络及WordNet词语连接网络进行异同点分析,通过网络的社区结构及同一个社区间词语节点语义信息的关联关系的分析结果表明,大脑是根据词语对应事物的某种关联特征来对词语进行认知分类,与WordNet词典中按词语的层次关系对词语进行定义、区分的方式有所不同。(本文来源于《江西财经大学》期刊2018-06-01)

陈谦[9](2018)在《基于神经网络的自然语言语义表征方法研究》一文中研究指出人工智能主要包含运算智能、感知智能、认知智能叁个层次。自然语言理解是认知智能研究的重要领域,也被视为人工智能完备问题之一而受到广泛关注。自然语言通常以词语为基本单位,通过组合词语构成句子和篇章。计算机理解词语、句子、篇章离不开对自然语言的语义表征。现阶段,基于分布式语义假设的词向量技术在词语的语义表征上已经取得了成功。然而,对于句子、篇章的语义表征仍然面临着诸多挑战,如何在神经网络框架下将变长的句子、篇章表征成固定长度的低维稠密向量仍是当前语义表征研究的核心问题。自然语言推理和自动文本摘要是依赖句子、篇章级语义表征的典型自然语言理解任务。现阶段基于神经网络的自然语言推理方法在表征句子语义时,往往存在忽略语言固有的句法结构信息、缺乏对外部语义知识的运用等问题;而现阶段基于神经网络的概括式自动文本摘要方法主要针对短篇章的自动摘要,在表征篇章语义时没有考虑到处理长篇章可能出现的冗余性问题。本文围绕基于神经网络的自然语言语义表征,在句子语义表征方法、自然语言推理方法、自动文本摘要方法等方面开展研究工作,具体包括:首先,研究了基于通用池化的句子语义表征方法,提出了向量化的多头自注意力机制以获得固定长度的句子语义向量表征。该方法将已有的最大池化、均值池化、标量多头自注意力池化等作为特例,提升了句子语义表征能力。另外,通过引入惩罚项降低了不同头之间语义表征的冗余性,取得了在自然语言推理、作者侧写、情感分析叁个任务上的性能提升。其次,研究了结合句法结构与序列建模的句子语义表征与自然语言推理方法。针对现有基于神经网络的自然语言推理方法对于语言的序列特性与句法结构信息利用不足的问题,提出了增强型序列推理模型,并且进一步将句法结构信息融入到局部推理建模、推理组合两个模型组件中,提升了自然语言推理任务的性能。再次,研究了融合外部语义知识的句子语义表征与自然语言推理方法。针对现有的神经网络自然语言推理方法过于依赖端到端训练、其语义表征模型缺乏对于外部语义知识的利用等问题,提出了一种融合外部语义知识的句子语义建模与推理方法。该方法在上述的增强型序列推理模型中的协同注意力计算、局部推理信息收集、推理组合叁个组件上融合了外部语义知识,提高了原有模型在少训练样本情况下的泛化能力,取得了两个标准数据集上的自然语言推理性能提升。最后,研究了考虑语义分散力机制的篇章语义表征与自动文本摘要方法。现有基于神经网络的自动文本摘要方法通常采用语句级的序列到序列模型,对于篇章全局的关注不足,这造成在处理长篇章时的摘要信息冗余问题。本文提出了基于循环神经网络的概括式文本摘要方法,该方法不仅利用了注意力机制来关注篇章的特定区域、内容,同时设计了分散力机制去遍历篇章的不同内容,从而更好地为摘要获取篇章的全局信息。该方法在没有利用任何人工特征的条件下,取得了中英文两个数据集上的性能提升。(本文来源于《中国科学技术大学》期刊2018-05-20)

孙梦楠[10](2018)在《智能音箱中自然语言语义理解算法的研究》一文中研究指出随着智能时代的到来,人工智能相关技术极速发展,语音交互已经成为人机交互最重要的方式之一。不论是互联网巨头还是传统的硬件厂商全部将目光瞄准了智能音箱,纷纷推出自己的智能音箱产品,试图将智能音箱作为语音入口,提供给用户众多内容服务,抢占智能家居的枢纽。在智能语音产品中,语义理解准确率是评价一个语音平台技术能力和一个语音产品好坏最重要的标准。因此,在智能音箱中最核心的环节是语义理解,而其中最重要的功能就是音乐。本文基于智能音箱的使用场景,对音乐领域的语义理解算法和优化方法进行了研究,主要开展的工作如下:首先,提出知识库与搜索结合的算法,实现音箱中音乐领域的语义理解。基于使用场景与要求,智能音箱中对音乐语义理解算法的要求可概述为:信息抽取和意图识别。为了解决信息抽取,提出基于知识库与搜索的思想解决音乐领域的信息抽取。这主要是源于音乐具有知识的概念,但内部并不具从属抽象关系,因此受领域内基于知识库的自然语言理解算法和基于语义的搜索算法启发,提出了知识库与搜索相结合。因智能音箱中query(指令)包含噪音信息,设计了 query预处理模块;为了解决音乐领域实体命名歧义问题,设计了排序步骤;为了解决意图判断,为语义理解算法设计了打分模块。基于以上的思想与方案,设计了由query预处理、搜索及排序、字段抽取和打分四个模块组成的音乐领域语义理解算法。其次,为了解决基于规则的排序和打分情况覆盖不全,随规则更加逻辑繁杂问题,提出运用机器学习算法代替规则,对语义理解算法进行优化。第一,提出用基于LambdaMART的音乐排序算法,优化排序子模块进而提升信息抽取的准确率即语义理解算法中属性准确率和属性值准确率。本文以AdaRank为对比,从不同角度对比两个排序学习算法,最终根据算法的结果和使用目的,证明选择LambdaMART的正确性。基于LambdaMART的音乐排序算法使语义理解算法的属性准确率提升至99.106%,属性值准确率提升至98.143%。第二,提出利用基于GBDT的音乐打分算法,优化打分子模块进而提高语义理解算法的意图识别准确率及意图召回率。通过对比选择不同特征及对特征值采用不同处理方式时GBDT模型的评价指标,选出最优GBDT模型。基于GBDT的打分算法使语义理解算法的意图准确率提升至99.19%,意图召回率提升至94.83%。(本文来源于《湖南大学》期刊2018-05-11)

自然语义论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

自然语言语义语料库构建是智能云计算环境中实现信息交换的关键步骤,对语义语料库构造技术进行了分析,提出了一种基于词频-逆文本频率(term frequency-inverse document frequency,TF-IDF)和字向量距离的新型网页去重复算法,该方法专注于解决语音识别中的存储问题,为分词和句法分析提供功能支持。该方法可以直接用于语义语料库构建,能提高网页重复数据删除的效率。实验结果表明:该方法能实现云计算平台的语义库构建,且性能优于其他方法,说明了该方法的可行性和有效性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

自然语义论文参考文献

[1].张琨.情境感知的自然语言语义表示方法研究[D].中国科学技术大学.2019

[2].杨菊英,江兵,罗佳.自然语言语义库构建方法研究[J].重庆理工大学学报(自然科学).2019

[3].冯雪.基于外部语义知识补全的自然语言查询[J].计算机科学.2019

[4].邵岚,姚艳松,李宣.基于互联网大数据的自然语义分析研究[J].网络安全技术与应用.2019

[5].张秀红,刘纪平,王勇,罗安.面向自然语言空间方向关系查询的语义扩展框架[J].地理与地理信息科学.2018

[6].王禄生.论刑事诉讼的象征性立法及其后果——基于303万判决书大数据的自然语义挖掘[J].清华法学.2018

[7].上官明霞,朱珊珊,陈晓亮,王晶华,郭光.基于融合自然语言处理的语义分析方法研究[J].计算机与网络.2018

[8].肖娇.基于功能磁共振成像的自然视频编码与语义网络分析[D].江西财经大学.2018

[9].陈谦.基于神经网络的自然语言语义表征方法研究[D].中国科学技术大学.2018

[10].孙梦楠.智能音箱中自然语言语义理解算法的研究[D].湖南大学.2018

标签:;  ;  ;  ;  

自然语义论文-张琨
下载Doc文档

猜你喜欢