句子分类论文-苏锦钿,欧阳志凡,余珊珊

句子分类论文-苏锦钿,欧阳志凡,余珊珊

导读:本文包含了句子分类论文开题报告文献综述及选题提纲参考文献,主要关键词:深度学习,属性情感分类,注意力,依存树

句子分类论文文献综述

苏锦钿,欧阳志凡,余珊珊[1](2019)在《基于依存树及距离注意力的句子属性情感分类》一文中研究指出目前基于注意力机制的句子属性情感分类方法由于忽略句子中属性的上下文信息以及单词与属性间的距离特征,从而导致注意力机制难以学习到合适的注意力权重.针对该问题,提出一种基于依存树及距离注意力的句子属性情感分类模型(dependency tree and distance attention, DTDA).首先根据句子的依存树得到包含属性的依存子树,并利用双向GRU学习句子及属性的上下文特征表示;根据句子中单词和属性在依存树中的最短路径确定相应的语法距离及位置权重,同时结合相对距离构造包含语义信息和距离信息的句子特征表示,并进一步利用注意力机制生成属性相关的句子情感特征表示;最后,将句子的上下文信息与属性相关的情感特征表示合并后并通过softmax进行分类输出.实验结果表明:DTDA在国际语义评测SemEval2014的2个基准数据集Laptop和Restaurant上取得与目前最好方法相当的结果.当使用相关领域训练的词向量时,DTDA在Laptop上的精确率为77.01%,在Restaurant上的准确率为81.68%.(本文来源于《计算机研究与发展》期刊2019年08期)

洪源,沈勇[2](2019)在《基于双向长短时记忆神经网络的句子分类》一文中研究指出针对文本分类中的特征选择问题,在传统RNN的基础上设计一种基于注意力机制的双向长短时记忆神经网络模型。其中双向的LSTM网络解决了传统RNN的梯度消失问题,并且能够更加充分地利用句子的上下文信息[1]。加入注意力机制的模型可以获得含有输入序列节点注意力概率分布的语义编码,从而在特征向量提取过程当中消减了信息的损失和冗余。通过与传统LSTM的对比实验,证明该模型的准确率和稳定性较传统方法有进一步提高。(本文来源于《计算机与数字工程》期刊2019年07期)

苏锦钿,余珊珊,李鹏飞[3](2019)在《一种结合词性及注意力的句子情感分类方法》一文中研究指出针对目前各种基于长短期记忆网络LSTM的句子情感分类方法没有考虑词的词性信息这一问题,将词性与自注意力机制相结合,提出一种面向句子情感分类的神经网络模型PALSTM(Pos and Attention-based LSTM).首先,结合预训练词向量和词性标注工具分别给出句子中词的语义词向量和词性词向量表示,并作为LSTM的输入用于学习词在内容和词性方面的长期依赖关系,有效地弥补了一般LSTM单纯依赖预训练词向量中词的共现信息的不足;接着,利用自注意力机制学习句子中词的位置信息和权重向量,并构造句子的最终语义表示;最后由多层感知器进行分类和输出.实验结果表明,PALSTM在公开语料库Movie Reviews、Internet Movie Database和Stanford Sentiment Treebank二元分类及五元情感上的准确率均比一般的LSTM和注意力LSTM模型有一定的提升.(本文来源于《华南理工大学学报(自然科学版)》期刊2019年06期)

张林[4](2019)在《基于短文本(句子级)的情感分类研究》一文中研究指出文本情感分类,也称为意见挖掘或情感定向分析。自21世纪初以来,情感分类已发展为自然语言处理领域的研究热点。在该领域,根据处理文本的不同粒度,大致分为叁个级别:篇章级,句子级,方面级。本文着重研究短文本,即句子层面的情感分类研究与分析。当今社会,随着互联网技术的不断发展,各电商平台和社交网络也得到了飞速发展,人们越来越多的喜欢在互联网上发表自己的观点,或针对某一社会热点,或针对网购产品的使用体验等。其中,微博便以其简单,便捷,信息分享的高实时性等特点,迅速成为了国内网络舆情的发源地和集中地。网络舆情与公众的生活息息相关,同时也关系着社会的稳定与发展。通过对网络舆情进行分析和研究,可以防范重大事件的发生,帮助政府准确快速地做出决策。因此,本文对微博进行情感倾向性分析,以便更好地监控网络舆情,为政府决策提供支持。本文选取了长度不超过140个字节的微博数据集,对传统的小批量梯度下降算法进行改进,提出了一种基于热重启与余弦退火的训练批量周期变化策略SGDR,该方法不是单调的或者随机的改变batch_size,而是使batch_size在合理的边界值之间循环变化。使用循环batch_size而不是固定值进行训练,可以用于加速模型收敛,提高模型精度。然后基于已有的激活函数,提出了一种新的激活函数——SReLU函数,缓解梯度弥散,解决输出偏移问题。最后基于TextCNN,采用SGDR算法以及SReLU函数对微博短文本进行了研究,并对比多种神经网络模型和激活函数进行实验验证,得到了最终的实验结果。首先,本文使用Google提供的word2vec来构建和提取本文中使用的词向量模型。首先,本文采用基本神经网络模型,设置卷积核心信道数,卷积核宽度,学习速率等文本卷积神经网络参数。得到关于本数据集的最佳模型,在此模型的基础上验证本文提出的基于热重启与余弦退火的训练批量周期变化策略SGDR进行验证,然后对比其他激活函数验证本文提出的激活函数的有效性,最后结合本文所提出的方法和激活函数进行综合实验,并与其他神经网络模型进行对比实验,得到了宏查准率91.66%、宏查全率96.24%、准确率97.41%以及宏F1值93.21%的实验结果。(本文来源于《吉林大学》期刊2019-05-01)

郭宝震[5](2019)在《基于深度特征提取的句子分类模型研究》一文中研究指出随着互联网的蓬勃发展,海量的文本信息正在不断涌现,这些信息在新闻资讯、电子商务、舆情监测等场景具有重要的价值。分类是对文本信息有效利用并解决上述实际场景需求的重要技术手段,而这些文本信息作为分类对象往往以单个语句或若干个词语拼接成的短句的形式出现,因此构建一个具有良好性能的句子分类模型是尤为关键的。句子分类的研究具有重要的应用价值。由于句子普遍具有长度短、新词多、重复成分少等特点,基于统计学习思想的句子分类方法往往需要耗费大量精力针对具体分类任务中句子的特点进行特征提取和选择,同时对于新的分类场景,需要重新构建特征,普适性较差。这些缺点在一定程度上限制了此类方法在句子分类问题中的应用。深度学习在自然语言处理领域的应用推动了句子分类问题的研究,近年来的研究表明,卷积神经网络能够通过词向量有效地应用在句子分类问题中。用于句子分类的卷积神经网络虽然能够提取句子中的局部特征,但忽视了在具体分类任务下,句子中不同的词语对分类结果的重要性有所不同,同时不同部分的词语间往往存在关联信息,此外,每个词对应的词向量表示受限于单一词向量训练方法,以上方面均影响最终提取的用于分类的句子特征。本文针对上述存在的问题进行了深入研究,主要内容如下:1)提出基于强化语义特征提取的卷积循环神经网络句子分类模型。该模型首先通过选取训练集每个类别中重要的词序列构造带有语义特征的卷积核,强化句子中对分类结果重要的词序列的语义特征提取,然后通过对词向量矩阵的卷积和局部池化提取句子的局部特征并保留句子的序列性,之后将局部特征作为循环神经网络的输入获取句子中的长距离依赖信息得到句子全局特征表示,最后通过全连接层和Softmax函数得到分类结果。模型强化了语义特征的提取能力,同时结合了卷积神经网络和循环神经网络的优势。2)提出基于强化语义特征提取的双路神经网络句子分类模型。针对句子中每个词对应的词向量表示受限于单一词向量训练方法的问题,在强化语义特征提取的基础上,以不同训练方法得到的词向量同时作为输入,构建双路卷积循环神经网络句子分类模型,并提出双路卷积神经网络句子分类模型作为对比,有效利用了不同种类的词向量得到更加丰富的句子特征。本文在多个公开数据集上对所提出的模型进行实验,并与多个已有的用于句子分类的模型进行对比。实验结果表明,本文所提出的模型在句子级情感分类和问题分类等不同的分类任务中具有良好的效果。(本文来源于《吉林大学》期刊2019-04-01)

韩栋,王春华,肖敏[6](2019)在《基于句子级学习改进CNN的短文本分类方法》一文中研究指出为提高对网络短文本分类的性能,提出一种融合卷积神经网络(CNN)和句子级监督学习的分类方法。构建一种用于短文本分类的经典CNN模型;将主题句融入到CNN中,即对输入文本进行句子级CNN监督学习,构建句子模型并识别主题句;将主题句子模型赋予较高权重,通过加权和构建文本模型。通过文本级CNN监督学习,实现文本分类。在两个评论数据集上的实验结果表明,提出方法具有较高的分类准确性。(本文来源于《计算机工程与设计》期刊2019年01期)

郭宝震,左万利,王英[7](2018)在《采用词向量注意力机制的双路卷积神经网络句子分类模型》一文中研究指出针对句子中不同的词对分类结果影响不同以及每个词对应的词向量受限于单一词向量训练模型的特点,提出一种基于词向量注意力机制的双路卷积神经网络句子分类模型(AT-DouCNN).该模型将注意力机制和卷积神经网络相结合,以不同训练算法得到的词向量同时作为输入,分别进行卷积和池化,并在全连接层进行融合,不仅能够使得具体分类任务下句子中的关键信息更易被提取,还能够有效地利用不同种类的词向量得到更加丰富的句子特征,进而提高分类的准确率.实验结果表明:所提出的模型在3个公开数据集上的分类准确率分别达到50.6%、88.6%和95.4%,具有良好的句子分类效果.(本文来源于《浙江大学学报(工学版)》期刊2018年09期)

邱世才[8](2018)在《句子结构分类要点“播报”》一文中研究指出考点透视句子按用途可以分为四类,即陈述句(肯定句和否定句)、疑问句、祈使句和感叹句,对它们的考查常常出现在选择填空和句型转换题型中。一、陈述句1.there be结构(1)there be结构的谓语动词。be在人称和数上应与其后的主语(名词)保持一致。主语是不可数名词或单数可数名词时用is,复数名词用are。两个或两个以上的名词作主语,be动词和邻(本文来源于《疯狂英语(爱英语)》期刊2018年06期)

周凯敏[9](2018)在《句子不确定性的判断和分类的研究》一文中研究指出在语言学中不确定性一般意义上可以被解释为信息的缺乏。通常人们在信息不充分时会采用不确定性的表达,比如在学术论文中发表推论,在网络上发布流言蜚语等。随着大数据时代的到来,由于文本数据的处理需求,不确定性的判断和分类问题的研究备受关注。早期的不确定性研究源于准确地信息抽取,研究人员基于学术论文和维基百科等建设不确定性语料库,并主要采用基于线索词特征的分类方法进行研究。这些研究的不足在于太过依赖线索词特征而普适性不好,也少有深入不确定性具体分类的研究。为了弥补前人研究的不足,我扩充了语料库并设计了不基于线索词的判别算法。基于社交媒体广泛应用的大背景下,我构建了一个中文社交媒体不确定性语料库,我们对这一语料库进行了详细地标注。语料库中不仅标注了句子的不确定性,进一步地不确定性的具体类别也进行了区分。我还设计了一个深度学习模型进行不确定性判断和分类,模型中主要应用循环神经网络理解句子语义,注意力机制被用来抽取重要的不确定性特征,卷积神经网络用来分类。通过与现有方法对比的大量实验,我证明了我设计模型的有效性,其在大部分情况下都能获得最优的结果。总之,本文旨在推动句子不确定性的研究,一方面构建了一个中文网络社交媒体不确定性语料库,另一方面提出了一种新的深度学习模型,这一模型在不确定性判断和分类任务中性能优异。本文的研究成果能对自然语言处理领域有一定的帮助,促进相关问题的研究与发展。(本文来源于《国际关系学院》期刊2018-05-20)

王茂全[10](2018)在《深度特征学习在句子文本分类中的研究及应用》一文中研究指出文本分类是自然语言处理(Natural Language Processing,NLP)中的一项基础研究任务,而文本特征表示是分类任务的基石,其表征质量直接影响分类器性能。因此,研究高质量的文本特征表示尤为重要。近年,如火如荼的深度学习技术展现出强大的特征自动提取能力,并在多数自然语言处理任务中取得令人满意的效果。将深度特征学习应用到文本分类任务的过程中,存在以下叁个影响模型最终分类性能的挑战:1)如何得到较好的词向量来表征单词;2)如何更好的提取并结合单词之间的信息;3)如何使最终句子向量能准确、全面地包含文本语义。针对以上叁个机遇,本文依次展开以下叁方面的工作:首先,本文提出一种新的门机制用于在单词表征的过程中字符(Character)和词(Word)的结合,以得到信息更加丰富的词向量。在词向量化的过程中,大量未登录词(Out of Vocabulary,OOV)被模型直接抛弃或随机初始化的做法严重影响模型最终分类性能。为解决这一问题,并且考虑到从字的角度构建单词更容易捕获词的形态学特征,本文同时从字级别和词级别的角度去建模单词,提出一个新的基于双边门机制的文本表征与分类模型。该工作在2018年国际标准语义测评SemEval的多语言绘文字(Emoji)预测任务中,取得远超过基准模型的成绩。相关系统描述论文发表于2018年的SemEval研讨会(Workshop)。然后,本文提出一种基于多注意力矩阵的句子表征方法进行文本分类。在文本分类任务中,注意力机制因其出色表现已得到广泛应用,但现存的注意力机制仍存在局限:利用单一向量同时提取文本在多类别下的特征,导致模型混乱度高。本文提出基于类别的多注意力机制矩阵从各个类别角度分别提取文本特征,提升注意力机制的纯度来优化分类模型。相关系统在2017年NLPCC的新闻标题分类任务中获得第四名,其论文发表于2018年IJCNN(CCF-C类)会议。最后,本文提出一种基于句子中心的文本表征优化方法。现存的深度学习分类模型在得到文本表征后直接将文本向量通过Softmax函数进行分类,没有考虑在得到文本向量后的优化问题。但在文本表征空间,相同类别下的样本应具有相似的实数向量,换而言之,类似的样本向量应当聚在一起。于是本文提出一个由全局类别中心向量约束的神经网络框架来优化文本表征,并进行文本分类。本文提出的类别中心向量用于辅助神经网络模型从类别全局的视角来抽取文本的类别特征,这部分工作发表在2018年的PAKDD(CCF-C类)会议上。本文在SST2、Yelp13、Yelp14、NLPCC2017、Twitter Emoje等多个真实公开的文本分类数据集和不同的文本分类任务上完成了大量实验。充足的实验结果表明,本文所提的叁个模型都很好地应对了前文所述的叁个挑战,并都获得模型分类性能的提升。(本文来源于《华东师范大学》期刊2018-05-01)

句子分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对文本分类中的特征选择问题,在传统RNN的基础上设计一种基于注意力机制的双向长短时记忆神经网络模型。其中双向的LSTM网络解决了传统RNN的梯度消失问题,并且能够更加充分地利用句子的上下文信息[1]。加入注意力机制的模型可以获得含有输入序列节点注意力概率分布的语义编码,从而在特征向量提取过程当中消减了信息的损失和冗余。通过与传统LSTM的对比实验,证明该模型的准确率和稳定性较传统方法有进一步提高。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

句子分类论文参考文献

[1].苏锦钿,欧阳志凡,余珊珊.基于依存树及距离注意力的句子属性情感分类[J].计算机研究与发展.2019

[2].洪源,沈勇.基于双向长短时记忆神经网络的句子分类[J].计算机与数字工程.2019

[3].苏锦钿,余珊珊,李鹏飞.一种结合词性及注意力的句子情感分类方法[J].华南理工大学学报(自然科学版).2019

[4].张林.基于短文本(句子级)的情感分类研究[D].吉林大学.2019

[5].郭宝震.基于深度特征提取的句子分类模型研究[D].吉林大学.2019

[6].韩栋,王春华,肖敏.基于句子级学习改进CNN的短文本分类方法[J].计算机工程与设计.2019

[7].郭宝震,左万利,王英.采用词向量注意力机制的双路卷积神经网络句子分类模型[J].浙江大学学报(工学版).2018

[8].邱世才.句子结构分类要点“播报”[J].疯狂英语(爱英语).2018

[9].周凯敏.句子不确定性的判断和分类的研究[D].国际关系学院.2018

[10].王茂全.深度特征学习在句子文本分类中的研究及应用[D].华东师范大学.2018

标签:;  ;  ;  ;  

句子分类论文-苏锦钿,欧阳志凡,余珊珊
下载Doc文档

猜你喜欢