问句分类论文-杨志明,王来奇,王泳

问句分类论文-杨志明,王来奇,王泳

导读:本文包含了问句分类论文开题报告文献综述及选题提纲参考文献,主要关键词:卷积神经网络,自然语言问句理解,意图分类,词向量

问句分类论文文献综述

杨志明,王来奇,王泳[1](2019)在《基于双通道卷积神经网络的问句意图分类研究》一文中研究指出人机对话技术近年来受到学术界和工业界的广泛关注。人机对话系统的一个关键任务就是如何让聊天机器人理解用户的问句意图并将用户的输入正确地分类到相应领域中,其性能直接影响到特定领域的人机对话质量。该文针对对话问句具有句子长度短、局部特征明显等特点,单通道卷积神经网络(Convolutional Neural Network,CNN)视角单一,不能充分学习到问句的特征信息和语义信息。该文在研究和分析了CNN算法的基础上,提出了意图分类双通道卷积神经网(Intent Classification Dual-channel Convolutional Neural Networks,ICDCNN)算法。该方法首先采用Word2Vec工具和Embedding层进行训练词向量提取问句中的语义信息特征;然后采用两个不同的通道进行卷积运算,一个通道传入字级别的词向量,另一个通道传入词级别的词向量,使用细粒度的字级别词向量协助词级别的词向量捕获自然语言问句中更深层次的语义信息;最后通过设置不同尺寸的卷积核,学习问句内部更深层次的抽象特征。通过对比实验结果表明,该算法在选用的中文实验数据集上取得了较高的准确率,较其他算法具有一定的优势。(本文来源于《中文信息学报》期刊2019年05期)

孙泽健,司光亚,刘洋[2](2019)在《面向兵棋演习的问答系统问句分类模型研究》一文中研究指出通过分析兵棋演习过程中的常见问题,设计了一个针对兵棋演习特殊情景的问句分类模型。问句分类模型基于统计方法,利用Word2vec工具生成词向量,利用TextRank算法结合IDF值来生成词权重,共同完成问句表征。并综合考虑算法复杂度以及问句相似度计算的精确度,通过两个不同的问句相似度模型,以及改进的KNN算法来实现最终的问句分类。WMD(Word Mover's Distance)算法是在词向量基础上计算问句相似度较为精确的算法,但同时存在算法复杂度过高的缺点,论文通过改进的KNN算法将其与传统算法结合,来更好地完成需要的问句分类任务。(本文来源于《计算机与数字工程》期刊2019年02期)

王东波,高瑞卿,沈思,李斌[3](2018)在《基于深度学习的先秦典籍问句自动分类研究》一文中研究指出近年来,自动问答系统已成为机器学习、信息检索和自然语言处理领域的研究热点。问句分类作为问答系统要处理的第一步,其分类结果的好坏直接影响问答系统的质量,但目前大部分问句分类研究集中在现代汉语领域,针对古文相关内容的问句分类研究相对较少。本文从问句分类的概念出发,构建了古文文献问句分类体系,然后利用TF-IDF提取类别特征词,先后利用支持向量机、条件随机场、深度学习模型完成针对先秦10部典籍的问句自动分类实验。结果表明,3种分类模型中,使用Bi-LSTM模型分类效果最好,在本文提出的7种类别上,达到调和平均值94.78%,具有较强的推广和应用价值。(本文来源于《情报学报》期刊2018年11期)

史梦飞,杨燕,贺梁,陈成才[4](2018)在《基于Bi-LSTM和CNN并包含注意力机制的社区问答问句分类方法》一文中研究指出问句分类的目标是将用户提出的自然语言问句分到预先设定的类别.在社区问答中,如何准确高效的对问句进行分类是一项重要任务.本文提出了一种基于深度神经网络的问句分类方法,该方法首先将问句用词向量进行表示,然后用融合双向长短时记忆网络(Bi-LSTM)和卷积神经网络(CNN)结构并包含注意力机制的深度学习模型提取问句特征进行分类.该方法的特色在于利用Bi-LSTM和CNN在句子级文本表示的优点,充分捕捉问句特征,并结合问句的对应答案来表示问句,丰富了问句信息.实验表明,该问句分类方法准确率较高,在多个数据集上取得不错结果.(本文来源于《计算机系统应用》期刊2018年09期)

杨志明,王来奇,王泳[5](2019)在《深度学习算法在问句意图分类中的应用研究》一文中研究指出在聊天机器人多轮对话中如何根据上下文理解用户的意图是多轮交互中的一个重点问题,也是一个难点问题。现有的问句理解方法大多是针对单句的,且侧重于某种句式结构的理解。如何根据上下文语境对当前用户的意图进行识别,而不仅仅是针对单轮进行一个个分析,使得对话在一个连续的语境下具备细粒度的理解能力,是一个亟待解决的问题。针对以上问题,提出了一种基于深度学习的自然语言问句多意图分类方法,其中涉及到的用户意图包含闲聊类、音乐类、新闻类、算术类、餐饮类、订票类、天气类、服务类等13类。首先使用自然语言处理的相关技术对多轮对话进行处理分析,识别出其中的关键词,然后使用深度学习方法和分层分类技术构建了二分类和多分类深度学习模型,学习上下文语境和语义关系,共同对用户意图进行识别。通过实验证明了构建的深度学习模型对用户意图识别的准确率分别为94.81%、93.49%。因此,所提方法基本能够解决自然语言问句意图识别的问题。(本文来源于《计算机工程与应用》期刊2019年10期)

李洋[6](2018)在《《桃花扇》特指式反问句分类研究》一文中研究指出文章根据疑问词语分类讨论《桃花扇》中的特指式反问句,指出特指式反问句使用疑问句的形式传达出与语表形式相反的意义。与《元刊杂剧》特指式反问句进行比较研究,突出展示《桃花扇》特指式反问句的特点。(本文来源于《文化创新比较研究》期刊2018年22期)

张倩[7](2018)在《问句分类方法及其在问答系统中的应用研究》一文中研究指出传统的信息检索系统均使用关键词组合作为系统输入,忽略了问句语义的多样性和语言结构的分析。问答系统能够接受用户以自然语言形式描述的问题,并能从大量异构的数据中查找或推断出用户问题的答案,提高用户查询效率。因此问答系统成为信息检索技术向人性化、智能化方向发展的一种必然趋向。问句分析的目的是明确用户意图,有效地定位到正确答案。因此,问句分析是问答系统的核心技术之一,而问句分类是问句分析的重要组成部分。在深入学习了目前中文问句分类及问答系统相关研究方法的基础上,本文提出了基于最大熵模型和双向长短期记忆人工神经网络(Bi-LSTM)模型的问句分类方法,具体研究工作如下:(1)研究了基于最大熵模型的问句分类方法。该方法把句法分析和词向量等语义知识运用到问句表示中,研究了问句的词汇特征、句法特征和词向量特征对问句粗分类准确性的影响,实验结果表明,相对于其他特征,词向量特征对问句粗分类取得了较好的效果,准确率达到88.75%。(2)研究了基于Bi-LSTM的问句分类方法。基于最大熵模型的问句分类方法需要人工提取问句的特征,带有一定的主观性。而基于Bi-LSTM的问句分类方法能够自主地学习问句的句法和语义特征,避免了人为因素带来的干扰。在分类模型中,本文使用了词语、词性和位置特征,并将这叁种特征向量融合得到的词嵌入作为模型的输入,然后将输出结果通过最大池化层(Max Pooling)和Softmax层来完成问句特征提取和问句粗分类的工作。实验结果表明,该方法在粗粒度分类上准确率达到92.38%。(3)研究了问句分类在知识库问答系统中的应用。本文借助问句分类特征,再结合相似度、编辑距离和共现特征,利用Ranking SVM算法对候选答案进行排序。在NLPCC2016开放域知识库问答系统的评测任务的数据集上进行实验,结果表明,将问句分类应用到知识库问答系统的答案排序中,有助于提高答案识别的准确率,其准确率达到74.49%,召回率达到83.20%,平均F1值达到76.13%。(本文来源于《郑州大学》期刊2018-05-01)

钟世敏[8](2018)在《基于信息抽取的英文问句意图分类》一文中研究指出近年来随着AI技术的发展,问答系统技术也逐渐走向了成熟。问答系统可通过信息抽取技术来准确的理解分析自然语言问题,并返回较为准确的问题答案。根据答案的来源不同,问答系统可分为生成式问答系统和检索式问答系统。其中根据信息提供方式的不同,检索式问答系统又可分为基于搜索引擎的web信息检索与基于知识库的信息检索。随着开放知识库以及知识图谱技术的发展,知识库的检索式问答系统被广泛关注。基于知识库的问答系统主要解决由叁元组(实体,关系,实体)构成的事实类问题。在信息抽取阶段,通过抽取问句中的叁元组成分来理解问句。实体,关系作为我们叁元组的重要组成单元,准确的抽取问句中的相关实体和关系不仅有利于更好的理解分析问句同时能够提供更加准确的问句意图领域类别。本文主要研究方向为通过抽取问句中的实体和关系信息,分析实体和关系与问句中其它关键词的潜在含义,实现问句的意图分类。本文的主要研究内容包括以下部分:实体和关系抽取的模型。本文提出了一个新的实体和关系抽取模型,该模型将整个实体和关系的抽取任务化分为两个子任务:实体和关系关键词抽取、关系映射。在实体和关系关键词抽取任务中,设计了一个新的序列标注模式和一个端到端的实体和关系关键词抽取的序列标注模型(BI-LSTM-LSTM)。在关系映射任务中,借助知识库wikidata中的信息,提取关系特征得到特征向量,并构建了特征匹配函数得到关系与关系关键词映射。问句意图分类。利用问句中的实体和关系信息构建了问句意图分类模型。根据问句中实体和关系的抽取结果将问句分成两部分:已提取出完整叁元组关系的问句,未提取出完整叁元组关系的问句。对于前者本文给出了基于答案实体类别路径树的问句意图分类方法。对于后者本文建立了基于KNN算法的问句意图分类算法,通过提取句子级别的特征构建句子级别的特征向量来衡量问句间的距离。为了验证上述两个模型的有效性,在Webquestion,Graph Question等相关数据集上进行了实验与分析。实验结果表明本文提出实体和关系抽取模型,同等条件下,分别在实体抽取、关系抽取、以及实体和关系综合抽取任务中都获得了高于其它模型的F1值。在问句意图分类任务方面,实验分析得出本文模型能够较好的完成英文问句意图分类任务。(本文来源于《西华大学》期刊2018-04-01)

赵明,董翠翠,董乔雪,陈瑛[9](2018)在《基于BIGRU的番茄病虫害问答系统问句分类研究》一文中研究指出问句分类作为问答系统的关键模块,对系统检索效率具有决定性作用。为了对番茄病虫害智能问答系统用户问句进行高效分类,构建了基于word2vec和双向门控循环单元神经网络(Bi-directional gated recurrent unit,BIGRU)的番茄病虫害问句分类模型。针对问答系统对用户问句的语义信息有较高要求的特点,首先利用word2vec将句子中的词转换为具有语法、语义信息的词向量,利用训练得到的词向量和BIGRU神经网络进行问句分类模型的训练。实验选取了2 000个番茄病虫害相关的用户问句,主要分为番茄病害和番茄虫害两类。结果表明,采用BIGRU的番茄病虫害问句分类模型,其分类准确率、召回率和准确率与召回率的调和平均值F1分别高于卷积神经网络(CNN)、K最近邻等分类算法2~5个百分点。BIGRU模型结构简单,模型训练参数较少,模型训练速度快,符合问答系统对响应时间的要求。(本文来源于《农业机械学报》期刊2018年05期)

籍祥[10](2018)在《卷积神经网络在问句分类中的研究与应用》一文中研究指出问答系统是新一代的搜索引擎,它可以精确的检索答案给用户,更好的满足用户的查询请求。问句分类是问答系统中一个非常重要的环节,其性能直接影响到后期答案抽取的准确性,关乎整个问答系统的性能。由于一般问句较短,且训练样本数量较少的特点,直接采用文本分类的方法,对问句进行特征表示,再用机器学习方法训练模型,这种方法当问句类别特别多的时候训练出的模型准确率非常低。因为数据决定训练出模型所能达到准确率的上界,优化模型只能去逼近于这个上界,因此本文分别从数据和模型两方面入手,来提高训练模型的准确率。研究如何在有限的数据样本情况下,增加样本信息量。如何设计一个卷积神经网络模型在保证分类准确率的情况下,又能保持一定的模型泛化能力。本文结合实际项目中深圳广开银行问句数据集,主要取得以下成果:1.本文首先从数据入手,对问句的关键词位置进行同义词拓展,同义词为用户可能会问到的常用词汇。多个位置进行同义词拓展,最后进行笛卡尔乘积,这样能很大程度上的增加训练样本的问句数量。对拓展后的数据样本,再用传统的机器学习训练模型,实验表明采用拓展之后的数据集训练出的模型准确率较拓展之前有极大的提升。2.在对问句进行特征表示时,采用基于Skip-Gram的词的分布式表示模型来训练每个词的word embedding。再将问句的每个词的word embedding组合为二维矩阵的形式,用来表示该问句的分布式特征。之后设计了一种卷积神经网络模型对问句分类,为了降低模型的复杂度,本文只采用了一个卷积层和一个池化层。实验表明本文设计的卷积神经网络模型,相比于传统的机器学习方法,包括支持向量机,随机森林,逻辑回归等模型准确率均有提升。3.在上一章节基于卷积神经网络模型的训练之中引入句子结构信息。采用分段池化操作,在不同的分段上提取句子的主要特征。并加入dropout算法来提高模型的泛化能力,防止模型过拟合。实验结果表明,本文采用的分段池化方法,同时加入dropout算法后,能提高模型的准确率,最终在深圳广开银行57分类数据集上准确率高达85.1%。(本文来源于《昆明理工大学》期刊2018-03-01)

问句分类论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

通过分析兵棋演习过程中的常见问题,设计了一个针对兵棋演习特殊情景的问句分类模型。问句分类模型基于统计方法,利用Word2vec工具生成词向量,利用TextRank算法结合IDF值来生成词权重,共同完成问句表征。并综合考虑算法复杂度以及问句相似度计算的精确度,通过两个不同的问句相似度模型,以及改进的KNN算法来实现最终的问句分类。WMD(Word Mover's Distance)算法是在词向量基础上计算问句相似度较为精确的算法,但同时存在算法复杂度过高的缺点,论文通过改进的KNN算法将其与传统算法结合,来更好地完成需要的问句分类任务。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

问句分类论文参考文献

[1].杨志明,王来奇,王泳.基于双通道卷积神经网络的问句意图分类研究[J].中文信息学报.2019

[2].孙泽健,司光亚,刘洋.面向兵棋演习的问答系统问句分类模型研究[J].计算机与数字工程.2019

[3].王东波,高瑞卿,沈思,李斌.基于深度学习的先秦典籍问句自动分类研究[J].情报学报.2018

[4].史梦飞,杨燕,贺梁,陈成才.基于Bi-LSTM和CNN并包含注意力机制的社区问答问句分类方法[J].计算机系统应用.2018

[5].杨志明,王来奇,王泳.深度学习算法在问句意图分类中的应用研究[J].计算机工程与应用.2019

[6].李洋.《桃花扇》特指式反问句分类研究[J].文化创新比较研究.2018

[7].张倩.问句分类方法及其在问答系统中的应用研究[D].郑州大学.2018

[8].钟世敏.基于信息抽取的英文问句意图分类[D].西华大学.2018

[9].赵明,董翠翠,董乔雪,陈瑛.基于BIGRU的番茄病虫害问答系统问句分类研究[J].农业机械学报.2018

[10].籍祥.卷积神经网络在问句分类中的研究与应用[D].昆明理工大学.2018

标签:;  ;  ;  ;  

问句分类论文-杨志明,王来奇,王泳
下载Doc文档

猜你喜欢