问句相似度计算论文-曹建文,万福成

问句相似度计算论文-曹建文,万福成

导读:本文包含了问句相似度计算论文开题报告文献综述及选题提纲参考文献,主要关键词:结构化,自动问答,相似度

问句相似度计算论文文献综述

曹建文,万福成[1](2019)在《面向自动问答系统的问句相似度计算研究》一文中研究指出结构化自动问答系统采用传统方法缺少对词汇、词序和结构的划分,导致语句相似度较低,为了解决该问题,提出了基于Web语义的混合问句相似度计算方法。根据结构化自动问答系统结构,设计系统语句分析模型,通过正向匹配方法,对模型专业词库中的用户输入自然语句进行分词处理,并对字符串之间的关系展开分析。采用非恒定相似度系数来描述2个字符串的相似情况,并由此分析词形、词序和结构相似度,完成不同语句相似度的计算。通过实验对比可知,文章提出的基于Web语义的混合问句相似度计算方法最高计算精准度可达到96%,可提升自动问答系统的整体性能。(本文来源于《重庆大学学报》期刊2019年09期)

刘拼拼[2](2018)在《领域问答系统中问句相似度计算方法研究》一文中研究指出自然语言处理技术作为人工智能领域一大研究方向,已经得到社会各界的高度重视。随着对自然语言处理技术研究的不断深入,自然语言处理技术的研究方向也逐渐细化,包括信息抽取、问答系统、机器翻译、文本生成和文本挖掘技术、语音识别和生成等。问答系统作为新型的信息检索方式,已经成为逐渐自然语言处理领域的研究重点。问答系统的研究一般分为问句理解、信息检索和答案抽取叁个部分,而这叁者都离不开句子相似度计算,虽然目前人们已经可以利用自然语言处理技术构建各种各样的问答系统,但是问答系统的使用效果却差强人意,而这些问题归根结底是句子相似度计算效果不理想的问题。因而本文主要利用自然语言处理技术对领域问答系统中问答相似度计算方法进行研究。本文主要的创新性工作如下:首先,针对基于词向量的问句相似度计算方法进行改进。改进包括两点内容,一是词向量优化,二是相似度计算方案的改进。其中词向量优化主要优化两个部分,一是近反义词问题的处理,二是未登录词问题的处理。相似度方案改进主要是基于WMD算法基础上,加入词和字的共现信息,从而提高计算的正确率。其次,提出基于深度学习的问句相似度计算。将深度学习应用到问句相似度计算中,主要利用深度学习分类模型选择候选问句集,然后在通过基于词向量的问句相似度方法进行精确匹配。这部分基于LSTM孪生网络分类模型,提出了两种深度学习分类模型包括提出了LSTM+CNN孪生网络模型和CNN+Attention机制的孪生网络模型来提高文本分类的正确率,实验表明两种分类模型对比原先的模型能够在正确率已经达到94%的情况下提高一个百分点达到95%左右。最后基于所提出的算法,开发了一个相似度测试模块,实现了问句相似度算法的测试功能,运行效果表明了改进算法的有效性。实验表明改进基于词向量的问句相似度计算方法正确率相比为改进前正确率提高了6个百分点。通过深度学习选择候选集之后再经过精确匹配,与原先直接应用基于词向量的问句相似度计算方法相比F1值由原来的0.67变成0.84左右,而精度由原来的0.79变成0.85。(本文来源于《哈尔滨工业大学》期刊2018-06-01)

周强[3](2016)在《基于深度学习与主题模型的问句相似度计算》一文中研究指出近年来,随着互联网的高速发展,互联网上的数据正在爆炸式地增加,传统的搜索引擎已经很难满足用户多方面的需求,自动问答系统应运而生,成为了一种新的更为有效的信息获取方式。问句相似度计算作为其中关键的技术,受到了广泛的关注。本文在“大数据”背景下,研究了如何高效计算问句相似度的问题,针对问句的特点,提出了使用向量表示句子,进而通过计算向量间距离来度量相似度的方法。论文的主要工作和创新点包括:(1)分析了现有方法的不足之处,研究了神经网络语言模型和主题模型,并分析了它们在语义表示方面各自的优点;(2)为了更好地表示句子的语义,提出了两个基于深度学习与主题模型的主题句子向量模型,并给出了模型的训练算法。其中,第二个模型对第一个模型进行了改进,去除了“词袋”假设。这两个模型结合了句子向量模型所提供的局部上下文词语共现信息和主题模型所提供的全局词语共现信息;(3)为验证所提模型的有效性,在IMDB电影评论数据上,进行了句子分类实验,对比了所提模型与已有先进模型。实验结果表明,融入了主题信息的句子向量模型,超越了传统的句子向量模型,能够更好地表示句子的语义;(4)设计实现了基于句子向量的问句相似度计算方法,在大量真实的Yahoo!Answers数据上,基于前面提出的两个主题句子向量模型,并通过部分标注的数据进行了验证对比实验。实验结果表明,该方法能够在大规模的问答数据上有效地计算问句相似度。(本文来源于《北京理工大学》期刊2016-01-01)

贾明静[4](2014)在《基于用户意图和句法角色的问句相似度计算研究》一文中研究指出随着信息化社会的发展,信息爆炸性的增长,搜索引擎技术的出现使人们能够快速的获取到信息。但是,传统的搜索引擎也存在其固有的缺陷,用户只能通过关键词进行检索,而关键词并不能充分表达用户的搜索意图,而且让用户从返回的大量包含关键词的结果中挑选可能的答案,难以给用户带来更好地体验。为了解决这些问题,自动问答系统被提出。用户直接向问答系统提问,系统返回简单直接的答案,为用户节省了大量的时间,同时带来了更好的体验。在基于常用问题库(FAQs)的自动问答系统中,问句的相似度计算是其最重要的一环,决定着整个问答系统效果的好坏,因此,本文重点对其进行了研究。论文的主要工作如下:(1)传统基于《知网》的词语相似度计算方法忽略了反义词间的关系,而这种处理方式会导致两个表达截然相反意思的问句具有很高的问句相似度。并且,基于《知网》的词语相似度计算方法,对语义词典依赖性很强,而对于层出不穷的网络新词和旧词新意问题则束手无策。为了解决这些问题,本文采用了一种考虑反义和对义关系的词语相似度计算方法,同时融合了基于统计的方法,解决这些问题。(2)在传统的问答系统检索模型中,相似度是其考虑的核心因素,FAQ之间都是相互独立的,返回相似度最高的问句对应的答案给用户,此时,忽略了用户其他可能的意图,无法满足用户的多样性需求。因此,本文对问句匹配返回的结果进行意图分类,按照意图分组返回给用户,满足用户的多样性需求,同时又将其应用到问句相似度计算中,提高问句相似度计算的准确性。(3)本文设计一种新的问句相似度计算方法,在基于词语语义特征的基础上,使用问句意图特征和句法角色特征,分别解决用户意图多样性和问句语义相似度高而问句表达意思不同的问题,提高了问句匹配的准确性,并且通过实验验证了该方法的有效性。(4)基于以上相关研究,构建了一个基于FAQs的自动问答系统的原型,并对相关模块进行了改进,为今后的应用和进一步的研究提供了一个平台。(本文来源于《青岛理工大学》期刊2014-12-01)

贾明静,董日壮,段良涛[5](2014)在《问句相似度计算综述》一文中研究指出近年来,基于常见问题集的问答系统被广泛的应用到各个领域,而问句相似度计算是基于常见问题集的问答系统的核心模块,因此问句相似度计算方法变得越加重要。该文对问句相似度计算方法进行了综述,分别介绍了各个方法,同时对比了各个方法,最后指出了今后本领域的研究方向。(本文来源于《电脑知识与技术》期刊2014年31期)

徐海洲[6](2014)在《自动问答系统中问句相似度计算方法研究》一文中研究指出问句相似度计算方法是是基于常问问题集的问答系统中的关键部分,汉语句子相似度计算与词法分析、句法分析技术有重要的关系,然而目前的句法分析技术仍然有待提高;另外根据语义词典进行语义分析时,未登录词也会影响分析的结果。基础工作的不成熟制约了句子相似度计算方法的研究。问句是一种特殊形式的句子,汉语问句通常用语调、疑问词、语气词等进行提问。本文根据问句的特点,结合现在较成熟的词法分析技术对问句相似度计算进行了深入的研究。本文的主要研究工作如下:(1)首先从一般形式句子和问句形式的句子两个方面对已有的句子相似度计算方法进行了介绍,然后对各种方法的优缺点进行了分析和比较,最后对汉语句子相似度计算方法的难点进行了分析。(2)根据问句的特点,结合现在较成熟的词法分析技术,抽取出了问句中的核心成分主题和焦点,并据此提出了一种基于Topic-Focus的问句相似度计算方法。文中按照问句预处理、核心词识别、问句相似度计算叁部分对该算法进行了描述,创新点在于提出了一种不依赖于句法分析工具和外部语义词典的问句主题和焦点的抽取方法,并在计算问句相似度时考虑了主题和焦点的影响。实验中显示该方法效果较好。(3)将本文提出的算法用在旅游领域的问答系统中。本文设计了问句检索的模型,详细描述了检索的流程、检索中的关键技术等。然后介绍了旅游领域问答系统中各个模块的具体实现方法,包括问句分析、信息检索和问句相似度计算。最后编程实现了旅游领域内的问答系统,并对本文的算法和系统性能进行测试,给出了评测结果。(本文来源于《华东交通大学》期刊2014-06-30)

田芳[7](2014)在《基于词语情感倾向的问句相似度计算》一文中研究指出问句相似度计算是FAQ问答系统的核心问题,直接关系到FAQ问答系统的准确率。对义或反义的词语有着很高的词语相似度值,如果直接用于问句相似度计算中,有可能导致相反的两个问句有着很高的相似度,因此,本文提出了一种基于词语情感的问句相似度计算方法,采用了负加权法降低相反的问句成为相似的问句的可能,实验结果验证了该方法有助于提高问句相似度计算的准确度。(本文来源于《安庆师范学院学报(自然科学版)》期刊2014年02期)

田卫东,强继朋[8](2014)在《基于问句类型的问句相似度计算》一文中研究指出目前,问句相似度的计算主要借鉴普通陈述句的相似度计算方法。由于普通陈述句的相似性更多反映的是语句间语义上的匹配符合程度,而衡量问句间的相似性则须同时考虑问句及其答案句之间的相似程度,为此,设计了一种新的问句相似度计算方法。该方法不仅利用问句之间的语义和语法特征考察问句之间的匹配程度,还利用问句的问题类型等信息来间接刻画答案句之间的特征形象,从而以获取问句的深层语义信息,以提高问句相似度计算的准确性。实验验证了该方法的有效性。(本文来源于《计算机应用研究》期刊2014年04期)

曾辉,徐海洲,钟茂生[9](2014)在《基于主题和焦点的问句相似度计算方法》一文中研究指出问句相似度计算是基于常问问题库的问答系统的重点。现在的问句相似度计算准确率较低,为此,提出了一种基于主题和焦点的中文问句相似度计算方法。主题和焦点能够反映问句的主旨,识别出问句的主题能够更好地理解问句。其中抽取问句主题和焦点的方法能获取部分语义信息,而且比传统的根据疑问词进行语义分析的方法适用类型更广,同时在计算问句相似度时考虑了主题和焦点的影响。最后通过设计实验与其他方法进行比较,实验表明,该方法提高了准确率。(本文来源于《科学技术与工程》期刊2014年06期)

万庆生,黄少滨,刘刚,陆路[10](2014)在《基于FCA的领域问句相似度计算方法》一文中研究指出文章提出一种基于形式概念分析的领域问句相似度计算方法,该方法不仅考虑了问句的语义与语法结构,更主要的是利用形式概念分析方法提取和建立领域概念集,是一种新的计算领域问句相似度计算模型。通过形式概念分析构建领域知识概念集,概念集以概念格形式进行组织。将问句相似度计算转换成概念集的相似度计算。试验结果表明,使用该方法的相似度计算准确率约为84%,并在有噪声的情况下依然保持高准确率。(本文来源于《东北农业大学学报》期刊2014年02期)

问句相似度计算论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

自然语言处理技术作为人工智能领域一大研究方向,已经得到社会各界的高度重视。随着对自然语言处理技术研究的不断深入,自然语言处理技术的研究方向也逐渐细化,包括信息抽取、问答系统、机器翻译、文本生成和文本挖掘技术、语音识别和生成等。问答系统作为新型的信息检索方式,已经成为逐渐自然语言处理领域的研究重点。问答系统的研究一般分为问句理解、信息检索和答案抽取叁个部分,而这叁者都离不开句子相似度计算,虽然目前人们已经可以利用自然语言处理技术构建各种各样的问答系统,但是问答系统的使用效果却差强人意,而这些问题归根结底是句子相似度计算效果不理想的问题。因而本文主要利用自然语言处理技术对领域问答系统中问答相似度计算方法进行研究。本文主要的创新性工作如下:首先,针对基于词向量的问句相似度计算方法进行改进。改进包括两点内容,一是词向量优化,二是相似度计算方案的改进。其中词向量优化主要优化两个部分,一是近反义词问题的处理,二是未登录词问题的处理。相似度方案改进主要是基于WMD算法基础上,加入词和字的共现信息,从而提高计算的正确率。其次,提出基于深度学习的问句相似度计算。将深度学习应用到问句相似度计算中,主要利用深度学习分类模型选择候选问句集,然后在通过基于词向量的问句相似度方法进行精确匹配。这部分基于LSTM孪生网络分类模型,提出了两种深度学习分类模型包括提出了LSTM+CNN孪生网络模型和CNN+Attention机制的孪生网络模型来提高文本分类的正确率,实验表明两种分类模型对比原先的模型能够在正确率已经达到94%的情况下提高一个百分点达到95%左右。最后基于所提出的算法,开发了一个相似度测试模块,实现了问句相似度算法的测试功能,运行效果表明了改进算法的有效性。实验表明改进基于词向量的问句相似度计算方法正确率相比为改进前正确率提高了6个百分点。通过深度学习选择候选集之后再经过精确匹配,与原先直接应用基于词向量的问句相似度计算方法相比F1值由原来的0.67变成0.84左右,而精度由原来的0.79变成0.85。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

问句相似度计算论文参考文献

[1].曹建文,万福成.面向自动问答系统的问句相似度计算研究[J].重庆大学学报.2019

[2].刘拼拼.领域问答系统中问句相似度计算方法研究[D].哈尔滨工业大学.2018

[3].周强.基于深度学习与主题模型的问句相似度计算[D].北京理工大学.2016

[4].贾明静.基于用户意图和句法角色的问句相似度计算研究[D].青岛理工大学.2014

[5].贾明静,董日壮,段良涛.问句相似度计算综述[J].电脑知识与技术.2014

[6].徐海洲.自动问答系统中问句相似度计算方法研究[D].华东交通大学.2014

[7].田芳.基于词语情感倾向的问句相似度计算[J].安庆师范学院学报(自然科学版).2014

[8].田卫东,强继朋.基于问句类型的问句相似度计算[J].计算机应用研究.2014

[9].曾辉,徐海洲,钟茂生.基于主题和焦点的问句相似度计算方法[J].科学技术与工程.2014

[10].万庆生,黄少滨,刘刚,陆路.基于FCA的领域问句相似度计算方法[J].东北农业大学学报.2014

标签:;  ;  ;  

问句相似度计算论文-曹建文,万福成
下载Doc文档

猜你喜欢