中文问答系统论文-夏艳辉,聂百胜,胡金凤

中文问答系统论文-夏艳辉,聂百胜,胡金凤

导读:本文包含了中文问答系统论文开题报告文献综述及选题提纲参考文献,主要关键词:开放域,中文问答系统,问题分类

中文问答系统论文文献综述

夏艳辉,聂百胜,胡金凤[1](2019)在《中文开放域问答系统的问题分类研究》一文中研究指出中文问答系统通常由问题分析、信息检索、答案抽取组成。其中,问题分析中的问题的分类是否准确会直接关系到提取答案的准确度,所以在问答系统中起到关键性作用。本文主要介绍了中文问答系统的结构、问题分类体系以及方法,并提出结合基于规则的模式匹配与基于统计的机器学习的方法对问题进行分类,从而提高分类的准确度。(本文来源于《价值工程》期刊2019年16期)

陈晓伟[2](2019)在《基于中文知识图谱的问答系统的设计与实现》一文中研究指出近些年来,伴随着互联网技术的迅猛发展,互联网上的信息呈指数级的增长,这些丰富多彩的信息增强了用户在互联网世界获取到大部分知识的可能性,但同时也导致用户从中获取有效信息的效率越来越低,所以人们希望快速获取有效信息的呼声越来越高。于是问答系统应运而生,它有别于返回一系列文档或网页的传统搜索引擎,可以理解用户的搜索意图,并在极短时间内给出一个简明扼要的答案,问答系统也因此成为人工智能研究热潮之一。本文在分析知识图谱问答系统相关技术的基础上,深入研究实体和关系抽取、候选实体排序以及知识表示学习技术,并在传统经典模型和算法上进行改进,给出本文的创新模型和算法,并将之用于真实数据中,构建出本文的基于中文知识图谱的问答系统,具体的工作如下:(1)在信息抽取任务中,传统的串行式方法将其分为实体抽取和关系抽取两个子任务,这种方法存在误差累计和信息利用率低的缺点,所以本文提出BA-IE模型,它采用Bi-GRU提升模型的训练速度,同时引入注意力机制增强模型对问句的语义理解能力,最终实现实体与关系的联合抽取,并在公开数据集上进行对比验证,证明了本文提出的模型在信息抽取任务中具有良好的表现。(2)在实际应用中,实体链接返回的候选实体列表是无序和无语义关联的,会极大地增加知识推理的时间成本,本文引入基于流行度、语义相似度和字符相似度的多评分机制,提出MS-Rank算法对候选实体列表进行排序,有效减少知识推理过程中的冗余计算。(3)为解决传统TransE模型中部分实体的知识表示具有高度相似性的问题,本文在TransE模型的基础上引入实体的事实描述,提出改进的FD-TransE模型,从而扩大实体知识表示之间的距离,并在公开数据集上进行验证,证明了本文模型可以有效解决上述问题。(4)本文结合第叁章和第四章中的模型和算法,设计并实现了一个基于中文知识图谱CN-DBpedia的问答系统,最后在真实的数据流环境中进行系统测试分析。(本文来源于《电子科技大学》期刊2019-04-01)

廖美红[3](2019)在《基于中文知识图谱的电商领域问答算法设计与系统实现》一文中研究指出最近几年来,由于电子商务的快速发展,其直接促进了人工智能服务的庞大需求,在基于知识图谱的问答中,有很多的问答系统都是面向英文的,然而在中英文之间的语义表述有着极大的差异。在一定程度上我国互联网的语义数据也在大规模地得到发展,在电商领域问答算法设计当中也能够给用户提供一个较为智能的问答系统而受到关注。因此,笔者主要是从电子商务的领域作为初始点,然后针对用户在不同领域以及多样性当中对于中文知识图谱的问答算法系统进行知识库的相关设计优化,并提出了一个基于中文知识图谱的自动问答框架,在一定程度上去实现提升用户体验以及降低客服的工作压力等。(本文来源于《商场现代化》期刊2019年05期)

朱龙霞[4](2018)在《面向中文问答系统问题分析与答案抽取方法研究》一文中研究指出随着互联网的飞速发展以及自然语言处理技术的兴起,问答系统进入了面向开放领域、基于自由文本数据的发展阶段。如何从海量信息中获取有用信息是学术界和工业界关注的一个热点。与传统的搜索引擎相比,问答系统允许用户以自然语言提问,并能更好地满足用户对快速、高效、准确获取信息的需求。本文从问题分析和答案抽取两方面对问答系统进行进一步分析。在问题分析方面,本文从长文本和短文本以及数据的序列性叁个角度提出了基于在线隐式狄利克雷分布(Extended Latent Dirichlet Allocation,Extended LDA)和增量短文本主题模型(Incremental Biterm Topic Model,IBTM)的动态主题模型—CTM主题模型。该模型不仅可以捕获用户问题文本中的语义信息,还可以捕获滑动窗口中的词对信息,并能对实时数据进行分类和用户意图分析。由于中文分词工具产生的误差和中文语法的灵活性,传统的从中文文本中提取关键词的方法并不能完整捕获用户所提问题中的主题焦点。本文从基于词性特征组合和同义词词库两个方面对前面提出的动态模型进行改进。实验证明本文所提出的两个改进方法有助于挖掘用户问题中的主题焦点。在答案抽取方面,现阶段本文所研究的答案抽取与答案选择和答案排序问题是类似的,为了保持上下文一致性,本文仍以答案抽取来表示答案选择和答案排序。针对目前基于神经网络的答案抽取模型没有充分考虑问题和答案之间的关系等问题,本文提出了基于双向长短时记忆神经网络(Bi-directional Long Short Term Memory Network,Bi-LSTM)的答案抽取模型。该模型直接用Bi-LSTM对问题的表示向量学习,通过利用卷积神经网络(Convolutional Neural Network,CNN)进一步提取问题特征,然后利用注意力机制对答案的表示向量与问题最终表示向量的相关性进行加权。该模型有效地提取了问题与答案之间的关系。经实验验证本文所提出的基于Bi-LSTM的答案抽取模型在基于搜索引擎中的问答数据集上取得了良好的实验效果。(本文来源于《河北科技大学》期刊2018-12-01)

曹艳蓉[5](2018)在《基于中文社区的智能问答系统的设计与研究》一文中研究指出随着Web2.0和移动互联网的快速发展和普及,在线社区问答平台逐渐成为人们进行实时信息交流和咨询的主要渠道。各大在线社区问答平台通过多年运作,积累了大量的咨询问答信息,并在此基础上逐渐衍生出智能问答的新型高端AI服务。但一般的自然语言问答过程中,存在问题描述逻辑复杂,语句结构不够工整,回答信息错误重复等问题,导致信息检索和机器学习算法很难针对一般用户的提问给出精准有效的回答。针对综合社区智能问答平台中数据的噪声问题,提出一种社区知识库优化方案,该方法通过分析社区平台公开的多元非文本属性特征,例如专业等级、擅长领域、回答满意度等对一个社区问答集中的多个回答进行排序筛选,解决了社区问答系统中“一问多答”现象给问答系统带来的干扰。针对问答系统问题检索答案筛选的准确性问题,提出一种基于可信评价机制的检索排序优化方案,在利用文本匹配检索出候选答案的基础上,将用户新的提问检索内容进行层次分类,并与候选答案回答者的擅长领域进行匹配,可信加权后对候选答案进行再排序,有效提高了问答系统对社区平台问答数据的检索命中率和准确率。最后本文将所提优化方案应用于中文健康医疗社区数据上并构建一套以辅助诊疗为目的的健康医疗智能问答系统。经过实验分析,优化后的系统性能和回答准确率有所提升。(本文来源于《南京邮电大学》期刊2018-11-14)

徐成章[6](2018)在《基于Word2vec的中文Web智能问答系统的研究与设计》一文中研究指出互联网的发展逐渐改变了人们的日常生活,给人们带来了不少的便利。互联网上的海量数据信息在满足了人们工作、生活、研究、娱乐的同时,也给信息的检索带来了新的挑战。目前搜索引擎技术已经成为了网民从互联网上查找自己所需信息的主要手段,但搜索引擎的检索方式仍存在答案不具体、存在大量噪声数据,错误结果无法及时有效反馈等问题。智能问答系统是信息检索的一种高级形式,是下一代搜索引擎的基本形态,也是人工智能领域和自然语言处理领域中受到广泛关注的研究方向。本文以提高智能问答系统的回答质量为目标,对以~(Web)互联网为答案来源的中文~(Web)智能问答系统进行了研究,设计和实现了一种基于~(Word2vec)的中文~(Web)智能问答系统。本文的主要研究工作如下:1.针对现有开源分词工具在互联网文本上的分词效果并不好的这一问题,提出了一种基于词典和改进条件随机场的分词算法。算法通过~(Word2vec)字向量和聚类算法对传统的条件随机场算法进行了改进,扩充了条件随机场训练部分的输入特征,重新训练了分词模型。并在此基础上,结合词典设计和实现了系统的分词功能,使系统对答案的切分更精准。2.针对智能问答系统需要对疑似答案进行排序的问题,提出了一种基于多特征的证据评分方法。在词在问题与证据间的共现次数、词与词的固定搭配关系、文本之间的语义相关性基础上,从词频、词序和语义角度分别对检索到的文本证据进行评分,并对从证据中提取到的答案进行排序。3.在上述工作的基础上,结合~(Web)后台技术、~(Web)前端技术和网页提取技术,设计和实现了一个简单的中文~(Web)智能问答系统。系统的主要工作流程包括问句分类、证据检索、证据评分和答案生成,系统通过问句分类过程确认用户意图,通过证据检索过程检索答案相关信息,通过证据评分和答案生成过程提取答案并为答案排序。经过测试,对比其他的开源分词工具,系统的分词算法在准确率、召回率和~F值上都有了一定的提高。经过基于多特征的证据评分后,系统的回答准确性也达到了预期的目标。(本文来源于《电子科技大学》期刊2018-05-25)

史梦飞[7](2018)在《基于中文知识库的问答系统研究与实现》一文中研究指出随着大数据时代的来临,面对互联网上纷繁复杂的数据,传统的基于关键词匹配的检索模式已经越来越不能满足用户的需求,如何精准高效的获取有效信息成为一个重要的社会议题。由于基于知识库的问答系统能够根据用户提出的问题直接返回一个确定的答案,而不像传统搜索引擎那样返回一系列的排序文档,所以依靠其精准化推送答案和推理计算的特点,成为当下一个非常热门的研究课题。在基于知识库的问答系统研究中,主要有两大类研究方向:一种是基于深度学习的知识库问答,另一种是基于符号表示的知识库问答。基于深度学习的知识库问答将整个问答过程看成是一个问句与知识库的语义匹配过程,在基于此方法的端到端(End2End)问答模型研究中,大多数方法更侧重于语义空间的相似度计算,对于问句本身的意图理解考虑较少,而用户询问意图识别的准确率会极大地影响到知识库问答系统的性能。基于符号表示的知识库问答所采用的主流方法是通过对问句进行语义分析再转化为结构化的查询语句。同时,相比较英文,中文的语言特性更为复杂,表述更为多样,而且很多实际应用的中文知识库系统仍然以模板式的问答方法为主,召回率较低。针对目前的一些研究情况,本文的主要研究内容如下:1.为了更好地理解用户提问意图,充分捕捉问句重要信息,提出了一种基于卷积神经网络和双向长短时记忆网络并带有注意力机制的问句分类算法。2.本文提出了一种融合用户意图类别信息的深度神经网络End2End问答模型,该方法使用双向长短时记忆网络对问句进行表示,结合了注意力机制来捕获问句关键信息,并利用问句的意图分类信息来筛选答案。3.针对中文语句复杂且多样化的特点,本文提出了一种结合基于语义依存分析的剪枝算法及自动化模板的问答方法,通过将问句映射成自定义的新型逻辑形式并生成标准查询语句进行答案查询,并在此基础上设计开发了一套基于特定领域的中文知识库问答系统。本文在多个公开数据集和自行构建的数据集上进行问句分类和问答实验,在多项测评指标上都取得了不错的实验结果,多组实验结果对比也证明了本文提出方法的有效性。(本文来源于《华东师范大学》期刊2018-05-23)

张淼[8](2018)在《基于中文知识图谱的智能问答系统设计与实现》一文中研究指出随着人工智能技术的不断发展,传统的基于搜索引擎的知识获取方式越来越难以满足人们从互联网中获取信息的需求,其返回的信息过于冗杂,用户需要耗费大量的时间与人力从返回的信息中寻找正确的答案。智能问答系统则因为精准捕捉用户搜索意图,理解用户自然语言提问,将答案直接返回给用户而受到越来越多的重视。知识图谱的快速发展,为智能问答系统的实现提供了高质量的知识来源,直接推动了问答系统在行业领域(如客服、医疗等)的发展。本文基于实体识别算法和属性链接算法设计并完成了一个智能问答系统。该系统以通用中文知识图谱为知识来源,包含数据处理、实体识别、属性链接等功能模块,可以从用户多样性表达的问句中准确地识别询问主体,并从知识图谱中找到答案。本文主要开展的工作有:1.针对传统的语义表示上下文信息不足的问题,本文采用词嵌入技术(word embedding)来提取用户自然语言问句的语义特征作为实体识别和属性链接模块的模型输入;2.针对问句中用户表达的多样性和歧义性,引入Bi-LSTM模型(Bi-directional LSTM,双向长短期记忆模型),利用Bi-LSTM提取语义特征并对实体进行标注,可以较好地识别多词一意等歧义情况,从而提高实体识别的准确性。3.针对深层次的语义特征提取不足的问题,本文在CNN(Conversation Network Neural,卷积神经网络)模型中引入注意力机制,该机制使CNN模型可以更好的挖掘自然语言问句词语和属性词语之间的语义关系。实验结果表明,在实体识别算法中引入Bi-LSTM以及在属性链接算法中融合注意力机制,能够使回答问题的准确性得到提升,并在一个开放的数据集上进行了验证。本文根据上述算法实现了一个基于中文知识图谱的智能问答系统,在实验测试环境下运行状况良好,可以实时对用户自然语言问句进行准确回答。同时我们在实际环境中也对所设计的系统进行了功能和性能上的检验,结果表明该系统具有良好的稳定性,证明上述算法具有可行性。(本文来源于《华中师范大学》期刊2018-05-01)

吴炳林[9](2018)在《基于中文深度智能问答系统的证据检索和评分算法研究》一文中研究指出伴随着知识管理及智能化深度分析等技术的深入研究,基于知识层面的深度智能问答系统已成为人工智能发展不可缺少的一部分。深度智能问答系统主要采用Deep QA框架结构和知识图谱推理相结合的方法,通过级联协作流程处理问题,在系统框架扩展和智能推理分析方面有很大程度的提升。证据检索和评分算法的优劣对系统准确率起关键作用。本文通过深入研究分析,阐明了基于中文深度智能问答系统的证据检索和评分算法存在的若干问题:一是目前中文深度问答系统缺欠基于句法结构和语义分析的证据评分算法;二是已有算法流程中缺少高效的证据段落生成策略以及词条预处理流程;叁是现有证据检索和评分模块欠缺更优的基于段落评分池的合并算法。因此,优化和创新证据检索和评分算法是提高中文深度智能问答系统性能的重要问题之一。针对现有证据检索和评分算法中的存在的问题,本文提出了一种新型适用于中文深度智能问答系统的证据检索和评分算法体系。首先,加入了基于自由文档的证据段落生成方法和词条预处理策略;然后,对基于词条频率和词条顺序的两种证据评分算法进行了改进,提出了新的基于卷积树核函数的句法结构评分算法以及基于语言表示模型和卷积神经网络的语义分析评分算法;最后,通过对基于段落评分池的合并算法的分析,提出了基于PCA和K均值的两种新型评分池合并算法。实验表明,改进后的证据检索和评分算法,完善了系统算法体系和缩减了级联流程误差,有效地提高了整个系统的准确率。(本文来源于《郑州大学》期刊2018-05-01)

王英涛[10](2018)在《基于深度学习的中文论述类问题智能问答系统的研究与实现》一文中研究指出随着深度学习相关技术在自然语言处理领域的广泛应用,智能问答系统的研究重点也从传统的问题库文档检索转变为基于自然语言问句理解的问题匹配与答案推理。本文首先对所用到的关键技术进行分析研究,然后针对论述类问题的结构特点,基于CNN与Bi-LSTM深度学习模型提出了分层语义提取模型,将事实陈述部分语义理解以注意力机制融入核心问句部分的理解,最终得到特征更加明显、冗余信息更少的综合语义理解向量,使得在向量空间当中具有更高的相似性。基于该模型所得问题语义理解向量,提出了基于K-means改进算法的聚类存储模型、基于Annoy工具包海量数据相似度计算的双向反馈答案推荐算法,分别解决了智能问答系统中数据存储、答案推荐以及有效数据积累等核心应用问题。最终,结合上述模型算法提出了一种智能问答系统的高可用集群化架构设计与实现,该架构包括应用系统集群、Dubbo分布式服务集群、Hadoop计算集群与数据库存储集群,并完成系统测试。实验表明,本文提出的分层语义提取模型比传统语义理解模型在正确率及向量相似度上均有性能上的提升,所设计的智能问答系统集群化架构能够支持海量数据场景的应用需要,具备实际应用价值。(本文来源于《北京邮电大学》期刊2018-03-14)

中文问答系统论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

近些年来,伴随着互联网技术的迅猛发展,互联网上的信息呈指数级的增长,这些丰富多彩的信息增强了用户在互联网世界获取到大部分知识的可能性,但同时也导致用户从中获取有效信息的效率越来越低,所以人们希望快速获取有效信息的呼声越来越高。于是问答系统应运而生,它有别于返回一系列文档或网页的传统搜索引擎,可以理解用户的搜索意图,并在极短时间内给出一个简明扼要的答案,问答系统也因此成为人工智能研究热潮之一。本文在分析知识图谱问答系统相关技术的基础上,深入研究实体和关系抽取、候选实体排序以及知识表示学习技术,并在传统经典模型和算法上进行改进,给出本文的创新模型和算法,并将之用于真实数据中,构建出本文的基于中文知识图谱的问答系统,具体的工作如下:(1)在信息抽取任务中,传统的串行式方法将其分为实体抽取和关系抽取两个子任务,这种方法存在误差累计和信息利用率低的缺点,所以本文提出BA-IE模型,它采用Bi-GRU提升模型的训练速度,同时引入注意力机制增强模型对问句的语义理解能力,最终实现实体与关系的联合抽取,并在公开数据集上进行对比验证,证明了本文提出的模型在信息抽取任务中具有良好的表现。(2)在实际应用中,实体链接返回的候选实体列表是无序和无语义关联的,会极大地增加知识推理的时间成本,本文引入基于流行度、语义相似度和字符相似度的多评分机制,提出MS-Rank算法对候选实体列表进行排序,有效减少知识推理过程中的冗余计算。(3)为解决传统TransE模型中部分实体的知识表示具有高度相似性的问题,本文在TransE模型的基础上引入实体的事实描述,提出改进的FD-TransE模型,从而扩大实体知识表示之间的距离,并在公开数据集上进行验证,证明了本文模型可以有效解决上述问题。(4)本文结合第叁章和第四章中的模型和算法,设计并实现了一个基于中文知识图谱CN-DBpedia的问答系统,最后在真实的数据流环境中进行系统测试分析。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

中文问答系统论文参考文献

[1].夏艳辉,聂百胜,胡金凤.中文开放域问答系统的问题分类研究[J].价值工程.2019

[2].陈晓伟.基于中文知识图谱的问答系统的设计与实现[D].电子科技大学.2019

[3].廖美红.基于中文知识图谱的电商领域问答算法设计与系统实现[J].商场现代化.2019

[4].朱龙霞.面向中文问答系统问题分析与答案抽取方法研究[D].河北科技大学.2018

[5].曹艳蓉.基于中文社区的智能问答系统的设计与研究[D].南京邮电大学.2018

[6].徐成章.基于Word2vec的中文Web智能问答系统的研究与设计[D].电子科技大学.2018

[7].史梦飞.基于中文知识库的问答系统研究与实现[D].华东师范大学.2018

[8].张淼.基于中文知识图谱的智能问答系统设计与实现[D].华中师范大学.2018

[9].吴炳林.基于中文深度智能问答系统的证据检索和评分算法研究[D].郑州大学.2018

[10].王英涛.基于深度学习的中文论述类问题智能问答系统的研究与实现[D].北京邮电大学.2018

标签:;  ;  ;  

中文问答系统论文-夏艳辉,聂百胜,胡金凤
下载Doc文档

猜你喜欢