导读:本文包含了受限域中文问答系统论文开题报告文献综述及选题提纲参考文献,主要关键词:受限领域,智能问答,领域关键词,语义相关度
受限域中文问答系统论文文献综述
王新磊[1](2014)在《受限领域内基于中文问句语义相关度计算的智能问答系统研究》一文中研究指出随着计算机技术和人工智能技术的快速发展,智能问答系统越来越多的出现在人们的日常生活中,并且其起到的作用越来越重要。用户在追求答案准确性的同时,越来越多的关注智能问答系统的交互真实性。所以智能问答系统应该同时具备答案返回准确性高和人机交互真实性强的特点。因此本文立足于前人的研究成果,着力于对受限领域内的基于中文问句语义相关度计算的智能问答系统进行研究,实现了基于问句语义表征和领域关键词树的问句语义相关度计算的算法,本文的主要研究内容有:(1)对领域关键词提取技术进行研究,对多种领域关键词提取技术进行比较,提出适合本文的领域关键词提取技术,实现领域关键词词典的建立。(2)对目前已有的语义相关度算法和问句相似度算法进行研究,实现更加适合本文的语义相关度计算算法,实现对语句语义相关度的计算。(3)实现受限领域内基于中文问句语义相关度计算的智能问答系统,验证理论方法的正确性。本文的创新点有:(1)改进领域关键词提取技术。领域词提取方面本文采用TF-IDF技术结合活跃词过滤技术进行领域词提取,该方法不仅利用了TF-IDF技术的特点,而且特意添加了活跃词的过滤,使领域词的提取准确度更高。(2)提出了一种新的语义相关度计算方法。本文采用基于问句语义表征和领域关键词树进行语义相关度计算,主要采用已有的算法并对其进行相应了的改进,同时结合本文建立的领域关键词树对语义相关度进行计算,不仅提高了智能问答系统的准确性,同时也使智能问答系统更符合问答的语境。综合以上研究成果,本文设计并实现了基于山东财经大学相关信息的中文智能问答系统的原型,实验证明,本文提出的基于问句语义表征和领域关键词树的问句语义相关度计算算法准确率和效率都具有比较理想的效果。(本文来源于《山东财经大学》期刊2014-05-01)
李长进[2](2011)在《基于中文带权关键词树的受限领域问答系统研究》一文中研究指出现今,网络的快速发展为人们提供了大量的信息资源,人们希望在大量的信息中能够快速准确地找到自己需要的信息,在这样的背景下自动问答系统应运而生。自动问答技术(Question Answering,QA)是综合运用自然语言处理、信息检索、语义分析、人工智能等技术的一种新型信息服务技术。与传统的搜索引擎不同,自动问答系统通过自然语言句子提问,系统对问题进行分析并理解用户的问题,最终返回用户需要的答案。自动问答系统在国内外有着广泛的研究,已经出现了比较成熟的自动问答系统。但是由于中文语言的复杂性和处理技术的局限性,让计算机理解中文非常困难,中文问答系统已成为极具挑战力的研究领域,目前,中文自动问答系统的研究与应用仍以限定领域为主,并且还没有较成熟的系统出现,针对现有研究状况,本文提出并实现了基于中文带权关键词树算法的受限领域问答系统,研究的主要内容有:关键词抽取与加权得分;关键词树的构建与推理等。本文主要创新点如下:(1)本文对关键词的属性进行了详细的分析,将关键词属性分为词本体属性与词句中属性两类。抽取其中七种主要属性进行统计分析并作为评测关键词重要程度的加权依据。然后通过主成分分析来为各种指标的权重系数进行重组,计算权重指标系数并得出关键词的最终得分,此得分即为评价关键词重要性的依据。(2)本文通过创建自己的语义树,即关键词树,对领域知识进行管理。本文将类与树的概念相结合,提出了关键词树的知识存储概念,并结合领域知识的特性,对关键词树的构建、存储、更新等一系列操作进行了详细描述。(3)本文以关键词树为中心设计知识库并进行问句相似度计算,通过计算关键词权重与等级来设计问句相似度算法,缩小知识搜索范围,并对候选问题进行排序。总之,本文结合语义分析与统计分析的理论方法,在限定领域内,提出了一套基于关键词树的自动问答系统。通过实验证明,本文方法有效地提高了问答系统的检索效率和准确性。研究结果在信息咨询、电子政务以及科普文化传播等领域具有较高的理论意义和实用价值。(本文来源于《山东经济学院》期刊2011-05-09)
蒋昌金,彭宏,马千里,林正春,王成[3](2010)在《受限领域中文问答系统问句分析研究》一文中研究指出问句分析是问答系统中一个极其重要的部分,它对后续的搜索模块和答案抽取模块有着至关重要的影响。为了提高问句分析模块的性能,对中文问答系统问句分析模块进行研究和分析,在构建领域词典的基础上实现了对问句中命名实体的识别。对问句类型的识别则采用问题类别对照表的方式来实现。在对问句进行分词、词性标注之后,提取出其中的名词、动词、形容词等实词,形成初始查询向量,最后对初始查询向量进行同义词扩展和问句类型关联词扩展。实验结果表明,通过查询向量进行查询比用问句直接查询有着更高的准确率。(本文来源于《计算机工程与设计》期刊2010年11期)
唐琴[4](2008)在《受限领域中文情感问答系统研究》一文中研究指出随着数字信息的膨胀,大量可用的数字信息对于回答用户的各种问题变成了可利用的资源。传统的信息检索通常会对用户的提问返回成百上千篇文档,而用户必须依靠自己在这些繁多而又充满重复的文档中筛选自己需要的有用信息。为了克服这些不足,近年来,越来越多的研究机构和公司致力于新一代信息检索系统的研究,其中一个很重要的方向就是问答系统。如今大多数的问答系统对于简单的事实性问题和常问问题的回答已经达到了很高的准确率,然而偏重于观点或情感的问答系统的研究却相对较少。人们不仅想要了解既定的事实,也想了解大众或他人对于某些特别的话题、人物,或者事件所持有的观点、想法和感情。我们发现人们对于焦点人物的关注度很高。人们喜欢了解焦点人物的喜好,也想要了解别人对这些公众人物是如何看待的。本文以娱乐焦点人物的喜好以及大众对其的情感作为研究对象,从比较新颖的情感角度来对问答系统进行研究。相对于事实性问答系统而言,观点或情感问答系统的研究除了需要考虑观点持有者及情感倾向性等与情感相关问题以外,其难点还在于答案形式更复杂更分散。本文从百度知道人工搜集了大量的情感问题,并根据情感问题的特征,统计并归纳了五大情感问题类型。问题分类模式与传统事实性问答系统不同,不能仅仅根据疑问词对其进行分类,还需要考虑到观点以及受众的反应。问题分类使用基于组块分析的CRF模型与规则相结合的情感问题分类方法。在答案抽取时结合组块识别的结果和情感的倾向性,并根据情感问题类型的不同采取不同的方法以获取答案。实验表明本文情感问答系统研究中所用方法是有效的。(本文来源于《大连理工大学》期刊2008-12-01)
陈康,樊孝忠,刘杰,余正涛[5](2008)在《受限领域问答系统的中文问句分析研究》一文中研究指出对用户所提问句的理解是受限领域问答系统实现的关键,该文提出一种基于本体和问句句型模板规则的中文问句分析方法,研究如何使用问句语义表征来表示问句分析的结果,将该方法应用于某受限领域问答系统中。实验结果表明,使用该方法进行中文问句分析,准确率达90%以上,可以在实际的问答系统中使用该方法。(本文来源于《计算机工程》期刊2008年10期)
章程[6](2008)在《受限域中文问答系统问句分析研究》一文中研究指出问答系统是新一代智能搜索引擎,它允许用户以自然语言提问,并能够向用户返回准确的答案。与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索出用户所需要的答案。问句分析是问答系统的一个非常重要的组成部分,它的准确性直接影响到最终答案抽取的准确性。本文主要利用自然语言处理技术,对受限域中领域知识库的构建,问句表征,问句分类,问句相似度计算等问答系统关键技术进行探讨与研究,并在此基础上实现了一个云南旅游FAQ库的问答系统。具体说来,本文主要取得了以下几个较有特色的成果:(1)针对“知网”常识库缺乏对领域概念的描述问题,提出了一种领域知识的表示、领域本体的提取与构建方法。该方法借助本体论的思想,采用“知网”的概念描述语言对领域术语概念进行精确描述,从而建立领域知识库,并实现领域知识库与常识库的融合。(2)提出了一种问句信息的形式化表示(问句表征)方法。该方法利用词法、语义分析实现领域问句关键字的提取与扩展,利用问句句法依存分析提取问句的句法依存树,通过问句类型与问点及答案类型映射规则来获取问句的问点及答案类型。(3)提出了一种基于规则和统计学习相结合的领域问句分类的方法。该方法首先利用语言规则与领域知识的特点提取问句类别规则;然后通过提取句法结构关系和领域特征,并采用改进贝叶斯分类学习算法,构造问句分类模型;最终结合规则的方法和统计学习的方法,实现领域问句分类,实验结果表明,该方法具有较好的效果。(4)针对当前问句相似度计算方法的不足,结合领域内汉语问句的特点,提出了一种领域问句相似度的计算方法。该方法以领域知识库及常识库为基础,计算词语之间语义相似度,提取问句句法依存对,并计算问句中依存对之间的相似度,从而实现了融合词法、句法、语义及领域知识的领域问句的相似度计算。实验结果表明,该方法具有较好的效果。(5)利用上述研究成果,并以云南旅游领域为例,收集整理领域特征,实现云南旅游FAQ库的问答原型系统。(本文来源于《昆明理工大学》期刊2008-03-10)
邓锦辉[7](2008)在《受限域中文问答系统中答案抽取的研究》一文中研究指出问答系统为人们提供了自然语言的人机交互方式,相对于传统的关键词方式搜索引擎来说,其具有更准确,快捷和高效的特点,有着非常广泛的应用前景,是当前研究的热点和难点问题。由于自然语言处理的复杂性,人们把它限定在一定领域来研究,这使得受限域中文问答系统成为国内研究的热点。在受限域中文问答系统中,答案的实时性和准确性决定整个系统的性能,因此答案抽取成为一个重要研究话题。本文针对受限领域中答案抽取中的关键技术做了一定的探讨,即如何从的现有网络资源中获取海量领域实时信息?如何从海量领域信息中获取最相关信息?如何准确地定位答案?主要取得了以下几个方面的成果:(1)提出了在受限域中构建领域知识库的方法。该方法借助本体(Ontology)思想,采用基于大量语料统计的动态获取方法在领域语料中提取领域概念和领域本体,再利用知网(HowNet)概念描述方法对其描述,构建领域知识库,为领域问题的研究提供了更有效的资源。(2)提出了领域文本检索方法。该方法结合领域特性,利用现代搜索引擎技术,构建领域搜索引擎系统,并通过它获取了大量的领域文本,为解决领域问题提供了大量的领域文本资源。(3)提出了领域段落检索方法。该方法将段落检索思想应用到受限域问答系统中,并结合领域特性改进了基于密度的段落检索算法使其更适应受限领域,为最后的答案抽取提供了准确的领域段落资源。(4)提出了领域答案抽取方法。该方法针对领域问题,形成了一整套解决领域中一般性问题的答案抽取策略,抽取结果表明该策略在解决领域问题中起到了一定的效果。(5)以云南旅游作为受限领域,构建了云南旅游知识库,进行了云南旅游的文本检索、段落检索及答案抽取,设计并实现了问答原型系统。(本文来源于《昆明理工大学》期刊2008-03-01)
黄莉[8](2007)在《基于受限域常问问答库的中文问答系统研究》一文中研究指出问答系统为人们提供了自然语言的人机交互方式,相对于传统的关键词方式搜索引擎来说,其具有显着的优势。在受限域,基于常问问答库的问答系统在对问题答案的定位上,有更准确,快捷和高效的特点,在日常生活的各个领域,有着非常重要的应用前景,是当前研究的热点问题。本文围绕受限域FAQ汉语问答系统实现过程中的领域知识库构建,受限域FAQ的收集和组织,问句分类,相似问句的查找及答案提取等关键核心技术进行了一系列的研究和探讨,主要取得了以下较有特色的成果:(1)提出了在受限域中,构建“领域知网”知识库的方法。该方法利用领域知识的特点,借助本体思想与“知网”知识资源,构建了领域知识库,实现与常识知识库“知网”融合,领域知识库与常识知识库的结合为自然语言处理方面的研究提供了更有效的资源。(2)提出了一种利用领域知识特点来收集、组织和归类FAQ的方法。该方法在分析旅游领域知识特点的基础上,根据地域及问题类型等特征,实现了FAQ的收集和组织。(3)提出了一种基于规则的领域问句分类与识别的方法。该方法利用问句语言规则与领域知识特点提取问句类别规则,基于规则来进行问句分类与识别。该方法能够有效的缩小候选问题查找范围,提高答案定位的准确率。(4)提出了一种利用领域知识特点的语义依存的问句相似度计算方法。该方法利用领域问题特点,提取问题类别,根据类别进行相似问题过滤,以“知网”及“领域知网”知识库为基础,采用句法分析提取问句有效依存对,利用依存对和概念语义关系,实现问句之间相似度计算。(5)在云南旅游领域,设计实现了云南旅游问答原型系统。构建了领域知识库和领域FAQ数据库,采用文中问句相似度计算方法,进行问句相似度的计算,实现问题答案提取。云南旅游FAQ问答原型系统测试结果表明该方法可行,有较好的效果。(本文来源于《昆明理工大学》期刊2007-03-19)
赖擎,曹力立[9](2006)在《受限领域中文问答系统的中心句识别的研究》一文中研究指出在自动问答系统中,只有识别用户输入问句的具体含义后,才能做出相应的处理。文章尝试使用领域知识库作为基础,运用模式匹配的方法实现对用户输入问句的分类,识别问句中的中心句和关键词,计算这些关键词的概念与领域知识库中已有概念的相似度,并将这些参数传给检索系统来检出合适的答案。(本文来源于《计算机时代》期刊2006年02期)
受限域中文问答系统论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
现今,网络的快速发展为人们提供了大量的信息资源,人们希望在大量的信息中能够快速准确地找到自己需要的信息,在这样的背景下自动问答系统应运而生。自动问答技术(Question Answering,QA)是综合运用自然语言处理、信息检索、语义分析、人工智能等技术的一种新型信息服务技术。与传统的搜索引擎不同,自动问答系统通过自然语言句子提问,系统对问题进行分析并理解用户的问题,最终返回用户需要的答案。自动问答系统在国内外有着广泛的研究,已经出现了比较成熟的自动问答系统。但是由于中文语言的复杂性和处理技术的局限性,让计算机理解中文非常困难,中文问答系统已成为极具挑战力的研究领域,目前,中文自动问答系统的研究与应用仍以限定领域为主,并且还没有较成熟的系统出现,针对现有研究状况,本文提出并实现了基于中文带权关键词树算法的受限领域问答系统,研究的主要内容有:关键词抽取与加权得分;关键词树的构建与推理等。本文主要创新点如下:(1)本文对关键词的属性进行了详细的分析,将关键词属性分为词本体属性与词句中属性两类。抽取其中七种主要属性进行统计分析并作为评测关键词重要程度的加权依据。然后通过主成分分析来为各种指标的权重系数进行重组,计算权重指标系数并得出关键词的最终得分,此得分即为评价关键词重要性的依据。(2)本文通过创建自己的语义树,即关键词树,对领域知识进行管理。本文将类与树的概念相结合,提出了关键词树的知识存储概念,并结合领域知识的特性,对关键词树的构建、存储、更新等一系列操作进行了详细描述。(3)本文以关键词树为中心设计知识库并进行问句相似度计算,通过计算关键词权重与等级来设计问句相似度算法,缩小知识搜索范围,并对候选问题进行排序。总之,本文结合语义分析与统计分析的理论方法,在限定领域内,提出了一套基于关键词树的自动问答系统。通过实验证明,本文方法有效地提高了问答系统的检索效率和准确性。研究结果在信息咨询、电子政务以及科普文化传播等领域具有较高的理论意义和实用价值。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
受限域中文问答系统论文参考文献
[1].王新磊.受限领域内基于中文问句语义相关度计算的智能问答系统研究[D].山东财经大学.2014
[2].李长进.基于中文带权关键词树的受限领域问答系统研究[D].山东经济学院.2011
[3].蒋昌金,彭宏,马千里,林正春,王成.受限领域中文问答系统问句分析研究[J].计算机工程与设计.2010
[4].唐琴.受限领域中文情感问答系统研究[D].大连理工大学.2008
[5].陈康,樊孝忠,刘杰,余正涛.受限领域问答系统的中文问句分析研究[J].计算机工程.2008
[6].章程.受限域中文问答系统问句分析研究[D].昆明理工大学.2008
[7].邓锦辉.受限域中文问答系统中答案抽取的研究[D].昆明理工大学.2008
[8].黄莉.基于受限域常问问答库的中文问答系统研究[D].昆明理工大学.2007
[9].赖擎,曹力立.受限领域中文问答系统的中心句识别的研究[J].计算机时代.2006