相似文本检索论文-蔡旭勋

相似文本检索论文-蔡旭勋

导读:本文包含了相似文本检索论文开题报告文献综述及选题提纲参考文献,主要关键词:神经网络模型,相似度计算,文本检索

相似文本检索论文文献综述

蔡旭勋[1](2017)在《基于神经网络的词义相似度计算在文本检索中的应用》一文中研究指出近年来,自然语言处理越来越火热,词义相似度计算的研究也成为该领域的重要分支。它在信息检索中的使用非常普遍,也在句法分析中起关键作用。词义相似度计算的研究一直有不少优秀学者在进行探索,从提出至今已有十多年的发展历史,它的定义也越来越清晰。上个世纪末开始国内外的学者对其进行的研究方法大概分为两种。第一种是根据大规模的知识来计算,主要思想是根据词语概念层次关系的语义词典方法,通过上下位的联系移交同位词来做相似度计算。第二种是利用爬取语料库,通过特征统计选择出上下文相关的语义信息,并对与关键词相关性较强的上下文词语做概率分布计算。现如今加入了神经网络模型对词语进行训练,以更好地获取词的语义以及语法信息,得到更好的词向量,其中经典的模型是CBOW与Skip-gram 模型。本文就是将多个模型进行结合并做算法优化以求更好的词义相似度计算方法,得到了不错的计算结果。作为搜索中很重要的文本检索在教育、生活各方面发挥着重要的作用。这是一个全新的时代,人们能够获取数量巨大的信息。但是,在这种情况下。一方面人们能够从这些大数据中得到较多的信息;另一方面也是由于大数据的背景让网络上的信息变得鱼龙混杂,让信息变得难以管理的同时,也增加了人们管理和发现高价值信息与资源的难度。于是,拥有一种能使人们快速获得自己所需要的信息的工具已经变成我们的急迫需求。本文的研究是基于神经网络的词义相似度计算及其应用。应用体现在提升文本检索的准确率、召回率与综合评价指标。在结合了前人词义相似度算法的基础上提出了新的改进算法:改进版的基于神经网络的词义相似度计算。本文主要做了以下工作:(1)对词义相似度计算的发展研究进行介绍,对新兴的基于神经网络的词义相似度计算和自己改进的算法有详细的阐释。简要说明了检索系统的概念、核心技术以及引进了相似度算法的研究。(2)对维基百科数据爬虫,中文分词,写程序进行文本切分,运用前人在词义相似度计算方面的经验对算法进行改进,设计出更好的训练模型来训练词向量,得到更精准的词义相似度数据。对未经过相似度计算的切分文本进行检索;最后将进行词相似度计算得出来的相似度数据放入Lucene中,再对切分的文本进行检索。对比数据,表明自己的算法设计有利于提升检索能力。(本文来源于《华中师范大学》期刊2017-04-01)

吕刚,郑诚[2](2010)在《改进的基于概念相似度的文本检索》一文中研究指出为提高信息检索的查全率和查准率,提出改进的本体语义相似度计算方法,利用本体中概念语义相似度对检索结果文档的分值进行重新计算,过滤掉与原始查询相关度较小的文档。给出定义查询扩展中的迭代参数,减少进行扩展的次数,提高查询效率。利用开源工具Jena,Lucene进行文本语义检索测试,验证该方法的可行性和有效性。(本文来源于《计算机工程》期刊2010年12期)

相似文本检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为提高信息检索的查全率和查准率,提出改进的本体语义相似度计算方法,利用本体中概念语义相似度对检索结果文档的分值进行重新计算,过滤掉与原始查询相关度较小的文档。给出定义查询扩展中的迭代参数,减少进行扩展的次数,提高查询效率。利用开源工具Jena,Lucene进行文本语义检索测试,验证该方法的可行性和有效性。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

相似文本检索论文参考文献

[1].蔡旭勋.基于神经网络的词义相似度计算在文本检索中的应用[D].华中师范大学.2017

[2].吕刚,郑诚.改进的基于概念相似度的文本检索[J].计算机工程.2010

标签:;  ;  ;  

相似文本检索论文-蔡旭勋
下载Doc文档

猜你喜欢