专业领域的搜索引擎论文-洪颖

专业领域的搜索引擎论文-洪颖

导读:本文包含了专业领域的搜索引擎论文开题报告文献综述及选题提纲参考文献,主要关键词:专业搜索引擎,Lucene,服装,向量空间模型

专业领域的搜索引擎论文文献综述

洪颖[1](2012)在《基于Lucene的服装领域专业搜索引擎研究》一文中研究指出针对通用搜索引擎在专业检索方面查准率低的问题,设计了基于Lucene和Nutch组件的服装专业搜索引擎.该系统结合专业词库对抓取的网页进行分词和专业相关度计算并进行网页过滤,依据改进的网页排序算法对结果进行排序.(本文来源于《北京服装学院学报(自然科学版)》期刊2012年03期)

张岩[2](2008)在《基于TSE专业领域搜索引擎研究与实现》一文中研究指出面向专业领域的搜索引擎是信息检索领域的一个新的重要研究课题。虽然该领域已经取得许多研究成果,但目前相应的系统应用和检索效果却并不理想。鉴于目前在国内,基于体育学学科特定知识领域的信息检索少有所闻,所以本论文将对体育学科的搜索引擎系统进行深入的研究及实现。TSE(Tiny Search Engine)是基于北大天网搜索引擎为模型开发的一个在Linux环境下运行的小型搜索引擎。它是一个开源项目,是北大网络实验室的闫宏飞老师专门为搜索引擎爱好者提供的学习产品。由于TSE是一个通用的搜索引擎系统,针对专业领域的问题搜索时,在准确性和效率方面都有一定的不足。本文在构建TSE的基础上将体育方面的知识加入此系统,改善其分词和索引功能:(1)加入体育方面特定词库。(2)改进TSE的分词算法。(3)更改TSE爬取网页时相关参数的设置以便更适应于专业领域的网页搜集。为了测试改进后的系统的性能,我们利用某网站体育栏目在这方面的整合资源,建立了一个体育新闻测试集(大约200篇文档,50个问题及答案)。利用此测试集对TSE及改进后的系统进行测试并对结果进行了深入分析。改进后的系统性能还是令人满意的。(本文来源于《吉林大学》期刊2008-10-01)

韩亮,李勇[3](2007)在《基于Ontology的专业领域智能搜索引擎的研究》一文中研究指出本文分析当前网上基于关键字的搜索引擎的现状及存在的问题。在阐述本体的定义及其概念化、共享化的特点的基础上,提出构建基于本体的专业领域信息搜索引擎的重要性。通过在搜索引擎中引入本体描述,可以提高搜索引擎的查全率和查准率,进而获得更佳的搜索结果。(本文来源于《科技信息(学术研究)》期刊2007年27期)

胡晓博[4](2006)在《面向特定领域的专业搜索引擎的架构与实现方法》一文中研究指出随着互联网技术的飞速发展,互联网络上的信息量正在以几何级数的增长速度增长,因此,对网络上信息的高效检索成为互联网发展必须要解决的问题,搜索引擎技术得到了特别的重视并且正在飞速的发展。目前,如Google、Baidu等综合型搜索引擎系统已经取得了极大的成功,但是,当使用综合型搜索引擎来检索专业内容时,往往找不到专家们需要的内容。因此,有必要研究并开发面向特定领域的面向特定领域搜索引擎系统来满足某一领域信息检索的需要。该文研究并设计了一个具有通用性的面向特定领域搜索引擎,若想改变应用领域,则只需修改领域词汇的词库文件。为了实现该面向特定领域搜索引擎系统,该文引入了综合型搜索引擎系统的架构模型,即网络蜘蛛、索引器和检索器,并且在该模型中增加了中文分词模块,信息过滤模块。该搜索引擎系统基于开源搜索系统Nutch和全文索引引擎Apache Lucene构建。在设计和开发的过程中,严格按照软件工程代码重用的要求重用了Nutch和Lucene的大量源码,并在此基础上做了改进和扩充。该文介绍了系统集成方案,并且详细讲解了中文分词器、信息过滤器、信息检索器以及用户接口的设计和实现技术,重点讨论了中文分词部分应用的正向最大匹配分词与逆向最大匹配分词相结合的分词算法。最后,该文介绍了该面向特定领域搜索引擎的相关性能数据以及实验验证结果。该文所设计的面向特定领域搜索引擎与现有的主流搜索引擎的主要不同体现在:首先是其面向领域的特性,其次是应用领域可定制的特性。相信该搜索引擎能为需要特定领域搜索的专家学者提供很大的方便和帮助。(本文来源于《哈尔滨工程大学》期刊2006-12-01)

专业领域的搜索引擎论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

面向专业领域的搜索引擎是信息检索领域的一个新的重要研究课题。虽然该领域已经取得许多研究成果,但目前相应的系统应用和检索效果却并不理想。鉴于目前在国内,基于体育学学科特定知识领域的信息检索少有所闻,所以本论文将对体育学科的搜索引擎系统进行深入的研究及实现。TSE(Tiny Search Engine)是基于北大天网搜索引擎为模型开发的一个在Linux环境下运行的小型搜索引擎。它是一个开源项目,是北大网络实验室的闫宏飞老师专门为搜索引擎爱好者提供的学习产品。由于TSE是一个通用的搜索引擎系统,针对专业领域的问题搜索时,在准确性和效率方面都有一定的不足。本文在构建TSE的基础上将体育方面的知识加入此系统,改善其分词和索引功能:(1)加入体育方面特定词库。(2)改进TSE的分词算法。(3)更改TSE爬取网页时相关参数的设置以便更适应于专业领域的网页搜集。为了测试改进后的系统的性能,我们利用某网站体育栏目在这方面的整合资源,建立了一个体育新闻测试集(大约200篇文档,50个问题及答案)。利用此测试集对TSE及改进后的系统进行测试并对结果进行了深入分析。改进后的系统性能还是令人满意的。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

专业领域的搜索引擎论文参考文献

[1].洪颖.基于Lucene的服装领域专业搜索引擎研究[J].北京服装学院学报(自然科学版).2012

[2].张岩.基于TSE专业领域搜索引擎研究与实现[D].吉林大学.2008

[3].韩亮,李勇.基于Ontology的专业领域智能搜索引擎的研究[J].科技信息(学术研究).2007

[4].胡晓博.面向特定领域的专业搜索引擎的架构与实现方法[D].哈尔滨工程大学.2006

标签:;  ;  ;  ;  

专业领域的搜索引擎论文-洪颖
下载Doc文档

猜你喜欢