导读:本文包含了反馈式搜索引擎论文开题报告文献综述及选题提纲参考文献,主要关键词:搜索引擎,网页排序,ε-贪婪学习,用户行为
反馈式搜索引擎论文文献综述
张春玲,姜成晶[1](2019)在《利用ε-贪婪学习和用户行为反馈的搜索引擎网页排序算法》一文中研究指出为了提高网页排序的准确性,提出一种基于ε-贪婪学习和用户点击行为的网页排序算法。首先,根据用户查询,通过轮盘赌策略向用户推荐相关网页列表;然后,根据用户点击网页的行为进行ε-贪婪学习,计算得到排序系统中的强化信号,通过奖励和惩罚机制为每个网页计算相关性程度值;最后,根据相关性程度对网页进行重新排序。随着用户反馈的信息越来越多,相关网页会排列在列表的最高等级上。实验结果表明,提出的算法能够准确地推荐出相关网页,在P@n、NDCG和MAP性能指标上都获得了较优的性能。(本文来源于《计算机应用研究》期刊2019年08期)
刘申嘉[2](2016)在《基于相关反馈的图像搜索引擎的研究与实现》一文中研究指出日新月异的计算机技术给人们带来了崭新的生活体验与工作方式。随着网络带宽的增加,用户可以更加快速的利用互联网对网站进行访问,但互联网中庞大的数据量也使得用户在查询特定消息的过程如同大海捞针。因此,一个全新的信息搜索技术“搜索引擎”应时而生,并在短时间内得到快速的发展和改进。由于互联网中多媒体版块的不断丰富,用户对搜索内容便有了更多的需求。其中为了满足用户对图像搜索的要求,从之前发展比较成熟的基于文字的图像搜索技术,到现在逐渐完善的基于内容的图像搜索技术,各种各样基于互联网图像的搜索技术蓬勃发展。通常,用户在搜索图像时,最为关心的便是搜索到的结果与用户的期望值是否相符。因此本文结合了基于文字和基于内容的搜索引擎的技术特点,提出了基于相关反馈的搜索引擎并加以实现。首先介绍了图像搜索系统的相关背景和研究意义,其次简单描述了搜索系统要用到的关键技术,包括链接爬取、内容提取、图像爬取、索引建立等等,以此为开发出一个完整的搜索系统提供了必要的理论和技术准备。本文在第叁章中详细阐述了基于相关反馈的搜索引擎的框架结构,它包含用户接口模块、图像处理模块、数据爬取模块,并在这些模块中添加了用户的相关反馈机制。第四章在第叁章所提出的框架与流程的基础上具体实现了相关功能。在数据搜索模块,本文通过在爬取过程中使用HtmlUnit插件,解决了一般Spider只能爬取静态页面而无法解析动态页面的问题。在图像处理模块,本文在特征提取方面侧重于图像低层次特征的提取,通过使用感知哈希算法,对图像的形状、纹理特征以数字的形式呈现出来。最后通过相关测试,检验了所有模块的功能,验证了本文所提搜索引擎与其它搜索引擎相比具有较高的查准率。本论文为实践应用型研究型论文,目的在于研究和实现基于相关反馈的图像搜索系统。它在传统的搜索系统模式之外另辟蹊径,改进了搜索系统的查准率与查全率,同时还改善了用户在搜索过程中的体验度。(本文来源于《南京邮电大学》期刊2016-11-18)
徐树振[3](2014)在《聚类反馈式电网资源分布搜索引擎研究与实现》一文中研究指出为应对当前企业信息规模的爆炸式膨胀和信息资源共享的普遍需求,企业级搜索引擎兴起了。同互联网搜索有很大不同,企业级搜索是为组织业务决策和运转而服务的,因而需要保证信息的查全率和查准率。企业级搜索要应对的难题有:第一:对于企业TB级的数据,现有的集中式搜索引擎服务器难以满足索引的存储管理,需要多台服务器分布式存储索引;在多索引和检索任务并发执行的情况下,搜索引擎的性能急剧下降,须采用多台服务器分担任务保证工作效率。第二:占企业信息资源总量80%以上的非结构化数据的数据量日趋增大,非结构化数据种类多且包含关系企业发展的重要信息,解决非结构化数据的检索对企业至关重要。第叁:搜索领域准确性的要求越来越高,多数搜索引擎返回记录众多且不按主题分类显示,用户很难在线性排列的结果集中快捷、准确地发现信息。搜索结果聚类可以从一定程度上帮助用户定位信息。电网公司的信息化建设水平不断提升,急需一个电网资源搜索引擎满足人员查找数据信息。根据以上分析,借助分布式计算技术的优势,结合搜索引擎相关技术,设计并实现了一个能够有效处理海量数据,支持高并发任务且快速响应的电网资源分布式搜索引擎。另外,通过文本信息抽取和文本聚类技术,对检索结果集聚类展示,聚类反馈模式便于用户快速、准确定位文档。本文主要工作内容有:(1)基于电网专业词库,借助IKAnalyzer实现搜索引擎中文分词,结合全文检索技术和分布式计算,对搜索引擎的索引和检索子系统分别建模分析。(2)对K-means文本聚类算法在初始簇心选择和K值确定方面进行了优化。基于最远距离选择初始簇心;根据K的可能取值进行聚类,评价聚类结果聚类均值的总方差并在可能取值集中确定K。测试后证明改进的算法在实现文本集自适应聚类的同时聚类效果良好。(3)从整体上架构电网资源库搜索引擎,并对搜索引擎中的重要模块给出设计方案。借助Solr基于ZooKeeper分布式部署SolrCloud,实现分布式搜索引擎的细节。负载均衡策略和每个分布式有效节点协同合作。搜索引擎服务器采用分布式索引及搜索的策略,实现了海量数据的并行索引,并且支持大数量用户并发执行搜索任务。(4)完成搜索引擎的分布式部署,对索引和检索性能进行测试,并通过搜索实例展示搜索引擎的检索功能和结果集聚类反馈功能。(本文来源于《昆明理工大学》期刊2014-04-01)
沈敏[4](2012)在《基于自动文摘与用户反馈的个性化搜索引擎系统的研究与设计》一文中研究指出在信息爆炸的今天,搜索引擎已经成为了一种从大量的数据信息中发现、推理知识的有效工具。但是,传统的搜索引擎系统存在着对于不同用户的同样查询会返回相同结果的弊端,而且用户也越来越迫切地希望系统能返回更高准确率的结果。所以,本文将自动文摘和用户反馈技术引入到传统的搜索引擎系统中,以此提高系统的精确率。本文通过分析传统搜索引擎MG(Managing Gigabytes)系统模型,研究并设计了一个相对完整的个性化搜索引擎系统。根据需求分析,本文把系统分为了文档处理模块、聚类模块、用户查询处理模块、用户分类模块、系统反馈模块、相似度计算模块、排序模块、结果显示模块以及系统评估模块。系统首先对用户进行聚类分析,提取用户的兴趣模型;然后根据用户反馈信息,在计算查询向量与文档向量的相似度时,调整个性化参数,使查询结果更加精确。同时还对文档的特征项约简算法进行了改进,首先对文档进行自动文摘处理,其次分析文档摘要提取特征项集,然后对特征项按照对文档类别的贡献度进行排序,最后在保证精确率的前提下以牺牲完备性来换取特征项的快速收敛。系统还结合了最小完美哈希函数与大内存存储技术,降低了倒排文档字典的存储空间并且提升了倒排文档索引的读取速度。最后通过建立最小堆数据结构对海量文档的排序进行了空间上的优化。通过理论分析和实验论证,相比MG搜索引擎系统而言,特征项约简算法改进后,时间效率有了一定地提高;倒排文档索引字典的存储空间节省了将近一半;文档排序算法改进后,降低了排序的空间复杂度;相似度计算算法改进后,对于个人的兴趣而言,使查询的个性化精确率有了一定地提升。(本文来源于《天津大学》期刊2012-12-01)
轩春青[5](2011)在《基于客户反馈的FTP搜索引擎的研究与设计》一文中研究指出FTP是因特网最主要的服务之一,FTP搜索引擎为资源共享提供了极大的方便。本文开发了“基于客户反馈的FTP搜索引擎”,它主要侧重于方便我院学生对学习资料、各种软件和学习视频的下载以及存储个人私有资料,充分体现学院的信息化。本文在总结前人工作的基础上,对FTP搜索引擎的设计进行了研究,提出了基于客户反馈的FTP搜索引擎的设计,并能够提供多种查询方式、大数据量、查询速度较快的FTP搜索引擎。首先,针对现有FTP搜索引擎存在的问题,采用反馈式技术和舆情分析技术,并引入多线程技术和网络编程技术对FTP服务器中的数据进行抓取,支持单站点和多站点抓取,抓取时采用宽度优先遍历技术,同时可以对模糊IP段进行筛选。然后,通过挖掘分析用户的点击反馈信息和查询反馈信息得出权值,提出了基于权值(客户的反馈信息)的HS算法,并把基于权值(客户的反馈信息)的HS算法应用到最终查询结果的排序中。并详细分析了权值的设计以及基于权值的HS算法的基本思想,实验结果表明该排序算法能够把查询结果最优的排在前面,从而提高了搜索的准确率和提升了用户的搜索体验。最后,为了保证数据库中的数据与FTP服务器上数据的一致,必须及时对站点中的数据进行更新和数据库配置。(本文来源于《郑州大学》期刊2011-05-01)
金祖旭,李敏波[6](2010)在《基于用户反馈的搜索引擎排名算法》一文中研究指出以Web 2.0中用户行为作为研究对象,通过发掘用户反馈方式,提出用户反馈分值的概念,对用户反馈影响搜索结果排名的具体方法以及相应实现进行研究,提出了一种基于神经网络的网页排序算法。该算法引入BP神经网络模型,根据用户反馈分值选择样本训练神经网络。将传统搜索结果输入到经过训练的神经网络进行计算,根据计算出的结果所表示的网页相关性强弱判断后进行二次排序。该算法利用了神经网络具有的模式识别能力,有效地将用户反馈和搜索引擎结合起来,使得搜索结果更加符合用户的搜索要求。(本文来源于《计算机系统应用》期刊2010年11期)
潘明远,方金云,章立生[7](2010)在《基于用户反馈的POI搜索引擎优化研究》一文中研究指出随着互联网经济的迅猛发展,PO(IPoint Of Interest)搜索成为空间信息服务业发展的核心技术之一。提高用户满意度无疑是POI搜索引擎的最终目标。通过挖掘用户访问日志,建立反馈相似度模型,可提高搜索结果准确度,优化POI搜索引擎。通过理论分析,该方法在不增加计算时间的基础上提高了搜索结果的准确性。最后将该方法应用于中国科学院计算技术研究所地理信息中心自主研发的通图(www.tongmap.cn)地图搜索引擎中,结合实际数据测试,说明该方法在优化POI搜索引擎方面是行之有效的。(本文来源于《计算机工程与应用》期刊2010年32期)
江婕,李建民,曾勍炜[8](2010)在《基于用户反馈的个性化搜索引擎的研究》一文中研究指出现有搜索引擎基本上采用"搜索适用所有用户"的模型,体现不出用户真正的兴趣所在。针对当前搜索引擎的不足,本文提出并研究一个基于用户反馈的个性化搜索引擎系统。通过学习用户满意度反馈信息,挖掘隐藏的用户兴趣信息,实现搜索引擎的个性化。(本文来源于《计算机与现代化》期刊2010年06期)
金祖旭[9](2010)在《基于用户反馈的搜索引擎排名算法研究》一文中研究指出在过去的几年中,随着互联网的高速发展,搜索引擎的作用与日俱增,越来越多的互联网用户开始选择搜索引擎作为其获得网络资源的首选工具。但是,搜索引擎的表现并不总是尽如人意。很多时候,当用户输入一个查询词,搜索引擎会返回成千上万的搜索结果,而其中只有很少一部分甚至没有网页是符合用户需求的。如何理解用户的搜索意图,找出符合用户需求的网页,并将最相关的网页置于搜索结果的前列,这成为众多学者研究的重要课题。本文以Web 2.0中用户行为作为研究对象,通过挖掘用户反馈方式,提出用户反馈分值的概念,对用户反馈影响搜索结果排名的具体方法以及相应实现进行研究,并提出了一种基于神经网络的网页排序算法。该算法引入BP神经网络模型,根据用户反馈分值选择样本训练神经网络。将传统搜索结果输入到经过训练的神经网络进行计算,根据计算出的结果所表示的网页相关性强弱判断后进行二次排序。该算法利用了神经网络具有的模式识别能力,有效的将用户反馈和搜索引擎结合起来,使得搜索结果更加符合用户的搜索要求。本文设计开发了基于用户自定义关键词链接关系的搜索排名系统—“网标搜索”,并利用用户反馈对原系统基于Lucene搜索排名算法基础上的搜索结果进行二次排序。系统在排序过程中对有用户反馈的网页链接利用boost因子调整排名分值,对没有用户反馈的网页链接则使用神经网络的方法进行调整排序。文章结合用户反馈进行实验,对实验前后结果进行比较分析,为将来搜索领域中对用户反馈研究提供借鉴与参考的价值。(本文来源于《复旦大学》期刊2010-05-20)
吴小兰[10](2010)在《基于有效反馈结果的元搜索引擎调度策略》一文中研究指出本文给出了有效反馈结果的定义,根据该定义提出了一种元搜索引擎的调度策略,该策略是根据用户提交查询的有效查询结果和成员引擎的响应性能,计算出各成员引擎的权值,调整元搜索引擎系统调用成员引擎的序列,并通过实验仿真证明该策略是有效的。(本文来源于《科技信息》期刊2010年12期)
反馈式搜索引擎论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
日新月异的计算机技术给人们带来了崭新的生活体验与工作方式。随着网络带宽的增加,用户可以更加快速的利用互联网对网站进行访问,但互联网中庞大的数据量也使得用户在查询特定消息的过程如同大海捞针。因此,一个全新的信息搜索技术“搜索引擎”应时而生,并在短时间内得到快速的发展和改进。由于互联网中多媒体版块的不断丰富,用户对搜索内容便有了更多的需求。其中为了满足用户对图像搜索的要求,从之前发展比较成熟的基于文字的图像搜索技术,到现在逐渐完善的基于内容的图像搜索技术,各种各样基于互联网图像的搜索技术蓬勃发展。通常,用户在搜索图像时,最为关心的便是搜索到的结果与用户的期望值是否相符。因此本文结合了基于文字和基于内容的搜索引擎的技术特点,提出了基于相关反馈的搜索引擎并加以实现。首先介绍了图像搜索系统的相关背景和研究意义,其次简单描述了搜索系统要用到的关键技术,包括链接爬取、内容提取、图像爬取、索引建立等等,以此为开发出一个完整的搜索系统提供了必要的理论和技术准备。本文在第叁章中详细阐述了基于相关反馈的搜索引擎的框架结构,它包含用户接口模块、图像处理模块、数据爬取模块,并在这些模块中添加了用户的相关反馈机制。第四章在第叁章所提出的框架与流程的基础上具体实现了相关功能。在数据搜索模块,本文通过在爬取过程中使用HtmlUnit插件,解决了一般Spider只能爬取静态页面而无法解析动态页面的问题。在图像处理模块,本文在特征提取方面侧重于图像低层次特征的提取,通过使用感知哈希算法,对图像的形状、纹理特征以数字的形式呈现出来。最后通过相关测试,检验了所有模块的功能,验证了本文所提搜索引擎与其它搜索引擎相比具有较高的查准率。本论文为实践应用型研究型论文,目的在于研究和实现基于相关反馈的图像搜索系统。它在传统的搜索系统模式之外另辟蹊径,改进了搜索系统的查准率与查全率,同时还改善了用户在搜索过程中的体验度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
反馈式搜索引擎论文参考文献
[1].张春玲,姜成晶.利用ε-贪婪学习和用户行为反馈的搜索引擎网页排序算法[J].计算机应用研究.2019
[2].刘申嘉.基于相关反馈的图像搜索引擎的研究与实现[D].南京邮电大学.2016
[3].徐树振.聚类反馈式电网资源分布搜索引擎研究与实现[D].昆明理工大学.2014
[4].沈敏.基于自动文摘与用户反馈的个性化搜索引擎系统的研究与设计[D].天津大学.2012
[5].轩春青.基于客户反馈的FTP搜索引擎的研究与设计[D].郑州大学.2011
[6].金祖旭,李敏波.基于用户反馈的搜索引擎排名算法[J].计算机系统应用.2010
[7].潘明远,方金云,章立生.基于用户反馈的POI搜索引擎优化研究[J].计算机工程与应用.2010
[8].江婕,李建民,曾勍炜.基于用户反馈的个性化搜索引擎的研究[J].计算机与现代化.2010
[9].金祖旭.基于用户反馈的搜索引擎排名算法研究[D].复旦大学.2010
[10].吴小兰.基于有效反馈结果的元搜索引擎调度策略[J].科技信息.2010