多样性搜索论文-严国莉,王保林,王新增,王胜利

多样性搜索论文-严国莉,王保林,王新增,王胜利

导读:本文包含了多样性搜索论文开题报告文献综述及选题提纲参考文献,主要关键词:信息检索,搜索引擎,多样性检索,查询子意图

多样性搜索论文文献综述

严国莉,王保林,王新增,王胜利[1](2019)在《基于查询子意图进行匹配的多样性搜索创新研究》一文中研究指出互联网快速发展,信息技术日新月异,人们已进入了一个信息爆炸的时代。人们获取的知识只是知识库里很小的一部分,网页搜索是必然发生的事情。多样性搜索已经逐渐成为提高网页搜索效率和用户满意度的一个重要因素。论文提出了一种基于查询子意图进行匹配的多样性搜索创新研究算法。该算法首先根据网页检索日志构建用户的行为模型,然后根据用户输入的查询词,挖掘出用户的查询子意图。同时,基于查询结果的关键词对传统查询结果重排序。最后将排序后的结果和用户查询子意图进行匹配,挖掘出满足用户需要的搜索结果,并排序展现给用户,从而给用户提供了多样化的搜索结果。(本文来源于《信息系统工程》期刊2019年09期)

谢一帆[2](2016)在《基于垂直领域的分布式搜索多样性的研究与实现》一文中研究指出自21世纪以来,信息技术和计算机网络取得了重大的进步,海量数据和信息过载使得用户要从如此多的资讯中检索出感兴趣的内容变得越来越困难。而随着信息存储的压力不断增大,分布式系统也应运而生,与此同时也给传统的检索系统和搜索引擎带来了一系列新的挑战。其中一部分的挑战来自于用户搜索要求包含的多样性,这使得检索系统不仅需要快速且准确的把握用户检索的信息来自哪一垂直领域,即满足用户查询多样性;同时也需要考虑信息的正确性以覆盖用户的需求。而将分布式搜索系统与多样性相结合,就成为解决当前诸多挑战的答案。基于现今分布式搜索引擎的结构,本文在垂直领域选择,资源选择以及结果融合叁个方面,结合检索信息的多样性,提出了多种可行的算法,为用户提供更具针对性的服务。本文主要的研究工作包括:(1)在垂直领域选择方面,本文提出词向量判断法和扩展词汇排序法的垂直领域选择算法,在扩展查询词的同时,对垂直领域进行关键词提取,并根据两者的相似度进行垂直领域的选择。实验结果表明本文提出的两种算法与之前已有的垂直领域选择方法相比,在准确率和召回率方面有了一定的提升。(2)在资源选择方面,本文提出两种资源库描述方法,LDA主题描述和TF-IDF资源描述法,结合资源描述法提出了资源库选择算法框架,该框架同时结合垂直领域选择结果,对用户输入查询进行资源库选取。实验结果表明,本文提出的资源库选择算法能够有效地应用于真实复杂的网络搜索引擎的分布式环境,并取得优异的效果。(3)在查询结果的融合方面,本文基于垂直领域特性以及查询词多样性的特性,提出了一种基于文档,资源库,垂直领域叁个维度的特征计算的结果融合算法框架,该框架使用改进的CORI算法和线性融合算法进行最终的结果融合分数计算。算法体现了查询结果多样性以及准确性,与已有的方法相比,在搜索结果的准确率,召回率以及n DCG值方面取得了不错的表现和较大的提升。本文在上述研究的基础上,验证了本文提出的叁个领域算法能够有效地提高系统的正确率,并保证了多样化的反馈效果,证明了系统能够满足用户多角度查询的需求。(本文来源于《华南理工大学》期刊2016-04-27)

李晓荣[3](2016)在《最大和网络搜索结果多样性问题及其贪婪策略分析》一文中研究指出随着网络技术的迅猛发展,网民人数的不断增多,互联网资源库中的信息也在呈指数倍地上涨,搜索引擎作为人们在海量信息中获取有效信息的重要检索工具正在受到越来越多人的青睐。在实际检索过程中,用户体验到搜索引擎带来的便捷的同时,也感受到了大量无效信息所带来的困扰,用户常常需要在庞大的结果集合中对信息进行筛查、选择或者细化检索内容,才能定位到自己感兴趣的信息。一方面,由于用户在关键词的“输入长度”、信息结果的“浏览长度”等方面具有“懒惰性”,利用关键词对所需信息进行查询时,用户往往通过给定较少的关键词,要求搜索引擎在结果的前几页显示自己所需信息。另一方面,关键词本身具有广泛的语义、搜索系统一次呈现结果存在数量上的限制。因此,系统常常不能快速地呈现用户的真实需求,返回多而繁杂的搜索结果集不仅耗费了用户大量的时间,还降低了用户的搜索效率。论文从提高搜索引擎效率,提高用户检索满意度的角度,考虑了不仅产生同搜索关键词相关,而且各个结果之间最好应具有能够覆盖关键词多个意义的网络搜索结果呈现问题,给出了该问题的贪婪策略,分析证明了贪婪策略具有的近似性能比。论文的主要研究工作如下:1、本文从搜索结果集合的相关性和多样化两个角度出发,建立了搜索结果多样性问题的数学模型。通过对问题模型的求解分析,得出该问题的算法结果集合,并将其与问题的最优结果集合进行比较,证明策略的有效性。同时,分析了余弦距离相似度条件下搜索结果多样性问题的近似性能比。2、用户往往是通过对搜索结果集合进行筛选而寻找到所需信息,对信息的筛选就是浏览信息的过程,浏览量越多,结果集合同关键词的总体相关性就越高,但每条信息给用户带来的边际满意度随之而降低。针对这一情况,运用非负的单调次模集合函数度量搜索结果问题的相关性,在此基础上建立数学模型,设计了贪婪策略,研究了单调次模情形下的网络搜索结果多样性问题,分析证明贪婪策略具有较好的近似性能比。3、在日新月异的网络信息世界中,不同的时间点用户对同一关键词的信息需求可能会不一样。为了满足用户不断变化的信息需求,本文将通过对静态结果集合中元素的调整,研究信息具有动态性特征的网络搜索结果有效呈现问题。4、为了验证策略的有效性,我们根据近似思想对其进行了仿真实验,实验结果表明,贪婪算法具有很好的理论近似比。本文的分析及结论丰富了现有的搜索结果多样性问题的研究,为相关问题的进一步深入探索奠定了理论基础,对实际搜索结果多样性问题具有一定的理论指导意义。(本文来源于《电子科技大学》期刊2016-04-05)

陈飞,刘奕群,张敏,马少平[4](2015)在《基于查询子主题分类的多样性搜索评价方法》一文中研究指出多样化检索结果的评测通常假设一个查询词包含多个权重各不相同的用户子意图,并在此假设的基础上对检索结果进行评测.虽然大多数已经存在的多样化检索评测方法利用了这些特性对检索结果进行评测,但在评测过程中,它们都忽略了查询子意图的类型信息;而不同类型的查询子意图对信息需求具有不同的特点.首先,通过引入衰减函数对这种特点进行描述,进而对用户子意图的分类方法进行抽象;在此基础上,提出了利用查询子意图类型信息进行多样化检索结果评测的框架,该框架定义了利用查询子意图类型信息进行多样化检索评测的方法应该具有的结构;然后,讨论了在用信息类和导航类作为子意图分类方法的前提下,其对应的衰减函数的形式;最后,在TREC与NTCIR测试集上的实验结果表明了所提出方法的有效性.(本文来源于《软件学报》期刊2015年12期)

王蕾,潘丰[5](2014)在《改进多样性和局部优化能力的引力搜索算法》一文中研究指出针对引力搜索算法局部搜索能力较弱,搜索过程容易出现早熟的现象,提出一种基于多样性和局部优化能力协同优化的引力搜索算法。将粒子群算法中局部最优解和细菌趋化中排斥操作的概念引入到引力搜索算法中,通过帮助粒子接近最优位置和逃离最差位置,改进了搜索算法中粒子的局部优化能力及种群多样性,并使用标准函数进行测试。结果表明,该算法能够实现全局搜索与局部搜索的平衡,最大程度地保持种群多样性,提高算法搜索能力。(本文来源于《计算机工程》期刊2014年08期)

李伟生,代飞[6](2013)在《基于增加最优优先搜索多样性的研究》一文中研究指出针对最有优先搜索单一依赖启发式函数指导搜索,使得搜索陷入局部最优和高原状态而不能有效改善规划解,提出了一种增加最优优先搜索择多样性的方法。将开列表分成包含不同启发式信息的多列表,进而增加开列表选择的多样性。为了增加状态节点选择的多样,一次扩展多个列表中的状态节点,不仅仅扩展最优状态节点。实验结果表明,增加搜索的多样性后,规划解的质量有了一定的改善。(本文来源于《计算机工程与设计》期刊2013年09期)

黄鉴,彭其渊[7](2013)在《多样性保持的和声搜索算法及其TSP求解》一文中研究指出为了改善和声记忆库群体多样性,提高算法的全局寻优能力,在度量群体多样性指标的基础上,从参数动态调整方法、和声记忆库更新策略两个方面对基本和声搜索算法进行了改进,提出了多样性保持的和声搜索算法,并将该算法应用于TSP的求解。结合TSP问题特点,设计了基于交换和插入算子的和声微调方法。实例优化结果表明,改进后的算法不容易陷入局部最优,优化性能显着提高。(本文来源于《计算机应用研究》期刊2013年12期)

王涌鑫,王希武,钟启艮[8](2013)在《一种基于搜索多样性的改进蚁群算法研究》一文中研究指出传统蚁群算法是以正反馈策略进行指导,实质上这种指导有利于算法的收敛却不利于搜索的多样性。为了缩短寻优路径,论文通过提高搜索多样性提出了一种改进的蚁群算法。该算法,正反馈、逆反馈同时作用使得整个蚁群的搜索空间和搜索结果的多样性大大增加,蚁群搜索的时间大大减少。通过对TSP问题的仿真结果表明,新算法对解决复杂组合优化问题具有显着效果。(本文来源于《计算机与数字工程》期刊2013年06期)

陈相如[9](2013)在《针对结构化商品数据的多样性搜索系统的设计与实现》一文中研究指出近年来,网络购物越来越受到互联网用户的欢迎。在购物的过程中,用户使用关键字在商品搜索引擎中搜索需要的商品、商品附件、以及相关的商品。但现有的互联网搜索引擎给出的最相关结果往往比较相似,无法满足用户多样性的需求。本文为解决搜索结果多样性的问题,提出了一系列的搜索结果重排序算法。首先,对商品搜索结果的每个类别进行针对商品属性多样性的重排序,将搜索结果中的不同属性值的数量作为优化的目标,并通过将优化问题转化为加权最大覆盖问题得到近似算法。之后合并不同类别的商品搜索结果,同时在类别的维度进行多样性重排序,将搜索结果中商品的平均距离作为优化目标,并通过将优化问题转化为设施分散问题得到近似算法。然后对搜索结果进行针对商品来源的多样性重排序,通过引入针对相同来源商品的罚分定义了优化目标,并给出了一个基于归并排序的最优化算法。以上述多样性重排序算法为基础,本文提出了一个面向商品多样性的搜索系统,并详细讲解了系统的部分技术实现。文中的重排序算法在搜索系统中作为查询处理的后续步骤。最后,本文通过在真实商品数据上的实验证明了多样性重排序算法和搜索系统的有效性。(本文来源于《上海交通大学》期刊2013-01-11)

李靖[10](2012)在《基于随机游走的图像多样性搜索重排序算法研究》一文中研究指出近些年来随着互联网的发展,网络上出现的数据呈现出爆炸式的增长,特别是图像数据。图像具有直观、生动的特性,且与人类生活息息相关,因此如何能够准确地获取所需图像信息是当前多媒体搜索领域需要重点解决的问题。目前主流的搜索引擎主要是依靠图像的标题、描述等元数据信息进行基于文字信息的图像搜索,并没有利用图像的视觉特性,因此搜索结果并不理想。为了使结果更加符合用户的需求,图像搜索重排序算法被提出应用于图像搜索领域。该技术是指在原始文本搜索的基础之上,再次结合图像本身的信息对原始的重排序结果进行重新重排序,以提高用户的搜索体验。目前的大多工作围绕图像的相关性搜索重排序展开,对多样性搜索重排序的研究较少。相关性重排序是指对于返回结果来说,都是将相关的样本排在结果集的前列,但是很少考虑样本相互之间的联系,而多样性重排序是为了提高返回结果的多样性,也就是覆盖主题的多样性,以降低相关重排序中带来的信息冗余问题。本文主要利用随机游走模型实现图像搜索的多样性重排序。具体工作如下:1)实现了基于图像的搜索相关性重排序算法,能够使产生的结果按照相关性进行重排序。2)提出了基于DivRank算法的图像多样性重排序算法。DivRank是自定义的随机游走模型,通过引入访问次数随时间增长的马尔科夫数学模型来完成多样性重排,能够有效的降低搜索结果之间的冗余信息。为此,我们将其应用于图像领域并提出相应的GDRID算法。3)提出了基于DDRank的图像多样性重排序算法。DDRank是基于DivRank算法的改进,它通过修改初始重排序的权值来降低DivRank所带来的永久破坏原始信息网络结构的副作用,能够在保证多样性的基础上兼顾相关性。为此,我们将其应用在图像领域并提出相应的DIR算法。通过在MSRA_V-1.0等数据库上的大规模实验,表明所提GDRID和DIR算法能够在有效保持图像搜索相关性的前提下,提高多样性性能。(本文来源于《天津大学》期刊2012-11-01)

多样性搜索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

自21世纪以来,信息技术和计算机网络取得了重大的进步,海量数据和信息过载使得用户要从如此多的资讯中检索出感兴趣的内容变得越来越困难。而随着信息存储的压力不断增大,分布式系统也应运而生,与此同时也给传统的检索系统和搜索引擎带来了一系列新的挑战。其中一部分的挑战来自于用户搜索要求包含的多样性,这使得检索系统不仅需要快速且准确的把握用户检索的信息来自哪一垂直领域,即满足用户查询多样性;同时也需要考虑信息的正确性以覆盖用户的需求。而将分布式搜索系统与多样性相结合,就成为解决当前诸多挑战的答案。基于现今分布式搜索引擎的结构,本文在垂直领域选择,资源选择以及结果融合叁个方面,结合检索信息的多样性,提出了多种可行的算法,为用户提供更具针对性的服务。本文主要的研究工作包括:(1)在垂直领域选择方面,本文提出词向量判断法和扩展词汇排序法的垂直领域选择算法,在扩展查询词的同时,对垂直领域进行关键词提取,并根据两者的相似度进行垂直领域的选择。实验结果表明本文提出的两种算法与之前已有的垂直领域选择方法相比,在准确率和召回率方面有了一定的提升。(2)在资源选择方面,本文提出两种资源库描述方法,LDA主题描述和TF-IDF资源描述法,结合资源描述法提出了资源库选择算法框架,该框架同时结合垂直领域选择结果,对用户输入查询进行资源库选取。实验结果表明,本文提出的资源库选择算法能够有效地应用于真实复杂的网络搜索引擎的分布式环境,并取得优异的效果。(3)在查询结果的融合方面,本文基于垂直领域特性以及查询词多样性的特性,提出了一种基于文档,资源库,垂直领域叁个维度的特征计算的结果融合算法框架,该框架使用改进的CORI算法和线性融合算法进行最终的结果融合分数计算。算法体现了查询结果多样性以及准确性,与已有的方法相比,在搜索结果的准确率,召回率以及n DCG值方面取得了不错的表现和较大的提升。本文在上述研究的基础上,验证了本文提出的叁个领域算法能够有效地提高系统的正确率,并保证了多样化的反馈效果,证明了系统能够满足用户多角度查询的需求。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多样性搜索论文参考文献

[1].严国莉,王保林,王新增,王胜利.基于查询子意图进行匹配的多样性搜索创新研究[J].信息系统工程.2019

[2].谢一帆.基于垂直领域的分布式搜索多样性的研究与实现[D].华南理工大学.2016

[3].李晓荣.最大和网络搜索结果多样性问题及其贪婪策略分析[D].电子科技大学.2016

[4].陈飞,刘奕群,张敏,马少平.基于查询子主题分类的多样性搜索评价方法[J].软件学报.2015

[5].王蕾,潘丰.改进多样性和局部优化能力的引力搜索算法[J].计算机工程.2014

[6].李伟生,代飞.基于增加最优优先搜索多样性的研究[J].计算机工程与设计.2013

[7].黄鉴,彭其渊.多样性保持的和声搜索算法及其TSP求解[J].计算机应用研究.2013

[8].王涌鑫,王希武,钟启艮.一种基于搜索多样性的改进蚁群算法研究[J].计算机与数字工程.2013

[9].陈相如.针对结构化商品数据的多样性搜索系统的设计与实现[D].上海交通大学.2013

[10].李靖.基于随机游走的图像多样性搜索重排序算法研究[D].天津大学.2012

标签:;  ;  ;  ;  

多样性搜索论文-严国莉,王保林,王新增,王胜利
下载Doc文档

猜你喜欢