搜索意图论文-严国莉,王保林,王新增,王胜利

搜索意图论文-严国莉,王保林,王新增,王胜利

导读:本文包含了搜索意图论文开题报告文献综述及选题提纲参考文献,主要关键词:信息检索,搜索引擎,多样性检索,查询子意图

搜索意图论文文献综述

严国莉,王保林,王新增,王胜利[1](2019)在《基于查询子意图进行匹配的多样性搜索创新研究》一文中研究指出互联网快速发展,信息技术日新月异,人们已进入了一个信息爆炸的时代。人们获取的知识只是知识库里很小的一部分,网页搜索是必然发生的事情。多样性搜索已经逐渐成为提高网页搜索效率和用户满意度的一个重要因素。论文提出了一种基于查询子意图进行匹配的多样性搜索创新研究算法。该算法首先根据网页检索日志构建用户的行为模型,然后根据用户输入的查询词,挖掘出用户的查询子意图。同时,基于查询结果的关键词对传统查询结果重排序。最后将排序后的结果和用户查询子意图进行匹配,挖掘出满足用户需要的搜索结果,并排序展现给用户,从而给用户提供了多样化的搜索结果。(本文来源于《信息系统工程》期刊2019年09期)

杨杰,徐越,余建桥,蒋建华[2](2019)在《基于搜索引擎日志的用户查询意图分类》一文中研究指出为了搜索引擎能提供高质量检索,提出了一种查询意图自动分类模型。该模型将用户查询分为咨询、学术、资源、服务、导航和热点6类,建立了一套查询意图分类体系;在传统搜索引擎系统中加入查询意图处理模块,通过对用户查询意图的查询词信息(Qi)、点击URL信息(Cu)和基于某分类的URL点击排序(Cr)3个分类特征进行统计分析,提取其特征向量,进而推断出用户查询意图。通过在Sogou数据集上的试验表明,各类信息的查询分类效果F值均大于0.8,取得了较好的分类效果。(本文来源于《指挥信息系统与技术》期刊2019年02期)

朱明奇[3](2019)在《基于垂直搜索的意图识别算法的设计与实现》一文中研究指出垂直搜索是一种专业领域内的搜索,与通用搜索不同,垂直搜索需要深度理解用户意图并返回特定领域内的信息。由于垂直搜索引擎中需要针对不同领域训练多个意图识别模型,同时训练模型需要大量的标注,所以在垂直搜索场景下训练意图识别模型的代价是较高的。本文主要解决在垂直搜索场景下训练意图识别模型成本大的问题。作者的主要工作包括基于SimNet的语义向量预训练和基于迁移学习的意图识别模型训练。(1)基于SimNet的语义向量预训练,主要利用搜索引擎积累的海量数据,预训练基于语义的句向量。作者利用本文首创的QUQ(Query to Url to Query)游走算法获取大量的弱标注样本,通过海量样本训练SimNet模型,最终根据SimNet模型生成语义向量。经过实验验证,语义向量可以很好的表达句子语义,并具有一定的泛化性。(2)基于迁移学习训练意图识别模型,主要利用预训练的语义向量迁移到意图识别模型中,并且利用主动学习与迁移学习减少标注成本。首先将样本转化为语义向量并利用种子样本初始化意图识别模型,然后利用改进后的最优标号与次优标号(Best vs Second-best,BvSB)算法,降低了样本冗余并且挑选出信息量较高的样本,最后利用该样本训练意图识别模型。经过实验验证,利用迁移学习训练意图识别模型,可以减少一半以上的标注成本;利用改进的BvSB算法挑选样本,可以进一步降低标注成本,并提高模型的准确率。百度垂直搜索已经有大小十余个领域利用本文工作训练意图识别模型,训练成本有很大幅度的减少。相关模型已经应用到百度搜索中,提升了上亿搜索用户的搜索体验。(本文来源于《北京交通大学》期刊2019-05-01)

马瑞[4](2018)在《用户搜索意图引导下的Web网页动态泛化》一文中研究指出基于搜索情况对每位用户搜索信息需求进行分析,从而提出了基于用户搜索意图的web网页动态化模型,主要目的就是对web网络动态化创建模型关键词及文档格式层次进行搜索,以此以用户访问提供搜索导航,但是并不是为了得到用户搜索意图,而是创建用户搜索意图中web网页泛化。基于此,本文对用户搜索意图引导web网页动态泛化进行分析。(本文来源于《计算机产品与流通》期刊2018年05期)

崔婉秋,杜军平,周南,梁美玉[5](2017)在《基于用户意图理解的社交网络跨媒体搜索与挖掘》一文中研究指出随着在线社交网络的盛行,网络用户不仅对信息资讯的获取速度和实时性提出了更高的要求,对个性化和精确化的搜索需求日益增长。为了提升搜索引擎的质量以及其结果列表的准确性,需要深层次地挖掘用户搜索意图。本文分析了用户搜索意图理解在线社交网络跨媒体进行精准搜索与挖掘的研究现状,包括知识图谱在线社交网络多模态信息感知、面向用户搜索意图匹配的跨媒体大数据深度语义学习方面的应用,以及用户搜索意图理解的在线社交网络精准搜索与挖掘的应用等。最后,对未来研究存在的问题和可能面临的挑战进行了展望。(本文来源于《智能系统学报》期刊2017年06期)

石刚[6](2016)在《一种基于知识图谱的用户搜索意图挖掘方法的研究》一文中研究指出如何让计算机理解用户的搜索意图是一个非常复杂的问题,因为,针对相同查询,不同人的搜索意图可能差异巨大;对同一搜索意图,不同人使用的查询可能完全不同。为了实现对特定查询搜索意图的理解,可以通过使用分析查询记录,建立兴趣模型的方法,但这也不能帮助理解新的查询词,因为用户的意图并不是固定的主题,需求意图在不断演变。即使用户输入的是同一查询词,也并不代表作用户想知道的是关于相同主题的信息、资源或网络服务。基于分类的搜索意图挖掘是目前搜索意图挖掘研究领域的主流,首先建立意图分类体系,然后将查询文本归类到这些类别之中。目前主流的搜索意图类目体系已经构建得比较完善,但是由于通常情况下用户的查询都很短,带有一定歧义性,分类特征有限,在这种情况下进行文本分类比较困难,目前面对这种情况还没有一种特别有效的分类特征提取方法。本文提出一种基于知识图谱的搜索意图挖掘方法,使用知识图谱包含的词间关联来对用户查询中的关键词进行权重调整,从而提高分类准确率,提高搜索意图挖掘效果。经过实验,与数种经典权重调整方法相比较,证实本文提出的方法能够有效的提升分类准确率,对用户搜索意图挖掘效果提高有较大帮助。相信,经过后续研究,使用该方法对交互式信息检索和实时人机对话也将会有不错的效果。(本文来源于《国际关系学院》期刊2016-05-01)

田蒂[7](2016)在《基于用户检索意图的元搜索引擎研究》一文中研究指出网络数据每天都以人们所无法想象的速度衍生,网络数据的海量生产与高速传播,已使现有信息检索技术显得不尽人意。虽然信息检索水平已得到了很大的提高,然而面对网络数据的爆炸式增长,各检索工具的覆盖面、查准率逐步下滑。海量数据背景下,现有的搜索引擎已经完全不能满足用户对信息检索系统“准确性”、“高效性”的检索需求。为了获取准确的信息,用户只能通过花费大量时间,多次调用不同的检索工具。元搜索引擎的出现在一定程度上缓和了单个搜索引擎“查全率”低的矛盾,但以冗长的结果列表形式为用户呈现出各搜索引擎的检索结果,使得用户再次陷入“查询结果过载”的困境。为有效地提高检索系统的“查准率”、“查全率”,将数据挖掘、机器学习、人工智能技术应用于信息检索,实现检索工具的人性化、智能化已成为解决信息获取矛盾的新方案。构建中文搜索引擎,其中一项重要的技术指标就是:查询语句的语义理解,通过对查询语句进行语义分析,明确用户实际的信息需求。基于用户查询意图提供信息查找服务可以极大程度地提高查询结果的质量。元搜索引擎的构建必须明确信息检索的工作过程和各机制的内部实现原理,了解国内外关于元搜索的研究和发展水平,同时还应把握信息检索工具今后的发展趋势。本论文的主要研究工作为:首先,基于自然语言处理技术分析用户检索意图,明确用户查询目的,提取用户查询关键词;基于开放目录树,分析用户检索主题,然后依据主题相关性为用户提供搜索引擎调度策略;其次,基于投票理论计算各记录的全局相关性;然后,基于改进的后缀树算法对Web检索结果进行层次化聚类,利用特征词的共现频率和用户查询意图关键词提取类标识,依次递归生成层次化聚类结果。(本文来源于《吉林大学》期刊2016-05-01)

张杨浩[8](2016)在《基于搜索引擎日志的查询意图分类研究》一文中研究指出在信息资源呈爆发式增长的二十一世纪,浩瀚的网络资源给用户提供了丰富多样的上网体验。但是,对不同的用户来说,要从如此多而杂的网络资源中高效找到能满足自己需求的信息,就变得越来越困难;对信息服务者来说,如何准确且快速地获取所需信息,是其不断努力的方向。搜索引擎作为用户获取相关信息的重要工具,能帮助用户快速定位到互联网资源,并能直接返回与其信息需求相关的文档。但是,当前的搜索引擎的搜索模式大都是基于关键字匹配的,加之用户向搜索引擎输入的简短查询存在模糊性和歧义性,使得用户的查询意图在搜索引擎中不能被有效地识别。为了有效识别用户的查询意图,现有的相关工作主要包含如何构建分类体系以及如何在给定分类体系下进行查询意图分类。本文基于搜索引擎查询日志信息,对Broder分类体系进行了细化,并着重研究分类特征的分类性能。首先,考虑到搜索引擎中呈现的查询信息特点,对Broder关于用户查询意图分类体系中太泛化的信息类和事务类进行了细分与重新定义,利用K-means聚类,获得了新的查询意图分类体系包括:导航类、咨询类、资源类、服务类、热点类。其次,为了从用户搜索行为中推断出用户查询意图,本文选取了查询词信息(Qi)、点击URL信息(Cu)和URL点击排行(Cr)作为查询意图分类特征,并根据这叁类特征所构成的特征向量来判断用户查询具体属于分类体系中的哪一个类别。鉴于用户查询数据自身的特点,采用SVM分类器LIBSVM,利用提取的叁类特征对训练数据集进行训练获得SVM分类模型。最后,由于各类分布的不均匀性,在采用信息检索领域常用的准确率和召回率指标对查询意图的分类效果进行评价的同时,为了使评价结果更加客观,增加了评价指标F值。在实验中,主要对本文提出方法的整体分类效果进行分析,另外还探讨了单层面的特征对分类效果的影响。在利用测试集数据验证分类效果的评估实验中,取得了较高的准确率和召回率,且F值均大于0.8,说明本文方法在识别用户查询意图方面具有可行性。(本文来源于《西南大学》期刊2016-04-22)

孙逸凡[9](2016)在《基于移动搜索日志的用户搜索位置意图的研究》一文中研究指出随着移动互联网的快速发展,移动搜索领域成为现今的一个研究热点。在个人语音助手的不断涌现下,移动搜索的市场份额已经占据了一半以上。越来越多的手机应用开始试图获取手机的位置信息,以此来提高用户的搜索体验。然而,即使获取了用户的位置信息,还是不够的,还需要判断查询语句是否带有位置意图,判断获取的位置信息是否对搜索有帮助,对哪些类型的搜索有帮助,因此,如何判断搜索查询语句的位置意图,成为解决问题的关键点。在此背景下,本文提出了对移动搜索的位置意图进行分类的思想。根据搜索语句的位置意图的不同,分布进行相应的辅助操作,只有这样,才能完整的正确的解决搜索语句的位置意图问题。在本文中,我们把搜索的位置意图分为叁类:首先,第一类为“固定位置意图的查询”。此类查询语句的特点是它们总是和一个固定的地点名词相关联,位置意图是确定的,不随环境变化的。例如查询词“天安门”、“自由女神像”、“黄山”,他们的位置意图分别为“北京”、“纽约”和“安徽”。这类查询的关键词多是一些着名的景点、大学、知名建筑物、政府机关等等。这类查询所需要的辅助信息是各自相应的地点名词,且是唯一的。接着,第二类为“本地意图的查询”。此类查询的特点是用户想搜索在自己附近的或者所在城市的信息。这一类的查询例如:“附近的宾馆”、“火车站”、“房价”、“天气预报”等等。这类查询所需要的辅助信息是用户所在的地理位置信息。最后,第叁类为“无位置意图的查询”。此类查询并不需要地理位置作为辅助信息,直接搜索即可。例如:“诸葛亮”、“红楼梦”、“搞笑视频”等等。针对第一类查询的识别,我们设计了包含词频和占比两个因子的选择函数,通过设定一定的占比阈值,并同时调节词频的变化,获得了大量的查询词和地点名词组成的二元组,并达到了91%的准确率。针对第二类和第叁类的分类问题,我们采用了文本分类的流程,通过分词、去除停用词、特征选择、分类等步骤,得到了很好的分类效果。其中,我们设计了新的特征选择函数FEICHI,并和五种基础的特征选择函数做了对比实验,证明了新方法的正确性和优越性。接着,我们针对“本地意图查询”的分类问题,把我们的结果和其他两位学者的方法做了对比实验,并证明了我们的方法的优越性。最后,我们做了一系列的辅助性实验,采用了多个数据集合,多个数据划分方法和不同的特征集合大小,从另外叁个方面再次证明了新方法的可靠性,稳定性和优越性。(本文来源于《中国科学技术大学》期刊2016-04-18)

杨丹,申德荣,陈默[10](2015)在《基于地理-时间意图和偏好的个性化Web搜索框架GT-WSearch》一文中研究指出基于Web查询的地理位置、时间查询意图和用户偏好的个性化Web搜索可以改善Web搜索结果,更好地满足不同用户的信息需求。提出了GT-WSearch个性化Web搜索框架,它通过挖掘搜索结果、用户点击数据和对查询进行分析得到的用户概貌和查询概貌,来捕捉用户的地理-时间的意图和偏好,提高搜索质量。用户概貌表明了查询自身的地理-时间的特性。GT-WSearch框架在排序函数中利用文档的地理位置、时间的相关度来进行个性化搜索。最后将使用线性的相关度排序函数进行重新排序的搜索结果返回给用户。大量实验结果表明,所提出的个性化方法在提高Web搜索结果的质量中取得了明显的效果。(本文来源于《计算机科学》期刊2015年07期)

搜索意图论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

为了搜索引擎能提供高质量检索,提出了一种查询意图自动分类模型。该模型将用户查询分为咨询、学术、资源、服务、导航和热点6类,建立了一套查询意图分类体系;在传统搜索引擎系统中加入查询意图处理模块,通过对用户查询意图的查询词信息(Qi)、点击URL信息(Cu)和基于某分类的URL点击排序(Cr)3个分类特征进行统计分析,提取其特征向量,进而推断出用户查询意图。通过在Sogou数据集上的试验表明,各类信息的查询分类效果F值均大于0.8,取得了较好的分类效果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

搜索意图论文参考文献

[1].严国莉,王保林,王新增,王胜利.基于查询子意图进行匹配的多样性搜索创新研究[J].信息系统工程.2019

[2].杨杰,徐越,余建桥,蒋建华.基于搜索引擎日志的用户查询意图分类[J].指挥信息系统与技术.2019

[3].朱明奇.基于垂直搜索的意图识别算法的设计与实现[D].北京交通大学.2019

[4].马瑞.用户搜索意图引导下的Web网页动态泛化[J].计算机产品与流通.2018

[5].崔婉秋,杜军平,周南,梁美玉.基于用户意图理解的社交网络跨媒体搜索与挖掘[J].智能系统学报.2017

[6].石刚.一种基于知识图谱的用户搜索意图挖掘方法的研究[D].国际关系学院.2016

[7].田蒂.基于用户检索意图的元搜索引擎研究[D].吉林大学.2016

[8].张杨浩.基于搜索引擎日志的查询意图分类研究[D].西南大学.2016

[9].孙逸凡.基于移动搜索日志的用户搜索位置意图的研究[D].中国科学技术大学.2016

[10].杨丹,申德荣,陈默.基于地理-时间意图和偏好的个性化Web搜索框架GT-WSearch[J].计算机科学.2015

标签:;  ;  ;  ;  

搜索意图论文-严国莉,王保林,王新增,王胜利
下载Doc文档

猜你喜欢