查询重构论文-孙丽,邱丽亚

查询重构论文-孙丽,邱丽亚

导读:本文包含了查询重构论文开题报告文献综述及选题提纲参考文献,主要关键词:查询重构,满意度,查询重构类型,点击行为

查询重构论文文献综述

孙丽,邱丽亚[1](2018)在《查询重构行为与满意度关系研究》一文中研究指出对查询重构行为和满意度的关系进行研究,包括查询重构情境、查询间隔时间、查询重构类型、点击网页数量,以及点击网页位置与满意度之间的关系,进而为查询系统优化提供依据。使用屏幕录像软件记录用户查询重构过程,采集实验数据。运用统计学方法分析查询重构行为变量与满意度的关系。结果显示:在原始查询存在满意结果情境下,查询重构满意度更高;查询间隔时间增加,满意度下降;不同查询重构类型下,用户满意度存在一定差异,其中详细化和平行移动查询重构满意度最高;用户点击结果列表页面越多,找到满意结果的概率越低;用户点击网页位置为2时,满意度比例最高,在点击位置大于2后,满意度随点击位置下降。(本文来源于《情报理论与实践》期刊2018年07期)

张晓娟[2](2018)在《利用嵌入方法实现个性化查询重构》一文中研究指出作为能引导用户表达信息需求的机制,查询重构主要基于用户所提交的历史查询来生成相关候选查询重构列表。为了使得候选查询能与用户最初意图保持一致,当前大多数的查询重构方法方法是根据查询词之间的共现信息来获得查询词的上下文信息,再利用上下文的相似性来生成候选查询推荐,最后通过对查询中词之间的语义一致性建模来对实现候选查询进行排序。而本文中以利用嵌入方法来实现个性化查询重构,即首先利用查询词嵌入技术为每个查询获得该词上下文信息的词向量,再利用词向量进一步构建表征用户偏好的向量,从而基于词向量与用户向量实现根据用户偏好生成候选查询;本文进一步采用主题嵌入来抽取每个潜在主题的上下文信息,最后利用隐马尔可夫模型(HMM)融合词向量、用户向量和主题向量来实现根据用户偏好对候选查询的排序。实验结果表明,本文的方法优于已有相关方法。(本文来源于《情报学报》期刊2018年06期)

王月瑶[3](2018)在《面向医疗文本检索的查询重构技术研究与实现》一文中研究指出数据的爆炸式增长促进了信息技术的快速发展,在传统的医疗行业中,信息化的进程也广受关注。临床决策支持系统是一个医疗信息技术的应用系统,可以将病人描述作为查询找到相关文档,辅助医生做判断。通过这些技术手段,临床决策支持系统可以有效挖掘医疗中的深层数据,提高医疗服务的效率,降低医疗的事故率。查询重构一直是文本检索领域的热点问题。但过去关于查询重构技术的研究工作,主要侧重于查询扩展技术的研究。查询扩展技术能有效解决词不匹配问题,在短文本查询中行之有效。但在医疗文本检索中,由于作为查询的电子病历以自由文本的形式存储,包含着丰富而复杂的病人描述信息,可能存在信息干扰或信息冗余的问题,仅使用查询扩展技术不能有效解决这个问题。对此,本文研究了面向医疗文本检索的查询缩减技术,第一次针对查询进行分类,从而结合查询扩展和查询缩减的技术手段,优化现有的查询重构算法,为查询重构提供了新的思路。本文的具体工作和研究成果包括:1.设计了面向医疗文本的四种查询类型,并建立相应的语义映射工具。本文深入研究了查询词中医学词和否定词的作用,设计了四种查询类型,分别是正向类型的查询、负向类型的查询、停用词类型的查询和普通类型的查询。基于此建立了语义映射工具,用于支持后续的查询重构算法。语义映射工具依赖于医疗文本的特性,将查询词自动标注为相应的查询类型。2.创新性地提出查询分类,设计了基于阈值划分的查询重构算法。本文针对医疗长文本查询存在的问题,创新性地提出了查询分类的思想,设计实现了基于阈值划分的查询重构算法,第一次结合了查询扩展和查询缩减技术。基于阈值划分的查询重构算法将查询中的句子作为处理的候选集。首先,利用语义映射工具对候选集进行自动标注。然后,根据标注结果通过阈值的自动选择将句子分为两类,分别是需要查询扩展的类别和需要查询缩减的类别。最后是针对不同类别相应地修改检索模型的分数,实现查询重构。通过本文设计的实验证明,基于阈值划分的查询重构算法,对比利用原始查询和伪相关反馈查询扩展后的查询,检索效果均有所提升。3.提出了基于无监督学习的查询重构算法。为了挖掘查询词的潜在含义,本文在阈值划分查询分类的基础上,引入无监督学习的查询分类,提出了基于无监督学习的查询重构算法。首先,计算查询中每个句子的重要性。然后利用无监督分类算法对查询自动分类,同样分为两类,分别是需要查询扩展的类别和需要查询缩减的类别。最后结合查询扩展和查询缩减技术实现查询重构。实验证明,基于无监督学习的查询重构算法能更深入理解查询词的意图,达到更优的效果。在2016年的TREC CDS公开数据集上,与原始查询相比,NDCG指标提升了22.88%。最后,基于本文提出的两个查询重构算法,我们开发搭建了一个医疗电子病历的查询重构原型系统。该系统可以对比两种算法的异同,并可视化展示本文的实验结果。(本文来源于《华东师范大学》期刊2018-05-20)

孙丽,刘强[4](2018)在《用户主题熟悉度对网络查询重构行为的影响——基于用户实验研究》一文中研究指出查明用户主题熟悉度对网络查询重构行为的影响,可以为网络个性化服务提供依据。通过问卷调查获取用户熟悉度数据,通过屏幕录像软件记录网络查询重构行为数据,采用统计学方法分析用户主题熟悉度对网络查询重构行为的影响,研究结果显示,高熟悉度用户在查询重构时更偏向于使用增词重构,重构类型中详细化应用最多,低熟悉度用户则使用更多的是减词重构,一般化为最常见的重构类型,高熟悉度用户重构时间更长,关键词变化数也更多,低熟悉度用户则会保存更多的页面。(本文来源于《情报理论与实践》期刊2018年03期)

毕仁敏[5](2018)在《多设备环境下图书馆OPAC查询重构研究》一文中研究指出多设备环境下,用户搜索时会选择不同的设备。在搜索任务复杂时,用户还可能转移到不同的设备上进行搜索。用户在不同设备上的搜索行为呈现出了不同的特点,表明设备和检索系统对用户搜索行为产生影响。本研究探索多设备环境下用户OPAC搜索查询重构行为,有利于为OPAC智能化搜索提供一些启发和建议。本研究收集了手机、平板电脑、桌面端大规模用户访问日志,通过统计分析,对比不同设备上检索点的差异、查询重构策略和模式的差异,并分析跨设备搜索查询重构模式的特点,分析总结不同设备上差异出现的原因。研究发现,不同设备上查询重构策略所占比重不同;桌面端查询重构模式的数量和种类要远远高于手机和平板电脑端;桌面端各类查询重构模式占比相对均匀,手机端查询重构模式占比则集中于几种突出的重构模式;桌面端平均重构次数要大于手机和平板电脑;随着查询重构次数的增加,不同设备上查询重构复杂度逐渐接近;用户查询从桌面端转移到移动端是最典型的方式,不同的查询重构模式展现了不同的跨设备时长。本研究根据多设备OPAC查询重构的特点,对OPAC智能化搜索提出了一些建议。移动端OPAC可以优化交互界面,设置网页标签,改进输入法,为用户提供多样化的输入方式;桌面端OPAC可以在界面提供更多的提示性内容;OPAC系统可以根据词库自动提示拼写错误以及给出更正选项;根据不同设备,兼顾检索点的概率和搜索成功率,设置检索点的数量、位置和排列形式;OPAC系统可以在用户重新选择检索点和返回主页面两种操作中,保留原有查询式,提供隐藏的清零符号“X”;根据用户输入的前几个字母或单词以及系统中大多数用户的检索历史,提供建议选项,方便用户直接选择;研究查询重构模式,预测查询转移,为用户自动推荐查询式。(本文来源于《武汉大学》期刊2018-03-01)

杨文[6](2017)在《基于排序学习和查询重构的全文检索模型研究》一文中研究指出随着数字信息的爆炸式增长,我们迫切需要采用更为高效的方法来查找所需要的信息,这种情况不仅仅是体现在互联网领域中,由于台式计算机的数据存储量也随着硬盘存储能力的提高而激增,这种情况也出现在政府,学校,大型公司的文档管理事务中。现如今这些机构或公司一般是通过数据库中集成的like语句对文档进行搜索,或者是在全文检索工具库比如Lucene的基础上开发出一套知识库管理系统。然而这些方式所提供的搜索功能都是基于关键字的简单匹配,搜索效果并不理想。通过研究信息检索技术的发展进程,发现通过查询扩展或者深度挖掘文本语义的方法来提升检索效果较为有效,于是本文提出了一种将排序学习和查询重构相结合的全文信息检索模型ListGate。论文的主要研究工作如下:(1)论文引入word2vec和LDA这两种能够挖掘文本语义的方法,其中word2vec用于在词向量空间中对原始查询进行重构,将重构查询作为原始查询的扩展,而LDA产生的主题特征被融入到排序学习方法中提升评分函数的效果,同时为了解决查询重构中存在的主题偏移问题,原始查询和重构查询之间的主题偏移可以通过它们在word2vec和LDA生成的语义空间中的距离进行衡量。(2)通过对List Net排序学习算法的改进,提出了不能考虑主题偏移的ListSum模型,然后通过分析ListSum模型的不足进一步提出了能够考虑主题偏移ListGate模型,并给出ListGate模型中使用到的TFIDF,BM25,语言模型,LDA主题模型评分规则的定义,查询重构的算法以及原始查询和重构查询之间主题偏移特征的计算方法。(3)推导出ListGate中神经网络权值在随机梯度下降方法下的权值更新公式,并使用Java语言实现了List Gate模型的学习过程,然后在数据集上进行了实验。实验结果表明,加入了LDA特征的评分网络比没有加入LDA特征的评分网络最后产生的评分函数表现要好,同时引入了主题偏移特征后产生的评分函数效果比直接将原始查询和重构查询的得分线性相加的效果要好。(本文来源于《重庆大学》期刊2017-04-01)

王文斌,顾君忠,周子力,张非凡[7](2016)在《电子病历检索中基于词权调整的查询重构》一文中研究指出电子病历EMR(Electronic Medical Records)检索是信息检索研究中的一个新领域。医学术语在电子病历检索中占有重要地位,通常用来限定检索条件、表达用户的检索意图。针对这种情况,提出一种基于医学术语权重调整的查询重构方法,以提高电子病历检索的性能。该方法首先从原始查询语句中筛选出医学术语,然后使用自信息来度量每个医学术语的权重,最后将加权的医学术语与原始查询语句按照一定的权重比例结合,构造出新的查询语句。将该方法在TREC数据集上进行实验,结果表明与原始查询结果相比,重构后的查询结果在MAP、bpref和P10这叁项指标上,分别提高了14.2%、10.1%和9.6%,验证了该方法的有效性。(本文来源于《计算机应用与软件》期刊2016年04期)

吴家丽[8](2015)在《基于用户意图识别的查询重构研究》一文中研究指出如今,搜索引擎能够帮助用户从网络上获取所需信息,大大地缓解用户信息焦虑。但是用户输入的查询词简短,容易产生模糊歧义性,基于查询关键字匹配的搜索引擎无法识别一词多义情况。查询重构技术是识别查询词背后真正用户意图的一个解决方案。然而,在查询重构技术中,会话切分的方法存在一定缺陷,基于会话共现信息生成的候选查询,更容易偏离原查询的用户意图,导致通过查询重构识别的用户意图存在交叉重迭问题。通过对查询重构相关的理论和技术进行深入研究,基于AOL查询日志,构造了用户意图识别的查询重构模型。该模型主要解决如何进行用户意图的切分、如何识别出能表达原查询用户意图的查询重构、如何对识别的用户意图进行聚类等叁个问题。由于现有的算法存在一些不足,论文重点对构造的模型进行改进,具体如下:该模型总共分叁部分:查询日志的会话切分、计算原查询词查询重构及查询重构聚类。第一部分,为了解决词汇相似度问题,融入查询间点击相似性特征。第二部分,为了解决查询重构表达不准确问题,另外考虑查询间的时间距离及查询间点击相似性等因素来计算原查询与候选查询关系。第叁部分,针对查询重构识别的用户意图存在交叉重迭问题,提出查询重构聚类方法。然而,伴随聚类也产生两个问题:查询重构向量维数稀疏性和转移概率计算不准确性。为了解决查询重构向量维数稀疏性的问题,通过对会话中查询重构词和点击URL构造Query-URL图,引入吸收态的马尔科夫随机游走模型对图建模。为了解决转移概率计算不准确的问题,综合考虑URL、排序号、顺序号叁方面因素,参考TF-IDF思想定义了类似的CF-IQF模型计算图中边的权重。然后计算吸收态分布,构建查询重构向量,最后利用查询重构向量的余弦相似度结合complete link算法实现聚类。通过对本模型各部分算法进行对比实验验证,结果表明本模型算法具有一定的优越性。(本文来源于《哈尔滨工程大学》期刊2015-12-01)

李纲,胡蓉[9](2014)在《信息搜寻中用户查询重构研究综述》一文中研究指出基于信息搜寻中人机交互行为,从查询重构类型与模式、查询重构绩效、查询重构影响因素及查询式扩展技术4个方面综述国内外关于用户查询重构的研究。得出结论:基于查询重构模式研究,可获悉用户偏向使用的查询重构序列;结合查询重构影响因素和重构序列,可向不同群体用户推荐高概率的查询词,但该研究也存在一定的局限;尽管从检索系统角度,查询重构得到不少学者的广泛关注,但关于用户如何重构查询的研究在中文文献中尚未见到。(本文来源于《图书情报工作》期刊2014年11期)

王新军,闫实,彭朝晖,李庆忠[10](2014)在《Extractor:支持查询重构的高效数据库关键词检索系统》一文中研究指出数据库关键词检索由于具有简便易用的特点,成为数据处理中的一项关键技术和研究热点.目前已有的技术还存在着时间复杂度高、检索结果不够精准等问题.针对存在的问题,本文建立了基于关系数据库的关键词检索系统Extractor.Extractor改进了传统的数据图结构,提出了新的top-k结果树生成和排序机制,提出了基于词关系的查询重构方法.实验证明Extrator具有较好的检索效果和较高检索效率.(本文来源于《电子学报》期刊2014年02期)

查询重构论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

作为能引导用户表达信息需求的机制,查询重构主要基于用户所提交的历史查询来生成相关候选查询重构列表。为了使得候选查询能与用户最初意图保持一致,当前大多数的查询重构方法方法是根据查询词之间的共现信息来获得查询词的上下文信息,再利用上下文的相似性来生成候选查询推荐,最后通过对查询中词之间的语义一致性建模来对实现候选查询进行排序。而本文中以利用嵌入方法来实现个性化查询重构,即首先利用查询词嵌入技术为每个查询获得该词上下文信息的词向量,再利用词向量进一步构建表征用户偏好的向量,从而基于词向量与用户向量实现根据用户偏好生成候选查询;本文进一步采用主题嵌入来抽取每个潜在主题的上下文信息,最后利用隐马尔可夫模型(HMM)融合词向量、用户向量和主题向量来实现根据用户偏好对候选查询的排序。实验结果表明,本文的方法优于已有相关方法。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

查询重构论文参考文献

[1].孙丽,邱丽亚.查询重构行为与满意度关系研究[J].情报理论与实践.2018

[2].张晓娟.利用嵌入方法实现个性化查询重构[J].情报学报.2018

[3].王月瑶.面向医疗文本检索的查询重构技术研究与实现[D].华东师范大学.2018

[4].孙丽,刘强.用户主题熟悉度对网络查询重构行为的影响——基于用户实验研究[J].情报理论与实践.2018

[5].毕仁敏.多设备环境下图书馆OPAC查询重构研究[D].武汉大学.2018

[6].杨文.基于排序学习和查询重构的全文检索模型研究[D].重庆大学.2017

[7].王文斌,顾君忠,周子力,张非凡.电子病历检索中基于词权调整的查询重构[J].计算机应用与软件.2016

[8].吴家丽.基于用户意图识别的查询重构研究[D].哈尔滨工程大学.2015

[9].李纲,胡蓉.信息搜寻中用户查询重构研究综述[J].图书情报工作.2014

[10].王新军,闫实,彭朝晖,李庆忠.Extractor:支持查询重构的高效数据库关键词检索系统[J].电子学报.2014

标签:;  ;  ;  ;  

查询重构论文-孙丽,邱丽亚
下载Doc文档

猜你喜欢