时态信息检索论文-沈思,李成名,吴鹏

时态信息检索论文-沈思,李成名,吴鹏

导读:本文包含了时态信息检索论文开题报告文献综述及选题提纲参考文献,主要关键词:信息检索,时态语义,检索模型,时间戳

时态信息检索论文文献综述

沈思,李成名,吴鹏[1](2018)在《基于时态语义的Web信息检索实践进展与研究综述》一文中研究指出基于时态语义的Web信息检索在动态时间信息挖掘、群体记忆、时间问答系统等检索情景中具有相对广泛的应用。在大数据和人工智能迅猛发展的大趋势下,对基于时态语义的Web信息检索从关键技术的角度进行系统而全面的综述,不仅有利于了解该领域研究的整体状况,而且有益于把握时态检索的未来发展趋势。本文在引入文本时间信息的抽取和标注并融合时间信息的检索模型的基础上,以时态语义的技术为整体脉络,从叁个方面综述研究情况:信息需求中隐含的时间意图分析,加入时间因素的检索模型构建,时间对提升检索结果的生成。以时态语义检索的本源问题和其在学术文献上的相关应用为切入点,提出时态语义检索未来的发展趋势:识别多源异构信息下的时间表达,构建能识别查询的时间预测模型,搭建能精准检索时间意图的检索平台和开发基于深度学习的隐含时间意图自动分类模型。(本文来源于《中国图书馆学报》期刊2018年04期)

张晓民[2](2017)在《基于关键词的关系数据库时态信息检索方法研究》一文中研究指出随着大数据时代的来临,大量积累的数据已成为了各行各业重要的数据资产。时间是体现数据价值的重要指标,时态数据越来越得到人们的关注。因此如何对时态数据进行有效的存储、管理和检索已成为数据库和信息检索领域研究的热点。数据库信息检索技术是数据库和信息检索的交叉领域,可以有效的支持普通用户在数据库上高效地进行关键词检索,该领域已取得了众多的研究成果。时态信息检索领域研究表明,通过将时态信息融入信息检索技术,可以有效地处理用户的时态查询,快速、高效地检索用户所需要的信息。然而现有的关系数据库关键词检索方法未考虑数据时态性,缺乏对时态数据的检索。因此针对这一问题,本文从时间维度出发,研究关系数据库上基于关键词的时态信息检索方法。首先,介绍时态信息处理的相关理论,为本文时态检索方法的研究提供思路和理论支持。然后,在原有关系数据库关键词检索方法基础上,引入时间维度提出了时态信息检索模型,设计了基于关键词的关系数据库时态信息检索方法。该方法包括叁部分内容:(1)通过分析数据库中存储的时态实体和实体之间的时态关系,构建时态数据图;(2)由于现有的索引方法不能满足时态关键词结点的快速查找,设计了时态倒排索引,该索引通过对每个关键词对应的时态结点集合进行时态分区来提高查找效率;(3)设计了时态检索算法T-STAR,该算法主要采用时间修剪策略,对不满足时态约束的边进行修剪,保证检索结果满足时态查询的时间约束,同时,提出了时态边权重的计算方法,更好的满足检索结果的内容相关性。最后,实现了基于关键词的关系数据库时态检索原型系统,利用Employees和NBA时态数据集从P@K和MAP两个评价指标对本文提出的方法进行了实验评估。实验结果表明了该方法在保证检索效率的前提下,有效提高了数据库信息检索效果,满足用户的时态检索需求。(本文来源于《大连海事大学》期刊2017-02-01)

李筱文[3](2011)在《基于时态语义的Web信息检索关键技术研究》一文中研究指出时间是信息空间中很重要的一个维度。大部分的网页中均包含时态信息,许多Web查询也包含时态查询信息。这些时态信息在Web信息检索和网页聚类中具有很重要的作用。将时态信息融入信息检索技术中是搜索引擎发展的潮流和趋势。然而目前主流的搜索引擎并没有充分考虑到网页中包含的时态信息,特别是在结果网页排序和网页聚类中忽略了时态信息的作用。因此,研究基于时态语义的Web信息检索技术对于提高搜索引擎的搜索效果、推进Web信息检索技术的发展具有重要的研究意义。利用网页中时态信息进行网页排序和网页聚类是近年来研究的热点。在网页排序方面,传统的信息检索主要利用网页文本与查询相似度进行排序。然而,基于文本的检索将用户时态查询部分视为普通文本进行处理,而忽略了网页中的内容时间与关键词之间的联系。而在网页聚类方面,传统的算法主要根据文本中同时出现的短语进行聚类,而没有考虑到同时将网页中的时态信息呈现给用户,满足用户多样的需求。如果在网页排序和聚类研究中充分利用时态信息,则可以有效提高搜索引擎的性能和用户体验。本文围绕时态信息检索中的若干关键技术开展研究,重点研究了基于时态语义的网页排序技术和基于主题的时态网页聚类技术。本文的主要贡献为:(1)通过分析网页中关键词和内容时间之间的联系,设计了一个<关键词,内容时间>映射算法。该算法将网页中每个关键词找到与其对应的内容时间。对于网页中的隐式时间,通过回溯算法找到其相对参照时间,从而将该隐式时间转化为内容时间范围。该算法为后面的排序算法奠定了基础。(2)提出了两种时态排序算法CT-Rank(Content-Time-based Ranking)和NTLM(a New Temporal Language Model)。CT-Rank算法是基于经验的网页时态排序算法。在脱机阶段,根据映射算法得到的<关键词,内容>对,对网页中的每个关键词计算有时间约束的关键词TF-IDF值。联机处理用户查询时,算法结合了网页中的叁种因素:Pagerank值,标题排序分数以及时间约束的关键词分数得到最终的网页排序分数。NTLM算法是基于时态语言模型的网页排序算法。该算法将时态信息融入语言模型中,根据网页中的关键词和时态信息推导出用户文本查询和时态查询的概率,对网页进行排序。实验表明,这两种算法性能在时态排序方面均优于传统排序算法和对比算法,并有良好的用户评价。(3)提出了一种新闻网页搜索结果的时态主题聚类算法。该算法克服了传统聚类算法仅给出文本聚类信息的问题,在使用基于主题的聚类算法得出聚类结果后,在每一个类别中再进行时态聚类,将每一类中包含的网页分布在时间轴中。实验表明通过这种聚类形式,用户可以很容易的发现新闻的时间发展过程,并迅速找到关注的新闻主题。(本文来源于《中国科学技术大学》期刊2011-04-01)

时态信息检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着大数据时代的来临,大量积累的数据已成为了各行各业重要的数据资产。时间是体现数据价值的重要指标,时态数据越来越得到人们的关注。因此如何对时态数据进行有效的存储、管理和检索已成为数据库和信息检索领域研究的热点。数据库信息检索技术是数据库和信息检索的交叉领域,可以有效的支持普通用户在数据库上高效地进行关键词检索,该领域已取得了众多的研究成果。时态信息检索领域研究表明,通过将时态信息融入信息检索技术,可以有效地处理用户的时态查询,快速、高效地检索用户所需要的信息。然而现有的关系数据库关键词检索方法未考虑数据时态性,缺乏对时态数据的检索。因此针对这一问题,本文从时间维度出发,研究关系数据库上基于关键词的时态信息检索方法。首先,介绍时态信息处理的相关理论,为本文时态检索方法的研究提供思路和理论支持。然后,在原有关系数据库关键词检索方法基础上,引入时间维度提出了时态信息检索模型,设计了基于关键词的关系数据库时态信息检索方法。该方法包括叁部分内容:(1)通过分析数据库中存储的时态实体和实体之间的时态关系,构建时态数据图;(2)由于现有的索引方法不能满足时态关键词结点的快速查找,设计了时态倒排索引,该索引通过对每个关键词对应的时态结点集合进行时态分区来提高查找效率;(3)设计了时态检索算法T-STAR,该算法主要采用时间修剪策略,对不满足时态约束的边进行修剪,保证检索结果满足时态查询的时间约束,同时,提出了时态边权重的计算方法,更好的满足检索结果的内容相关性。最后,实现了基于关键词的关系数据库时态检索原型系统,利用Employees和NBA时态数据集从P@K和MAP两个评价指标对本文提出的方法进行了实验评估。实验结果表明了该方法在保证检索效率的前提下,有效提高了数据库信息检索效果,满足用户的时态检索需求。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

时态信息检索论文参考文献

[1].沈思,李成名,吴鹏.基于时态语义的Web信息检索实践进展与研究综述[J].中国图书馆学报.2018

[2].张晓民.基于关键词的关系数据库时态信息检索方法研究[D].大连海事大学.2017

[3].李筱文.基于时态语义的Web信息检索关键技术研究[D].中国科学技术大学.2011

标签:;  ;  ;  ;  

时态信息检索论文-沈思,李成名,吴鹏
下载Doc文档

猜你喜欢