上下文检索论文-缪永伟,胡争光,孙瑜亮,张旭东,刘震

上下文检索论文-缪永伟,胡争光,孙瑜亮,张旭东,刘震

导读:本文包含了上下文检索论文开题报告文献综述及选题提纲参考文献,主要关键词:卷积神经网络,线画图,图像分类,图像匹配

上下文检索论文文献综述

缪永伟,胡争光,孙瑜亮,张旭东,刘震[1](2019)在《结合分类卷积神经网络和形状上下文的线画图检索》一文中研究指出传统线画图检索中仅仅利用线画图形状特征信息导致检索准确率不高,为了高效、准确地从线画图数据集中检索相似的线画图,提出一种结合分类卷积神经网络和形状上下文的线画图检索方法.首先利用大卷积核的分类卷积神经网络对线画图像数据集进行分类训练任务得到神经网络权值参数,使用该网络结构提取数据集中每张线画图的卷积特征信息;然后根据用户在画图板上绘制得到的简单线画图输入,利用卷积神经网络进行二次分类得到前15种最相似的分类,并结合形状上下文算法对15种分类匹配相似度并取前8种分类;最后使用卷积神经网络提取用户输入的线画图特征信息并与8种分类中的线画图特征信息进行匹配,根据相似度大小排序得到线画图匹配结果.基于Caffe卷积神经网络开发框架,采用TU-Berlinsketchbenchmark线画图数据集进行实验的结果表明,该方法能高效、准确地从数据集中检索得到相似线画图,同时能保证检索结果集中于最相似的几种类别且同类型中能有更多的选择.(本文来源于《计算机辅助设计与图形学学报》期刊2019年04期)

陈琴[2](2018)在《基于上下文的信息检索若干关键技术研究》一文中研究指出基于上下文的信息检索技术自从诞生以来,一直广受学术界和工业界的关注。从信息量上看,该技术充分利用各种上下文信息,有效缓解了传统信息检索中由于查询短、用户信息需求难以理解的问题。从检索排序上看,该技术提供了更多样化的匹配方式,除了传统的基于查询关键词的匹配外,还关注所涉及的上下文信息之间的匹配。上下文信息来源多种多样,主要包括设备上下文、时空上下文、用户上下文、任务上下文和文档上下文。其中,文档上下文由于其获取更方便、内容更丰富的特点,在基于上下文的信息检索中处于十分重要的地位。然而,关于文档上下文的信息检索研究还存在很多不足,比如语义理解不够准确、上下文粒度比较粗等。另外,大多数研究集中在如何将上下文信息融入传统排序模型中,对于近几年在信息检索领域崭露头角的神经网络排序模型,由于其内部复杂的结构,与上下文信息的融合还没有得到很好的研究。因此,本文以文档上下文为中心,针对以上存在的不足,分别从主题、时间、位置、对齐等常见的上下文信息维度进行了更深入的研究,在准确度和粒度上都取得了明显改善。除了改进传统的基于上下文的检索排序模型外,还探索了如何将上下文信息融入到神经网络排序模型中,在各项评价指标上取得了显着提升。具体来讲,本文的主要贡献如下:1.提出了基于上下文片段主题的排序方法。本文研究了利用伪相关反馈文档中的上下文片段而非一个个独立的词建模查询主题的有效性。首先,探索了叁种上下文相关性度量方法,识别出与查询相关的优质上下文片段。然后,提出了一种上下文感知主题模型,通过从相应的伪相关反馈文档而不是整个语料库来推断片段的主题分布,使得主题建模更准确。最后,将得到的片段的主题分布融入检索排序模型中,极大地提升了检索准确率。2.提出了基于上下文细粒度时间的排序框架。本文提出了基于上下文细粒度时间的排序框架,该框架除了包含传统的文档级别的时间预测器外,还包含本文提出的词级别的时间预测器,捕获了更细粒度的时间信息。与已有的基于上下文时间的检索模型相比,基于本文排序框架改进的模型检索结果更准确,鲁棒性更强。3.提出了基于上下文位置注意力的神经网络排序模型。本文首次尝试将上下文位置信息融入到基于循环神经网络模型的注意力机制中,并应用于信息检索的答案选取任务。通过在高维隐层空间对问题中词的上下文位置信息进行建模,缓解了传统注意力机制由于语义累积带来的偏见问题,显着提升了候选答案的排序效果。4.提出了基于上下文对齐的神经网络排序模型。本文在神经网络框架下,研究了上下文对齐信息对于句子相似度建模的有效性。具体来说,本文提出了一种基于上下文对齐的循环神经网络排序模型,在当前句子的隐层状态生成过程中,通过内部的上下文对齐门自动吸收另一个句子中对齐词的上下文信息,从而实现了两个句子上下文之间的深度交互。同时,也减少了无关上下文的引入,有效提升了句子相似度排序的准确率。(本文来源于《华东师范大学》期刊2018-03-01)

杨醒龙[3](2018)在《基于上下文一致性的拷贝图像检索研究》一文中研究指出拷贝图像是指对原始图像进行裁剪、压缩、旋转、图像迭加或者其他变换操作产生的新的图像。这些新的图像有着一个共同的特征:新图像的一部分或者全部来自于被拷贝的图像。拷贝图像的存在不仅给网络版权带来了巨大的冲击,而且大量的拷贝图像占用了大量的存储空间,图像的重复存储造成了存储资源的浪费。如何快速而准确的找出拷贝图像,是图像检索领域的一个重要研究方向。目前,拷贝图像检索中主流方法为:以局部特征表述图像,采用视觉词袋模型进行拷贝图像检索。然而,此类方法在局部特征量化为视觉词汇时存在信息损失,导致了视觉词汇的歧义现象。针对上述视觉词汇的歧义现象,提出了一种构建近邻上下文的拷贝图像检索方法。该方法首先以距离和尺度关系为标准,选择图像中某局部特征周围的特征点作为该特征点的近邻特征点。然后,以近邻特征点的信息为该局部特征构建上下文描述子,并通过计算上下文描述子之间的相似性对局部特征匹配对进行验证。最后,以正确匹配特征点的个数衡量图像间的相似性,并选取若干相似性较高的候选图像作为返回结果。该方法属于先验证方法,因此有较高的执行效率。为进一步提高拷贝图像的检索效果,本文提出了一种基于全局上下文的拷贝图像检索方法。该方法在检索时,首先以视觉词汇的匹配提取候选图像。然后,以候选图像中其他匹配的局部特征作为全局上下文特征点。对于候选局部特征匹配对,采用投票的方式进行验证:若一定量的上下文局部特征与该特征点满足关系一致性约束,则认为该局部特征点为正确匹配的特征点。最后,通过统计正确匹配的特征点获得的总票数来衡量候选图像与待检索图像间的相似性。实验结果证明,基于全局上下文的方法可以取得更好的检索效果。(本文来源于《杭州电子科技大学》期刊2018-01-01)

周叶华[4](2017)在《结合上下文特征的LaTeX公式检索方法》一文中研究指出公式的语义识别是公式检索结果中的重要因素,而对含有歧义公式能正确识别与否,会直接影响检索系统的查准率。实现歧义公式的具体含义的确定,有利于为用户提供更准确的检索结果。在公式检索中,为了提供符合用户需求的语义信息检索结果,提高检索的准确率,需要结合上下文的特征对LaTeX公式进行检索。针对检索系统的歧义公式问题,提出一种结合上下文特征的检索方法。首先,根据文档中公式的位置,确定文本说明的范围,对公式上下文说明进行分词处理,然后将提取出来的描述公式的上下文内容的词进行标注放入数据集。最后,与数据库中的列表进行匹配,按照匹配度高低排序,并插入到搜索结果序列中。实验结果表明,该方法在实际应用中能够有效解决LaTeX形式中有歧义公式的语义识别问题。(本文来源于《河北大学》期刊2017-05-01)

吴蕴泽[5](2015)在《基于BIM的建设工程文档上下文信息检索研究》一文中研究指出在建设领域的文档管理过程中,由于文档的信息量巨大,且包含大量的非结构化信息,使得可操作性差,缺乏重用性和交互性,导致文档信息不能被充分利用以发挥其应有的作用。现阶段对文档的信息查找主要依靠人工查找和关键字检索。人工查找耗时且准确率低;由于缺乏语义,使用关键字检索会查找出大量冗余信息同时会漏检相关的重要信息。因此,如何从这些海量的信息,尤其是非结构化信息中快速、准确地检索出所需求的信息,是当前建设领域文档管理所面临的重要问题。随着BIM技术的快速推广,BIM集成了所有项目信息并使用IFC数据文件进行信息交换,通过把BIM中的信息与文档集成可有效地解决建设领域的文档管理问题。同时,上下文信息检索把有关用户信息、查询的上下文知识与信息检索技术进行有效地融合,以便向用户提供最适合其需求的信息。其中,赋予语义信息的本体是最主流的上下文建模方法之一。根据以上几个方面,本文提出了基于BIM的建设工程文档上下文信息检索方法。首先,本文提出了自动构建IFC本体的方法。研究了IFC的描述语言EXPRESS与本体描述语言OWL之间的异同,通过映射将IFC文件转换为OWL式,转换后的OWL文件可直接导入protege5.0中自动生成本体,为上下文本体建模提供有效的方法。其次,本文提出了基于Jena的上下文推理过程。通过设置谓词逻辑、推理前提以及通用的推理规则来辅助推理。在Jena推理机中分别进行基于本体的推理和基于规则的推理,将蕴含在上下文中的有效信息提取出来,用户可以充分利用这些信息来解决实际问题。最后,本文构建了基于BIM的建设工程文档上下文信息检索系统,并通过实例验证了系统的可行性和有效性。本文以JHA文档为例,构建了JHA-IFC本体,设置了自定义推理规则,在Jena工具盒中进行上下文推理。查询检索的运行结果表明该系统可以检索出与需求信息有关的上下文信息,极大地提高了施工安全管理的效率,同时提高了建设领域文档信息的重用性。(本文来源于《大连理工大学》期刊2015-05-01)

吴晓雨,何彦,杨磊,张宜春[6](2015)在《基于改进形状上下文特征的二值图像检索》一文中研究指出提出了改进的形状上下文算法以克服传统的形状上下文算法不具备旋转不变性这一缺点。该算法利用找寻包含采样点数最多的角度区间的方式改变图像角度,对相对应的区域进行比较,并计算匹配代价,从而为形状上下文加入旋转不变性。为提高运算速度,算法也引入了剪枝方法,解决了进行直方图距离计算时遍历采样点的问题。实验显示,本文的算法在公开数据库上测试得到的精确度召回率(PR)曲线与郑提出算法的PR曲线性能接近,但是计算速度较其提升了近1倍;与传统的形状上下文算法相比,提出算法的PR曲线更为优越,且检索精度有较大提高。因此,提出的算法综合检索性能更好,能够有效地的应用于二值图像检索领域。(本文来源于《光学精密工程》期刊2015年01期)

胡扬波,袁杰,王李冬[7](2014)在《基于增强微结构和上下文相似度的图像检索》一文中研究指出针对图像检索中多特征综合描述子维度过高且综合权值难以确定的缺点,提出一种新的基于增强微结构和上下文相似度的图像检索方法。首先,使用一种新的局部模式映射来创建过滤图;然后,基于该图上的颜色共生关系提取增强微结构描述子,该描述子综合了多种特征而维度与单特征相同,检索时使用此描述子计算图像对间的规范距离得出初始的有序相似图像序列;最后,结合迭代上下文相似度对检索序列进行重新排序。当迭代次数为50且考虑前24幅结果图像时,在Corel-5000和Corel-10000图像集上的实验结果显示,所提方法与同类型的多重基元直方图(MTH)和微结构描述子(MSD)方法相比,检索查准率分别提高了13.14%、7.09%和11.03%、6.8%。结果表明新方法能在维度不变的情况下综合多种特征并充分利用上下文信息,从而有效提高图像检索的准确率。(本文来源于《计算机应用》期刊2014年10期)

徐海博[8](2014)在《基于上下文相关的图像检索方法研究》一文中研究指出随着多媒体信息技术的飞速发展,图像资源越来越多地出现在人们的工作和生活当中,如何能够快速确地在庞大的图像资源库中查询到所需信息已经成为计算机视觉领域的一个重大挑战。为了便于人们识别和查找图像,因此产生了基于内容的图像检索技术,本文主要对其中的上下文相关的检索方法进行了研究。本文首先介绍了基于内容图像检索相关技术的基础知识。在图像特征提取方面,本文介绍了颜色、形状、纹理特征提取原理和常用方法;图像特征匹配方面,本文介绍了欧氏距离、马氏距离、加权欧氏距离等常用距离度量公式。在对基于内容的图像检索基本技术的掌握和理解的基础上,为了降低检索时间消耗,本文提出了一种新的上下文敏感图像检索框架,该框架将图像检索分为两个阶段:第一阶段为离线处理阶段,在进行图像检索之前,先将图像库进行聚类分组,建立图像库聚类索引。本文采用一种上下文相关的聚类方法,根据结点的度大小先进行初始划分,再使用凝聚聚类方法将初始划分的类进行迭代合并。为了减少图像库预处理时间,本文提出了改进方法,主要思想是先取出部分元素进行聚类,再将剩下部分划分到已知聚类中,改进后聚类时间消耗比原始方法节省50%以上。第二阶段为线上处理阶段,结合图像库索引进行上下文相关的图像检索过程。首先采用关节不变性原理分割形状的轮廓特征,得到成对的距离度量值;其次将待检索图像与图像库聚类索引进行比对,得到一个近似相似图库;最后将待检索图像和近似相似图库共同构建成图结构,在图上进行相似度扩散,扩散集合的选取分别使用了K-NN(K-Nearest Neighborhood)、反K-NN以及一致的K-NNs方法,经过一定次数的迭代后得到最终的检索结果。实验结果证明,建立图像库索引后再进行上下文相关的图像匹配,其检索耗时大大降低。我们在MPEG7CE Shape-1Part B图形库上得到99.92%的靶心得分(Bullseye Score),并且较之前提出的上下文相关匹配方法节省将近40%时间消耗。(本文来源于《大连理工大学》期刊2014-06-07)

张璇[9](2014)在《基于空间上下文关系的图像检索研究》一文中研究指出随着多媒体技术的发展,图像检索已经在社会生活中的许多方面得到了广泛的应用。本文在词袋模型的基础上,结合空间上下文关系,提出了两种图像检索的方法。一是基于二元视觉短语的图像检索方法;二是基于最长公共视觉单词串的图像检索方法。本文具体研究工作如下:首先,本文回顾了基于词袋模型的图像检索技术的历史及其研究现状,并且介绍了目前常用的图像局部特征。通过对当前图像检索技术中流行的词袋模型的深入分析,可以得知缺乏空间上下文信息是制约图像检索性能的关键因素。其次,本文第叁章提出一种基于二元视觉短语的图像检索方法。该方法通过引入视觉显着性区域对局部视觉短语的构建进行约束,仿照词袋模型对视觉短语进行统计构建图像描述子。在该模型中,本文认为显着性区域的个数与显着性区域的半径都是影响构建视觉短语的因素,并对这两个因素分别进行实验分析。将基于视觉显着性的二元视觉短语模型(Saliency-BVP)、基于视觉显着性的词袋模型(Saliency-BoW)和传统的词袋模型(BoW)进行比较,结果显示Saliency-BVP模型具有明显优势。这说明视觉短语中蕴含的信息要比单纯的视觉词所蕴含的信息要丰富,由此可见空间上下文信息对于图像描述来说是很重要的。最后,本文第四章提出一种基于最长公共视觉单词串的图像检索方法(LCVS)。利用两幅图像之间存在的最大隐含模式构建最长公共视觉单词串,认为最长公共视觉串为两幅图像之间共有的一种模式。通过最长公共视觉串计算两幅图像的相似度,以此实现图像检索。紧接着,又提出一种计算公共视觉串相似度的方法,称为公共子串加权最大值方法(CSWM)。在公开图库上对LCVS方法和BoW方法进行实验,结果显示LCVS方法更优。对LCVS和CSWM方法进行比较实验,发现具有基本一致的结果。这进一步说明,视觉词的空间上下文信息是有效的。(本文来源于《北京工业大学》期刊2014-06-01)

戴周[10](2014)在《基于局部特征和视觉上下文的图像检索系统》一文中研究指出近几十年来,在图像信息方面,网络中用户每天上传的图像数量呈现出爆炸增长的趋势。如何有效的管理这些大量的图像数据,进而建立一个图像检索系统帮助人们快速找到自己感兴趣的图像便成了一个重要的研究问题。当前主流的图像检索系统采用局部特征和词袋模型取得了较好的检索性能,其检索系统的构建主要包括如下环节:图像局部特征的提取、视觉词典的构建、图像特征编码、相似度计算。然而,由于构建视觉词典存在的量化误差以及词袋模型对空间信息的忽略制约了检索系统的性能。本文介绍了一个基于局部特征并结合视觉上下文的图像检索系统,通过一系列的技术来进一步提高图像检索的精度和效率。本文首先介绍了基于局部特征和上下文的图像检索框架;通过为特征空间采用近似K-Means建立索引以及为图像编码建立倒排索引来提高整个检索系统的效率;比较了图像间不同匹配方法在速度和性能上的差异;接着分析比较了视觉上下文中的传统的和改进的弱几何一致性在图像检索中的差异;最后实现了一个基于传统方法和本文改进方法的一个图像检索系统。本文的主要贡献包括:1.设计并实现了一个基于局部特征和视觉上下文的图像检索系统,针对当前图像检索系统的不足,融合了汉明编码以及视觉上下文信息进行重排序提高检索的精度,并使用近似K-Means和倒排索引技术来提高检索的响应时间。2.比较了最近邻和近似K-Means方法在视觉词典上的查找差异,实验表明于近似K-Means方法在检索精度下降不到1%的情况下其速度上提高了100多倍,倒排索引技术成倍的提升了检索时间。3.分析比较了图像之间的几种匹配算法,包括蛮力匹配、基于视觉词典、汉明编码的匹配,实验表明蛮力匹配虽然性能较好,但是需要耗费大量的检索时间,而基于视觉词典的图像匹配采用了近似K-Means建立的索引以及汉明编码的结合能够很好的平衡精度和速度问题。4.分析比较了几种视觉上下文方法,包括弱几何一致WGC、加强的WGC、空间编码GC、强几何一致SGC、结合汉明码的WGC、及本文改进的M-WGC、M-EWGC、M-GC、M-HeWgc等。实验表明本文改进的方法都获得了检索精度的提高。(本文来源于《电子科技大学》期刊2014-03-01)

上下文检索论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

基于上下文的信息检索技术自从诞生以来,一直广受学术界和工业界的关注。从信息量上看,该技术充分利用各种上下文信息,有效缓解了传统信息检索中由于查询短、用户信息需求难以理解的问题。从检索排序上看,该技术提供了更多样化的匹配方式,除了传统的基于查询关键词的匹配外,还关注所涉及的上下文信息之间的匹配。上下文信息来源多种多样,主要包括设备上下文、时空上下文、用户上下文、任务上下文和文档上下文。其中,文档上下文由于其获取更方便、内容更丰富的特点,在基于上下文的信息检索中处于十分重要的地位。然而,关于文档上下文的信息检索研究还存在很多不足,比如语义理解不够准确、上下文粒度比较粗等。另外,大多数研究集中在如何将上下文信息融入传统排序模型中,对于近几年在信息检索领域崭露头角的神经网络排序模型,由于其内部复杂的结构,与上下文信息的融合还没有得到很好的研究。因此,本文以文档上下文为中心,针对以上存在的不足,分别从主题、时间、位置、对齐等常见的上下文信息维度进行了更深入的研究,在准确度和粒度上都取得了明显改善。除了改进传统的基于上下文的检索排序模型外,还探索了如何将上下文信息融入到神经网络排序模型中,在各项评价指标上取得了显着提升。具体来讲,本文的主要贡献如下:1.提出了基于上下文片段主题的排序方法。本文研究了利用伪相关反馈文档中的上下文片段而非一个个独立的词建模查询主题的有效性。首先,探索了叁种上下文相关性度量方法,识别出与查询相关的优质上下文片段。然后,提出了一种上下文感知主题模型,通过从相应的伪相关反馈文档而不是整个语料库来推断片段的主题分布,使得主题建模更准确。最后,将得到的片段的主题分布融入检索排序模型中,极大地提升了检索准确率。2.提出了基于上下文细粒度时间的排序框架。本文提出了基于上下文细粒度时间的排序框架,该框架除了包含传统的文档级别的时间预测器外,还包含本文提出的词级别的时间预测器,捕获了更细粒度的时间信息。与已有的基于上下文时间的检索模型相比,基于本文排序框架改进的模型检索结果更准确,鲁棒性更强。3.提出了基于上下文位置注意力的神经网络排序模型。本文首次尝试将上下文位置信息融入到基于循环神经网络模型的注意力机制中,并应用于信息检索的答案选取任务。通过在高维隐层空间对问题中词的上下文位置信息进行建模,缓解了传统注意力机制由于语义累积带来的偏见问题,显着提升了候选答案的排序效果。4.提出了基于上下文对齐的神经网络排序模型。本文在神经网络框架下,研究了上下文对齐信息对于句子相似度建模的有效性。具体来说,本文提出了一种基于上下文对齐的循环神经网络排序模型,在当前句子的隐层状态生成过程中,通过内部的上下文对齐门自动吸收另一个句子中对齐词的上下文信息,从而实现了两个句子上下文之间的深度交互。同时,也减少了无关上下文的引入,有效提升了句子相似度排序的准确率。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

上下文检索论文参考文献

[1].缪永伟,胡争光,孙瑜亮,张旭东,刘震.结合分类卷积神经网络和形状上下文的线画图检索[J].计算机辅助设计与图形学学报.2019

[2].陈琴.基于上下文的信息检索若干关键技术研究[D].华东师范大学.2018

[3].杨醒龙.基于上下文一致性的拷贝图像检索研究[D].杭州电子科技大学.2018

[4].周叶华.结合上下文特征的LaTeX公式检索方法[D].河北大学.2017

[5].吴蕴泽.基于BIM的建设工程文档上下文信息检索研究[D].大连理工大学.2015

[6].吴晓雨,何彦,杨磊,张宜春.基于改进形状上下文特征的二值图像检索[J].光学精密工程.2015

[7].胡扬波,袁杰,王李冬.基于增强微结构和上下文相似度的图像检索[J].计算机应用.2014

[8].徐海博.基于上下文相关的图像检索方法研究[D].大连理工大学.2014

[9].张璇.基于空间上下文关系的图像检索研究[D].北京工业大学.2014

[10].戴周.基于局部特征和视觉上下文的图像检索系统[D].电子科技大学.2014

标签:;  ;  ;  ;  

上下文检索论文-缪永伟,胡争光,孙瑜亮,张旭东,刘震
下载Doc文档

猜你喜欢