目标检索论文-穆中凯

导读:本文包含了目标检索论文开题报告文献综述及选题提纲参考文献，主要关键词:关键帧,感兴趣区域,视觉显着性检测,目标检索

目标检索论文文献综述

穆中凯^[1]（2019）在《基于感兴趣区域的视频目标检索方法及应用研究》一文中研究指出视频目标检索技术是一种利用计算机视觉算法判断视频中是否存在特定目标的技术,该技术具有十分广泛的应用前景,如智能安防、无人超市和人机交互等场景的特定目标检索和追踪。近年来,受益于深度学习算法的进步,目标检索方法发展迅猛,然而,大多数的相关工作以图像为单位展开研究,很少有人以视频为出发点解决目标检索任务·,除此之外,目前的端到端目标检索算法中一直存在由于检测损失和重识别损失相互干扰而导致的损失函数难以收敛的问题,该问题也限制了目前算法的发展。本文围绕实际应用场景,针对性的提出了一套关键帧的多级提取方法,应对视频数据存储空间要求高、信噪比低的问题。同时,设计了一种基于感兴趣区域的视频目标检索算法,解决相关研究中损失函数难以收敛的问题。具体的研究成果如下:(1)提出一种针对视频目标检索任务的级联式关键帧提取方法。本文调研了现有的关键帧提取技术,并针对检索视频应用场景设计了基于边缘轮廓变化率的镜头分割和基于层次聚类的级联式关键帧提取算法,实验证明,本文设计的关键帧提取算法可以去除大部分冗余信息,将视频内容的存储成本压缩至之前的23%。(2)提出基于感兴趣区域的目标检索算法来解决检索损失难以收敛的问题。本文设计的算法借鉴了RPN网络的候选框提取思想,在其基础上引入全新的感兴趣区域特征加权机制进行验证式模型训练。实验证明,该设计与目前最先进的检索算法相比,F1值从53.24提升到了79.35。有效的解决了检索损失难以收敛的问题,实现目标定位精度和检索准确率的提升。(3)本文针对自然保护区跨摄像头行人检索的实际应用场景,构建了相关数据集,并将本文提出的模型框架应用其中,成功在算法上实现了基于视频的行人检索。可以预见,该技术的应用能有效提高工作人员对自然保护区的监控管理能力。(本文来源于《北京邮电大学》期刊2019-05-27）

单帅帅^[2]（2019）在《监控相机网络中视频时空内容组织与运动目标检索方法》一文中研究指出近年来,随着“平安城市”、“智慧城市”等工程的深入开展,在每个城市的主干道、次干道以及街角小巷的两侧和道路交叉口都布设了大量的监控摄像机,主要用于监控行人和车辆等运动目标,这些监控摄像机24小时不间断拍摄,产生了大量的监控视频数据,如何在海量的监控视频数据中快速准确的查询感兴趣运动目标成为研究的热点和挑战,监控视频数据高效组织和检索方法是解决这一问题的核心。监控视频不仅具有丰富的内容信息同时还包含了大量的时空信息,根据研究侧重点的不同,现有的监控视频组织和检索方法主要分为基于时空的方法和基于内容的方法两大类,监控视频的时空检索方法虽然检索速度和精度较高,但此类方法更多的是集中于视频传感器或视频段层面的空间检索,没有关注视频中目标的检索;基于内容的检索虽然能够实现对视频中感兴趣目标的检索,但由于视频数据量巨大、运动目标匹配困难等原因,导致其在检索效率和精度方面不尽如人意。因此,亟需发展一种时空内容统一的监控视频组织和检索方法来结合两类方法各自的优势,克服两类方法各自的缺点,提高方法的实际应用能力。基于以上研究背景,本文以完全固定监控摄像机采集的视频为研究对象,着重研究了时空内容相统一的监控视频数据组织模型的构建,提出了监控视频运动目标提取和匹配方法,发展了一套时空约束下视频运动目标检索理论和方法。本文的主要研究内容及成果如下:(1)多层次监控视频数据组织方法。本文分析了现有监控视频组织方法,面向视频运动目标时空内容检索,设计了多层次视频组织结构,提出了监控视频多层次时空内容组织模型;厘定了多层次视频组织模型的属性描述定义,实现了监控视频多层次时空内容组织方法。(2)视频运动目标多特征提取与匹配方法。本文基于ViBe算法和SSD算法设计了视频运动目标定位方法;在分析了不同图像特征在表达图像内容方面具有不同侧重点的基础上,提出了基于多特征相似度融合的目标匹配方法和匹配结果评价标准。(3)时空约束下运动目标检索方法。本文设计了地理视频覆盖检索方法和时空约束下的运动目标方向、速度等信息获取方法,分析了路网对车辆目标的时空约束作用,以此为基础,顾及目标与监控摄像机主光轴的方位关系,提出了路网约束下的车辆检索方法,有效剔除无效匹配数据,提高了检索的效率和精度。(4)监控视频时空内容组织与检索系统。本文基于已有的研究成果,设计并实现了“监控视频时空内容组织与检索系统”。本文研究提供了一种新的监控视频时空内容相统一的组织方法,丰富和扩展了监控视频检索领域的理论和方法,从应用角度出发,可为公共安防领域提供监控视频感兴趣目标的快速、准确检索,从而为进一步的分析和决策提供有效的支持。(本文来源于《南京师范大学》期刊2019-03-30）

陈道富^[3]（2019）在《基于深度学习的视频目标检索技术研究》一文中研究指出通常,传统的视频检索系统仅允许使用关键词作为输入,通过人工对视频内容进行标注,并使用这些标注检索相关视频。但是视频数据量的增加导致这种方式的人力成本大幅增加的同时,检索结果也越来越无法满足实际的需求。基于内容的视频检索使用图像或视频片段作为系统的输入,提取输入的内容作为检索目标,不再需要人类的参与,大大提高了系统的效率。本文主要研究了基于图像的视频目标检索涉及的关键技术,主要工作和创新点如下:(1)在视频结构化过程中,本文针对传统的关键帧提取算法的提取数量难以确定的问题,提出使用帧间差的均值和标准差计算一个自适应阈值,通过统计帧间差大于阈值的数量来判断视频中内容变化的次数,并以此为依据得到需要提取的关键帧数量。实验发现,该方法取得的关键帧数量与图像帧聚类的最佳聚类数保持一致,证明了该方法的有效性。(2)对于传统的k-medoids聚类算法结果易受初始化聚类中心的影响问题,本文提出了使用SOM算法改进基于聚类的关键帧提取算法。使用SOM聚类算法对图像帧进行初聚类,将得到的聚类结果作为聚类初始化中心,再使用k-mediods算法进行结果优化,进一步解决了孤立帧造成的影响。相比于传统的关键帧提取算法,本文的关键帧提取算法可以更好的平衡保真率和压缩比,将聚类效果保持在一个较高的水平。(3)对于传统的图像特征缺少语义信息的问题,本文提出了基于特征点的深度特征提取算法。使用预训练的CNN网络提取图像的局部卷积特征集,然后使用SURF或ORB特征快速的提取到图像的关键目标区域,筛选出更有效的局部卷积特征,最终将局部卷积特征子集聚合成一个完整的特征描述符,并在降维后作为最终检索使用的特征描述符。实验证明该特征的检索准确率优于传统的人工图像特征及深度特征,同时相对于其他卷积特征筛选方法,本文的方法有效的降低了整体算法的筛选时间。(4)为了实现基于深度特征的视频目标检索,本文使用MATLABGUI工具箱整合了提出的关键帧提取和特征提取算法,实现了一个简单实用的视频目标检索系统。该系统使用图片进行相似内容的视频片段检索,完成了视频镜头检测、关键帧提取和特征提取与检索等功能,并通过实验验证了该系统的可用性。(本文来源于《电子科技大学》期刊2019-03-20）

赵雪青,师昕,陈惠娟^[4]（2019）在《基于手绘草图骨架特征的叁维目标检索方法》一文中研究指出随着人们对叁维数据使用需求的日益增加,网络上叁维目标数据亦迅速增长,传统的基于关键词的检索方法难以满足叁维目标的检索需求。因此,针对叁维目标检索问题,提出了一种新的基于手绘草图骨架特征的叁维目标检索方法。首先,采用有向梯度直方图(HOG)作为特征描述叁维目标的骨架信息,使用支持向量机实现叁维目标分类检索;其次,手绘叁维目标草图并获取其HOG特征在训练好的叁维目标数据库中进行检索;最后,采用查全率进行客观评价获得叁维目标检索结果。仿真实验结果表明,提出的基于手绘草图骨架特征的叁维目标检索方法具有较好的检索性能。(本文来源于《计算机技术与发展》期刊2019年04期）

彭天强,孙晓峰,栗芳^[5]（2018）在《基于全卷积网络的中小目标检索方法》一文中研究指出基于预训练卷积神经网络(convolutional neural networks,CNNs)的图像表示已成为图像检索任务中一种新的方法,但是这种图像表示方法均是对图像的整体特征表示,无法适用于目标仅占被检索图像的部分区域的检索.为了解决该问题,提出一种基于全卷积网络的中小目标检索方法,该方法将预训练全卷积网络应用于目标较小、仅占被检索图像部分区域的检索.1)利用全卷积网络对输入图像大小不受限制的优势,给定被检索图像,经过全卷积网络得到该图像的特征矩阵表示;2)给定查询目标图像,利用全卷积神经网络,得到目标图像的特征表示;3)将目标特征,与被检索图像的特征矩阵的每一个特征进行相似性比对,得到相似值和匹配最优位置.进一步引入多尺度、多比例变换以适用不同大小的实例目标.在标准数据集Oxford5K上的实验表明:该算法的检索性能优于现有算法.另外,在搜集的Logo数据集,该算法得到了不错的检索效果,进一步验证了算法的普适性和有效性.(本文来源于《计算机研究与发展》期刊2018年12期）

郑侠武^[6]（2018）在《基于中心排序损失及弱监督定位的细粒度目标检索》一文中研究指出细粒度视觉检索不同于传统的视觉检索,需要更加精细的反馈结果。作为一个新兴的研究领域,细粒度视觉检索面临以下几个方面的挑战:首先,细粒度视觉检索中不同类之间的差异非常小,细粒度视觉检索需要区分目标物体与之间的一些细微差别,而该问题的解决需要高分区分度的度量学习方法及强表述力的特征描述方法。其次,同类目标物体由于拍摄时间和地点的差异导致同类个体之间较大的表观差异,而细粒度视觉检索需要能过滤这样的表观差异而生成近似的特征描述,以达到高的细粒度视觉检索精度。此外,当前主流的度量学习的学习方法中,损失函数的计算存在时间和空间复杂度较高的问题,导致训练过程非常耗时耗力。最后,细粒度视觉检索方法还存在带有精确标注信息的样本数据不足的问题。细粒度视觉检索需要大量带有精确定位信息标注的样本而当前此类样本数据严重缺失。针对当前细粒度检索方法存在的上述问题,本文提出了一个针对于细粒度视觉检索的统一框架,并基于该框架展开深度度量学习和基于弱监督的特征表示学习等相关研究。本文的主要创新点包括:1)提出了一种基于中心点排序的损失函数,与传统深度度量学习损失函数不同,基于中心排序的损失函数利用中心点进行参数更新,不仅提高了特征的区分度和泛化能力,同时也降低了算法的计算复杂度,针对相同批次的图片输入,基于中心排序损失函数的训练过程比基于采用其他损失函数的训练在训练速度上提升了 1000多倍,大大提高了训练效率,使得该方法具有更好的实用性。2)提出了一种基于弱监督的特征抽取方法,该方法首先利用高层神经网络的统计信息来完成对目标物体的初步定位,然后利用混合高斯模型与最大最小图割算法对初步定位后的目标物体进行精细化操作,利用精细化定位信息对特征进行筛选与聚合,从而得到具有高泛化能力及高区分度的特征。本文在多个相关的细粒度视觉检索数据集上进行了仿真实验,通过与当前其他主流方法的比较可以发现:在相同条件下,本文提出的方法在检索精度和训练速度上远远的超过了当前其他主流细粒度视觉检索方法。(本文来源于《厦门大学》期刊2018-06-30）

张丹^[7]（2018）在《基于深度学习的多特征融合的目标检索算法》一文中研究指出目标检索技术具有重要的现实研究价值,其中最关键的部分是特征构建与选取。传统方法采用手动特征提取,人参与的多,特征表达能力差,检索效果差。利用深度学习技术可自动地提取图像抽象特征,使特征表达能力大大增强。论文提出一种基于深度学习的多特征融合的目标检索算法,以人脸图像为检索对象,研究算法的检索性能。首先,研究参数对检索结果的影响,分析结果确定算法实验参数。其次,分别提取小波特征,张量PCA特征(TPCA),卷积神经网络(CNN)深层特征。最后,研究传统特征与CNN特征的加权融合算法,结果表明论文提出的算法检索准确率高于常规算法,具体工作如下:(1)参数对检索结果的影响研究。使用Db2、Db4、Bior2.4、Coif2和Sym2小波,分解层数依次从1层到3层来研究小波基函数、分解层数对检索结果的影响。分析实验结果,ORL库中小波函数选用Db4,分解层数3时,检索效果最好为96.25%。研究CNN模型参数全连接层神经元个数、卷积层特征图数目、图像大小、学习率、批处理块、卷积核和采样大小对检索效果的影响。实验结果分析,当ORL库全连接层神经元个数为100,卷积层特征图数量依次为10、15,图像尺寸选用56?56,学习率0.35,批处理块大小40,卷积核和采样大小为5?5,2?2时,检索结果最好,达到97.5%,当MIT人脸库全连接层神经元个数为200,卷积层特征图数量依次为20、30时,图像尺寸64?64,学习率0.1,批处理大小50,卷积核和采样大小5?5,2?2时,图像检索的效果最好为95.0%。(2)特征融合策略研究。首先,研究小波分量对检索结果的贡献,实现了小波特征的融合处理。其次,研究小波融合特征、张量PCA特征与CNN深层特征分别作为识别特征时的检索准确率。然后,确定小波特征、TPCA特征与CNN特征融合的方法来确定融合系数,就Squared Chi-Squared距离、Cosine距离、Euclidean距离和Manhattan距离对比实验研究,确定分类最佳的相似性度量函数。实验分析得出,在ORL库上,当特征加权融合系数为0.1,0.2,0.7,采用Manhattan距离时,检索效果最好,平均准确率高达98.75%。(3)论文算法性能验证与分析。在ORL库上就CNN深度特征检索算法、小波子特征与TPCA特征融合算法、小波子特征与PCA特征融合算法以及论文提出的算法进行对比实验研究,从实验结果可以看出论文算法的检索率高出1.75%。论文提出的检索算法在ORL库、MIT库和Yale库上进行实验,从实验结果看出,算法在3个标准图像库上的平均检索率分别为98.75%、96.0%和97.3%,差别最大2.75%,说明论文算法具有很好的适应性。(本文来源于《曲阜师范大学》期刊2018-03-10）

孙晓峰,彭天强^[8]（2017）在《一种基于全卷积网络的目标检索方法》一文中研究指出基于预训练卷积神经网络的图像表示已成为一种新的图像检索方法,但这种图像表示方法是对图像整体特征的表示,无法适用于目标仅占被检索图像部分区域的检索,故主要研究将深度全卷积网络应用于实例目标较小、仅占被检索图像部分区域的检索.首先,利用全卷积网络对输入图像大小不受限制的优势,给定被检索图像,经过全卷积网络得到该图像的特征矩阵;其次,给定查询目标图像,利用全卷积神经网络得到目标图像的特征表示;最后,将目标特征与被检索图像的特征矩阵的每一个特征进行相似性比对,得到相似值和匹配最优位置.实验表明,本算法的检索性能优于现有算法.(本文来源于《河南工程学院学报(自然科学版)》期刊2017年03期）

牛文昊,王士林^[9]（2017）在《多监控摄像头特定目标检索方法研究》一文中研究指出视频监控是安全防范系统的重要组成部分。随着安防指标和需求的提高,越来越多的技术被应用到视频监控系统中,如基于视频图像处理的模式识别技术已广泛应用于视频监控中。而在多监控摄像头环境下,对特定目标的检索往往具有更加重要的意义。因此,分析现有目标检索方法,结合Deformable Part Model(DPM)目标检测模型,提出一种新的适用于多监控摄像头目标检索的方法。该方法包含目标检测和目标跟踪两个模块,通过提取不同监控录像中的多个目标序列,并将检索目标与之比对,获得该检索目标在不同监控视频中的检索信息。(本文来源于《通信技术》期刊2017年03期）

胡焜^[10]（2016）在《基于深度学习的特征表示与目标检索技术研究》一文中研究指出基于内容的图像检索技术一直是一个热门研究方向,在如今互联网络图片及视频资源呈现爆炸式增长的大背景下,CBIR技术能够帮助人们更快更准确地获取到自己想要的信息。深度学习近几年非常火热,强大的特征学习能力以及非线性特征表达能力,使得深度学习在计算机视觉领域的多个分支都实现了突破。本文主要是研究基于深度学习的特征表示以及其在图像检索中的应用。一个有效的图像检索系统分为两个部分:一个是具备强大表征能力的特征;一个是快速的检索过程。本文主要从这两个方面着手研究。在特征提取方面,本文首先研究CNN中不同层之间的表达能力差异,然后提出一种多层次的池化方法以及多层特征融合的方法,并采用PCA即LDA降维方法对特征进行过滤;在快速检索方面,本文提出一种基于深度学习的哈希技术,用卷积神经网络同时进行特征学习以及哈希函数学习。具体地,本文的主要工作概括如下:>研究卷积神经网络中不同层的特征表达能力差异,并发现相比于全连接层的特征而言,卷积通道特征对于图像检索问题而言更为有效;>提出一种多层次池化方法用于特征提取,将卷积图中的局部区域特征与全图的全局特征融合在一起,使得特征更具鲁棒性,在多个数据及上验证了其效果;>提出一种多层特征融合的方法,通过结合低层的视觉特征以及高层语义特征,提升了最终特征的泛化能力,在多个数据集上多层融合特征对于性能都有提升;>提出一种区域感知的深度哈希技术,结合图像目标候选区域提取算法,RoI pooling,多标签分类损失函数以及加权叁元组损失函数,使得网络能够同时进行特征学习以及哈希函数学习。(本文来源于《北京邮电大学》期刊2016-11-27）

目标检索论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

近年来,随着“平安城市”、“智慧城市”等工程的深入开展,在每个城市的主干道、次干道以及街角小巷的两侧和道路交叉口都布设了大量的监控摄像机,主要用于监控行人和车辆等运动目标,这些监控摄像机24小时不间断拍摄,产生了大量的监控视频数据,如何在海量的监控视频数据中快速准确的查询感兴趣运动目标成为研究的热点和挑战,监控视频数据高效组织和检索方法是解决这一问题的核心。监控视频不仅具有丰富的内容信息同时还包含了大量的时空信息,根据研究侧重点的不同,现有的监控视频组织和检索方法主要分为基于时空的方法和基于内容的方法两大类,监控视频的时空检索方法虽然检索速度和精度较高,但此类方法更多的是集中于视频传感器或视频段层面的空间检索,没有关注视频中目标的检索;基于内容的检索虽然能够实现对视频中感兴趣目标的检索,但由于视频数据量巨大、运动目标匹配困难等原因,导致其在检索效率和精度方面不尽如人意。因此,亟需发展一种时空内容统一的监控视频组织和检索方法来结合两类方法各自的优势,克服两类方法各自的缺点,提高方法的实际应用能力。基于以上研究背景,本文以完全固定监控摄像机采集的视频为研究对象,着重研究了时空内容相统一的监控视频数据组织模型的构建,提出了监控视频运动目标提取和匹配方法,发展了一套时空约束下视频运动目标检索理论和方法。本文的主要研究内容及成果如下:(1)多层次监控视频数据组织方法。本文分析了现有监控视频组织方法,面向视频运动目标时空内容检索,设计了多层次视频组织结构,提出了监控视频多层次时空内容组织模型;厘定了多层次视频组织模型的属性描述定义,实现了监控视频多层次时空内容组织方法。(2)视频运动目标多特征提取与匹配方法。本文基于ViBe算法和SSD算法设计了视频运动目标定位方法;在分析了不同图像特征在表达图像内容方面具有不同侧重点的基础上,提出了基于多特征相似度融合的目标匹配方法和匹配结果评价标准。(3)时空约束下运动目标检索方法。本文设计了地理视频覆盖检索方法和时空约束下的运动目标方向、速度等信息获取方法,分析了路网对车辆目标的时空约束作用,以此为基础,顾及目标与监控摄像机主光轴的方位关系,提出了路网约束下的车辆检索方法,有效剔除无效匹配数据,提高了检索的效率和精度。(4)监控视频时空内容组织与检索系统。本文基于已有的研究成果,设计并实现了“监控视频时空内容组织与检索系统”。本文研究提供了一种新的监控视频时空内容相统一的组织方法,丰富和扩展了监控视频检索领域的理论和方法,从应用角度出发,可为公共安防领域提供监控视频感兴趣目标的快速、准确检索,从而为进一步的分析和决策提供有效的支持。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

目标检索论文参考文献

[1].穆中凯.基于感兴趣区域的视频目标检索方法及应用研究[D].北京邮电大学.2019

[2].单帅帅.监控相机网络中视频时空内容组织与运动目标检索方法[D].南京师范大学.2019

[3].陈道富.基于深度学习的视频目标检索技术研究[D].电子科技大学.2019

[4].赵雪青,师昕,陈惠娟.基于手绘草图骨架特征的叁维目标检索方法[J].计算机技术与发展.2019

[5].彭天强,孙晓峰,栗芳.基于全卷积网络的中小目标检索方法[J].计算机研究与发展.2018

[6].郑侠武.基于中心排序损失及弱监督定位的细粒度目标检索[D].厦门大学.2018

[7].张丹.基于深度学习的多特征融合的目标检索算法[D].曲阜师范大学.2018

[8].孙晓峰,彭天强.一种基于全卷积网络的目标检索方法[J].河南工程学院学报(自然科学版).2017

[9].牛文昊,王士林.多监控摄像头特定目标检索方法研究[J].通信技术.2017

[10].胡焜.基于深度学习的特征表示与目标检索技术研究[D].北京邮电大学.2016

标签：关键帧; 感兴趣区域; 视觉显着性检测; 目标检索;

目标检索论文-穆中凯

目标检索论文文献综述

目标检索论文开题报告

目标检索论文参考文献

猜你喜欢