一、基于内容的图像检索技术研究与实现(论文文献综述)
骆俊锋[1](2021)在《基于目标检测的图像检索技术研究》文中认为随着多媒体技术的发展及信息化的普及,图像内容变得越来越复杂,具有多目标、多标签且具有复杂背景的图像在生活中更加常见,给基于内容的图像检索带来了更大的挑战。面对这个问题,部分研究者尝试将目标检测算法应用到图像检索中,但是简单的将目标检测应用于图像检索时,具有一定的缺陷。本文针对这些缺陷,提出了基于目标检测的结合高层语义与底层颜色特征的图像检索方法。本文的主要研究工作有如下两点:第一,针对目标检测算法对多目标多标签图像进行检测会返回多条不定数量的目标特征,不易进行相似度计算的缺陷,本文方法利用目标检测算法特征输出具有标签化信息的特点,将图像的高层语义特征进行二值编码。第二,目标检测算法提取的特征无法完整描述图像信息,需要利用其他特征进行补足。针对目标检测算法仅提取目标高层语义信息,缺少目标的底层信息,在检测相同类别时无法进行很好的区分的缺点;以及目标检测算法只对目标所在区域进行特征提取,缺少全局信息,丢失目标以外背景信息的缺点,本文方法分别使用局部颜色直方图和颜色矩进行补足:利用目标检测所确定的目标位置信息,提取目标所在局部的颜色直方图信息,在后续检索进行相似度计算时进行辅助计算,完成对目标物体的高层语义和底层颜色特征的完整描述;使用颜色矩对全局图像的颜色分布进行特征提取,作为目标特征以外的补充,减小了物体相似但是背景完全不同的缺陷,在返回相似度序列时,提高了具有近似颜色分布的图像的相似度。本文将提出的结合高层语义与底层颜色特征的图像检索方法在公开数据集上进行了相关实验。实验结果证明本文算法的平均准确率有所提升,查询结果更符合查询意图。
舒永康[2](2021)在《基于弱监督的社交媒体图像多目标哈希方法研究与检索系统实现》文中提出基于内容的图像检索作为信息检索领域重要的研究技术之一,可以在海量的图像数据中检索出所需要的数据,在大数据时代背景下具有重要的作用。社交媒体图像检索作为一个重要的应用场景,在长期的发展过程中,主流的方法都将图像使用单个特征进行表示,其内在的缺陷导致检索形式单一、检索效果欠佳。在实际的检索应用中,人工标签缺乏导致训练不佳、维度灾难导致检索响应慢等问题也会同时出现。在本文中为了解决社交媒体图像检索在实际应用中存在的多个问题,提出了一个解决整体问题的方法,实现一个基于弱监督检测的图像多目标哈希检索方法,通过使用社会弱标签学习图像中各目标的哈希表示,解决了监督式学习对人工标签的依赖问题,还可以有效提高检索效果,丰富检索形式,其主要的工作内容如下:(1)为了有效地利用社会标签中的信息,针对社会标签中所存在的噪声、缺失、表达差异等问题展开了研究,分别提出了对应的优化处理方案,重点引入了Word Net模型根据语义对噪声进行处理,通过融合社会标签之间的关联性和图像视觉特征之间的相似性进行社会标签补全优化,还通过语义聚类解决表达差异的问题,从多方面完成了社会标签的优化工作,改善社会标签质量。(2)针对当前主流社交媒体图像检索方法中将图像使用单一的特征编码表示,导致当进行多目标图像检索时性能不佳和检索形式单一的问题,以及强监督学习对人工标签的依赖问题,提出了基于弱监督检测的图像多目标哈希模型,通过构建一个多任务深度学习的网络架构,使用优化的社会标签,在两个任务分支中分别学习图像目标区域检测和目标哈希表示,每幅图像的特征由一个目标哈希集合表示,可以兼顾图像检索对时间、准确率的要求,并可有效扩充图像检索的形式。(3)在弱监督检测学习以及哈希学习两个任务分支上,都会面临标签的不准确性问题,对此设计了标签加权的损失函数,降低噪声标签对模型训练的干扰,并将两个相关任务结合设置了一个共同的优化损失函数,完成多任务模型的训练。大量的实验对比结果证明,本文中的标签优化方法可以明显的改善社会标签质量,对于检索任务的模型训练提供了良好的基础支撑。在提出的基于弱监督检测的图像多目标哈希模型上,可以有效地获取图像中各目标的哈希特征表示。在多个图像检索的评估指标下,相比当前的主流社交媒体图像检索方法具有明显的优势,并且在实际的检索效果对比下,检索结果更符合实际检索需求。在最后,依托于本文所提出的图像多目标哈希检索方法,结合实际的图像检索需求,设计并实现了一个功能完善的社交媒体图像检索系统,具有较好的使用体验。
褚凯[3](2021)在《基于深层特征的图像检索研究》文中研究指明图像检索是模式识别中极具挑战性的研究方向。其中特征提取和紧凑的特征描述是图像检索技术的重要组成部分。传统的图像检索技术主要由两部分组成:(1)基于文本的图像检索(TBIR);(2)基于内容的图像检索(CBIR)。TBIR技术存在局限性且难以精确描述图像内容,而CBIR虽然能够通过低层视觉特征传达图像信息,但在高层语义表达方面仍存在很多不足。近些年,卷积神经网络(CNN)在图像检索和图像分类等任务中取得优异表现。在卷积神经网络中,通常采用预先训练CNN模型的卷积层或池化层的激活表示图像高级语义信息。虽然在语义表达方面优于传统图像检索技术,但是所带来检索性能的提升十分有限。而在预先训练卷积神经网络的基础上进行针对性再训练,不仅可以获得高效的特征表示,并且在表示图像深度语义方面有显着优势。针对于不同的检索任务,本文给出不同的解决方案。主要内容如下:1.在CBIR中,本文提出一种多阶段特征整合的图像检索方法。首先将输入图像从RGB颜色空间转换到符合人类视觉感知的HSV颜色空间,并计算图像颜色和颜色差;然后通过简单的颜色差计算得到图像的边缘特征;最后通过多阶段特征整合组合低级视觉特征表示图像内容。基于多阶段特征整合方案不仅能够描述图像颜色和边缘属性,而且可以很好地表示图像区域和空间排列信息。实验结果表明,在传统的图像检索数据集(Corel-10K、GHIM-10K和Corel-5K)中,本文提出的多阶段特征整合方案具有优秀的辨别能力。2.通过整合图像低级视觉特征可以很好地表示图像视觉内容,但基于多阶段特征整合方案始终属于手工特征提取方法,难以真正处理图像语义问题。为了更好地缓解图像语义差异,本文提出了一种基于端到端微调再训练的深层特征图像检索方法。在预先训练卷积神经网络(Alex Net、VGGNet和Goog Le Net)的基础上采用孪生网络架构进行对比损失训练,并对不同的网络基准进行性能比较。并且通过学习白化参数和加权扩展查询方法进一步提升图像检索性能。同时在训练数据集的选择方面,本文采用更接近实例图像检索任务的训练数据集,使得网络参数的学习更具有针对性。尽管本文提出的多阶段特征整合方案在图像检索中有良好的表现,但是手工特征提取方法不适用于实例图像检索。在实例图像检索数据集(Oxford5k、Paris6k和Holidays)上的性能表现证明,基于微调再训练的深层特征图像检索方法不仅优于传统的基于内容的图像检索方法,而且优于预先训练的卷积神经网络的特征提取方法,同时能够更好地应对“语义鸿沟”问题。
王鑫城[4](2021)在《基于内容的图像检索系统的研究》文中提出随着信息科学技术的迅猛发展和互联网的普及,各种社交软件和电商平台的数据库存储着上百亿幅图像。在海量图像数据面前,传统的基于文本的图像检索系统存在着人工标注效率低以及受主观影响较大等缺点,已经不能满足人们日常对于图像检索的需求。基于内容的图像检索系统(Content-Based Image Retrieval)是使用图像的可视化特征对图像进行检索。图像检索提取的特征需要能够准确地表述自身所包含的语义信息,在实际应用中可以根据不同的需求来选择合适的图像匹配算法,以获得最好的检索效果。本文针对传统SIFT算法存在特征向量维度高且匹配准确度较低的问题提出了两种改进算法:SIFT+GLCM算法和Harris-SIFT+LBP算法。完成的工作主要包括:(1)对SIFT算法提取的特征通过聚类算法,生成视觉词汇表,然后将图像原有的特征信息表述为视觉单词直方图,并与通过灰度共生矩阵提取出的特征向量进行融合。融合后的特征向量维度低,且包含两种不同的特征信息。(2)在SIFT算法进行多尺度的极值点提取时加入Harris角点检测技术,获得具有尺度不变性的Harris角点,有效降低了特征点的数量。特征点仍然采用128位的向量进行描述,获取特征向量信息后采用PCA算法对其进行降维处理。(3)对图像分块并采用等价模式LBP算法获取图像的特征信息,与降维后的Harris-SIFT特征向量串行融合,形成新的特征向量矩阵。新的特征向量矩阵较SIFT特征向量矩阵维度更低且包含纹理信息。Harris-SIFT+LBP算法对比SIFT算法和PCA-SIFT算法,匹配准确率分别提高11.92%和8.80%;匹配时间分别增加0.40s和0.72s。(4)采用Py Charm平台、Django框架以及My SQL数据库搭建基于内容的图像检索系统。实验结果表明,较经典的SIFT算法,SIFT+GLCM算法的检索查准率提升6.5%,查全率提升4.5%,检索耗时缩短2.46秒;Harris-SIFT+LBP算法的检索查准率提升12%,查全率提升12.25%,检索耗时缩短1.42秒。本设计对基于内容的图像检索系统的开发具有一定的参考价值。
李宇[5](2021)在《基于Hadoop的分布式外观专利检索系统的设计与实现》文中研究说明快速有效地检索外观专利是开展专利保护和应用的关键。近年来,随着创新主体知识产权保护意识的增强,外观专利数据量迅速增长,单机环境下的外观专利图像检索系统越来越难以满足用户快速检索的需求;而分布式存储和分布式计算模型可应用于对外观专利的高效存储和检索中。为应对外观专利数据量高速增长所带来的挑战,针对单机运行环境下,外观专利检索系统效率不高、可扩展性差等问题,本文对基于内容的图像检索技术及分布式技术做了深入的学习研究,提出了一种基于Hadoop的分布式外观专利图像检索系统,在分布式平台上实现了外观专利图像检索,并对索引和检索过程做了流程优化,主要研究内容如下:1)分析图像检索技术及Hadoop平台的发展现状及面临的问题,阐述了分布式外观专利检索平台的可行性和必要性。分别对基于内容的图像检索关键技术、全文检索技术及分布式计算平台Hadoop进行了研究,实现了利用全文检索技术对图像数据建立倒排索引并检索;实现了利用Hadoop的两大模块--分布式文件系统、分布式计算框架Map Reduce进行外观专利数据的存储和检索。2)设计了一个基于Hadoopd的分布式外观专利检索系统。利用Hadoop平台的分布式文件系统和Map Reduce框架模型,结合全文检索及CBIR技术,对外观专利图像数据库并行化建立倒排索引并检索,搭建基于内容的分布式外观专利检索系统,并且通过实验对比单机环境下与集群环境下系统构建索引的性能。在此基础上,提出优化流程的分布式外观专利检索系统,并将两系统做了横向对比,实验证明优化流程的分布式外观专利检索系统可进一步提高系统运行效率。3)采用多特征联合检索策略优化了外观设计专利检索系统。本文提出多特征联合检索方案,灵活选取多个特征,计算待检索图像与数据库中图象各个特征向量间的距离,将这些距离归一化并进一步处理后,得出综合多个特征的检索结果,此种方法避免了单一特征检索的局限性。分别用单一特征进行检索和利用多特征联合进行检索,并对实验结果进行了对比分析,从检索结果看出多特征联合检索更加符合检索要求。实验表明,采用本文设计的分布式外观专利检索系统对大规模数据的处理具有高效性,并且随着外观图像数据量的增大,分布式的检索系统性能表现更加优越,且可进行灵活扩展,满足用户快速检索的需求。而多特征联合检索的检索效果更能满足丰富多样的检索需求。
刘宏宇[6](2020)在《基于图像描述的外观设计专利图像分类研究与实现》文中研究表明加强对外观设计专利的保护是完善知识产权保护制度的重要环节,检索是保护外观设计专利的关键手段。外观设计专利检索系统主要是一个基于内容的图像检索系统。由于基于内容的图像检索系统存在语义鸿沟的问题,且外观设计专利申请文件相关的文本数据中有关外观设计专利图像内容的描述信息十分有限,因此外观设计专利图像检索系统存在检索效率低以及无法满足用户多样性语义检索需求的问题。图像分类是跨越语义鸿沟的重要方法之一,可以提高系统的检索效率,还能够满足用户语义检索的需求。但是外观设计专利图像数据量通常来说十分庞大,而一般的图像分类模型往往只能实现图像类别的自动识别与判定,难以表达出图像中更多的内容信息,因此对于系统检索效率的提升非常有限。图像描述(Image Caption)能够自动生成给定图像的内容描述,可以表达出图像中更丰富的内容信息,所以研究图像描述十分必要。本文针对于上述问题,将图像描述应用到外观设计专利图像,提出一种基于图像描述的外观设计专利图像分类方法。为了验证文本提出的方法的可行性,主要的工作内容如下:通过分析外观设计专利分类依据以及提高外观设计专利图像检索效率使用的检索特征,对原始的外观设计专利图像进行标注,构建外观设计专利图像描述数据集。在获取外观设计专利图像描述模型编码网络的过程中,本文将两个在Image Net数据集上预训练的卷积神经网络(VGG16和inception V3)来实现外观设计专利图像分类模型。通过训练和微调,获得了两个基于预训练卷积神经网络的外观设计专利图像分类模型,且在外观设计专利图像分类上的准确率高于实验对比模型。同时,本文分析了编码网络的图像特征提取的性能。通过在外观设计专利图像描述数据集上训练基于编码器-解码器结构的外观设计专利图像描述模型,实现了模型对外观设计专利图像的自动描述生成。通过分析模型生成的描述结果在外观设计专利图像分类特征上的识别准确率,验证了本文提出的方法的可行性。同时,在其他条件相同的情况下,文本分析了不同的编码网络对于外观设计专利图像描述模型性能的影响,以及不同的训练样本量对模型在外观设计专利图像分类性能上的影响。
王辉辉[7](2020)在《建筑物空间行人监控视频检索系统设计》文中进行了进一步梳理随着互联网的发展和天网工程的推进,监控摄像头安装数量增长迅速。截止2019年,全球在各类建筑空间有7.7亿个监控摄像头投入使用。到2020年,中国安装摄像头数量预计达到6.26亿个,占全球最大市场份额。监控摄像头的全城覆盖,产生了海量的图像数据,如何高效、智能的分析处理这些视频数据,从中检索到需要的视频片段以满足用户需求是亟待解决的问题。目前监控视频分析手段原始,严重依赖人工排查,效率低下,成本高昂。监控人员长期值守易注意力疲劳,产生安全隐患和准确度低的风险。传统的行人检索系统一般采用人脸识别技术,即基于人的脸部特征信息进行识别。但现实环境复杂多样,后脑勺和侧脸情形,遮挡、角度不佳等外在环境因素,都会导致实际监控视角下的人脸识别出现异常。并且监控摄像头像素不高,尤其远景摄像很难拍摄到清晰的人脸。因此,本文针对当前建筑物空间行人监控视频检索过程中存在的问题和难点,在传统的基于内容的图像检索的基础上,利用深度学习技术具备的学习能力强、可移植性好、适应力强等特点,提出基于HSV颜色空间与ResNet50网络两级检索算法的建筑物空间行人监控视频检索系统的设计思想和实现方法。本文首先从颜色和形状特征入手,将基于内容的图像检索技术应用于建筑物空间行人监控视频检索中,设计并实现了基于HSV颜色空间、SIFT形状特征的监控视频的行人图像检索实验,实验结果显示上述方法对监控视频的行人图像识别度不高,检索正确率较低,但检索速度快。之后设计基于Keras框架的预训练网络ResNet50的行人图像的特征提取和检索实验,结果表明检索正确率有所提升,但计算量大,计算时间长。根据上述实验结果,本文提出一种基于HSV颜色直方图与ResNet50的两级检索算法,然后利用该算法完成建筑物空间行人监控视频检索系统设计。本文利用tensorflow开源框架构建频检索系统,并分别对该系统的架构设计、视频处理、行人检测、目标行人检索、视频剪切等功能进行了详细阐述。最后利用PyQt5设计完成建筑物空间行人监控视频检索系统的应用程序,实现智能化行人监控视频检索,提升工作效率。
杨浩[8](2020)在《基于深度学习的电气设备红外图像检索系统的研究与实现》文中指出本文从基于深度学习的电气设备故障诊断方法的研究出发,提出将基于深度学习的图像检索技术用于变电站的电气设备红外图像的智能诊断中,以此建立一个能够对变电站中大多数设备故障进行精确快速诊断的系统,适应智能电网建设中对变电站高度智能化的要求。本文对基于深度学习的电气设备红外图像检索研究的工作主要包括以下几个方面:(1)将基于深度学习的图像检索方法引入电气设备红外图像检索中。通过分析电气设备红外图像亮度和清晰度不高的特点,对电气设备红外图像增强方法进行研究和实验,最终选用Laplacian算子锐化方法对电气设备红外图像进行预处理,使得输入图像的PSNR值更高。为了提高检索精度,本文利用VGG16卷积神经网络对电气设备红外图像进行特征提取和图像检索。最终的实验结果与在CIFAR-10以及Oxford5k数据集上进行实验的检索结果相比显示,基于深度学习的电气设备红外图像检索系统具有一定的可行性。(2)将基于深度哈希的图像检索方法引入电气设备红外图像检索中。当图像数据大大增加时,将图像的特征转换为二值化哈希码建立索引可以使得检索性能更加优秀。本文在卷积神经网络中增加一层全连接层作为哈希层,设计一个基于深度哈希的电气设备红外图像检索方法,并对其中的损失函数以及汉明距离计算方法进行改进。将基于深度哈希的电气设备红外图像检索结果与LSH和ITQ方法实验结果对比得出,基于深度哈希的红外图像检索具有一定的优越性。对哈希码位数对检索效果的影响进行实验得出,48bits的哈希码在电气设备红外图像的检索精度上更优。(3)使用Flask框架设计并实现了一个基于深度学习的电气设备红外图像检索web界面,并在数据集中进行了实验测试。实验结果表面,本文的基于深度学习的电气设备红外图像检索web界面可以在数据库中检索出与目标图像相近的top-N张图像,满足了对电气设备红外图像进行图像检索的基本功能要求。
韩旭[9](2020)在《基于多特征融合的商标图像检索技术研究》文中研究指明商标是商品的一种重要体现形式,也是用于区分经营者之间的商品或服务的重要标志。在市场经济条件下,生产和经营类似产品的企业,为了提高其产品的知名度和增加产品的销量,都会为自己的企业设计一种独特的商标,以区别于其他企业。因此,加强商标图像的检索力度可以有效防止商标欺诈,抢注等现象的发生,从而可以保持企业享有商标的专有权,保护消费者的权益,保证商标的合法性和唯一性。根据商标图像本身的特征并结合目前商标图像检索所使用的方法,我们将商标图像与其他类型的图像进行比较后发现,决定商标图像特征的因素主要包括形状特征和颜色特征,并且同一类型的商标图像存在尺度,空间位置等变化,因此仅通过提取单一特征或者双特征所完成的检索必然是不准确的,那么如何准确,快速地实现商标图像检索已成为当前亟待解决的问题。结合对以上问题的分析,本文提出了一种基于多特征融合的图像检索算法。我们的方法分为三个阶段:第一阶段,使用改进后的算法对商标图像的形状特征,尺度不变性和颜色特征进行提取;第二阶段,通过分配不同的权重来平衡这三种特征,得到能够准确描述商标图像的特征向量;第三阶段,利用余弦相似度对待检索样本图像和验证样本图像进行相似度检索。我们已经在包含8000多张商标图像的数据库上测试了该方法,然后通过设置对比实验将本文的算法与单一特征和双特征提取的商标图像检索方法进行了比较。并且,为了准确地测量算法的性能,引入了PR曲线作为评估标准。实验结果表明,本文所提到的算法在检索精度和检索时间上均明显优于其他比较算法,这在驰名商标检测和商标着作权保护领域具有良好的实用价值。
石林[10](2020)在《网络Flash动画学习资源的内容结构特征与检索研究》文中研究指明教育信息化是提升教育教学质量的重要手段,是进行教育教学创新应用的基础条件。教育信息化离不开数字化学习资源建设。作为数字化学习资源类型之一的Flash动画是传递信息内容的重要媒体,更是一种重要的网络学习资源,其内容由文本、图形、图像、音频、视频、交互、动态效果等组成。因其强大的多媒体交互及表现能力,Flash动画被广泛应用于远程教学、精品课程网站、慕课平台等领域。网络上积累了海量的Flash动画资源,给动画需求者的检索带来了很多的干扰。学习者如何迅速精准地获取自己需要的Flash动画,是Flash动画搜索引擎需要解决的难题。目前的网络Flash动画检索一般是基于关键词、元数据特征或者网页上下文,检索准确率不理想。于是人们展开了对Flash动画内容特征的深入分析与研究。本研究的选题正是基于SWF格式的文件组织结构,对Flash动画的内容结构特征如场景结构特征、组成元素特征和画面情感特征等进行分析。论文依据Flash动画语义提取的四层框架(即元数据、组成元素、场景、语义层)分别研究了场景特征提取、组成元素特征提取、画面情感特征提取等多项关键技术。该研究的意义主要是为教育教学工作者和网络自学习者以及Flash动画爱好者提供快速、精准的Flash动画搜索服务,从而提高网络Flash动画学习资源的教育应用效率,充分发挥其教育特性。论文首先给出了网络Flash动画学习资源的定义,分析并建立了Flash动画的内容结构特征描述模型;然后构建出场景结构模型,提出场景的分割算法以及场景特征的提取过程;再后,分析并完成了组成元素特征的提取;最后建立了Flash动画的情感分类模型,利用机器学习获得低层视觉特征(主要为颜色和纹理)到高层情感语义的映射关系,从而完成Flash动画的情感分类,并分别用BP神经网络、支持向量机和卷积神经网络进行情感识别,分析不同学科、学段和教学类型的Flash动画画面情感特征的区别。论文的研究结果为最终将前期提取的场景特征、组成元素特征、情感特征存入索引数据库,建立基于内容的Flash动画检索系统,用于网络用户的Flash动画检索。基于此数据库,论文最后还通过实验,利用灰色关联法验证了Flash动画包含的各内容结构特征与学习者的学习兴趣的关联度。结果表明Flash动画中的动态效果特征与学习兴趣的关联度最高,在激发学习者兴趣、集中学习者注意力方面起着重要的作用;不同学段、不同学科的Flash动画中,对学习者学习兴趣唤起起关键作用的内容结构特征是不一样的。实验结果能够为Flash动画课件创作者在开发Flash动画课件时按照不同学段和学科进行视觉特征选择提供理论指导。基于前期研究者开发的网络动画爬取程序,本研究从网络上下载了大量Flash动画,从中筛选出教育特征明显、能辅助进行知识学习的4808个Flash动画学习资源作为本研究的样本库。参考教育理论和查阅文献,本文将这4808个样本按学科、学段来划分,并且提取的视觉场景、组成元素特征、情感特征都按照不同学段、不同学科进行分析,获得不同学段和学科的Flash动画的特征,为后期的Flash动画自动分类工作提供指导。本文的创新之处在于建立了Flash动画的内容结构特征描述模型,并从学段、学科、教学类型三个维度分析了网络Flash动画学习资源的内容结构特征;建立了场景结构模型,并提出了基于颜色直方图和边缘密度相结合的视觉场景分割算法;建立了情感分类模型,分别基于神经网络、支持向量机、卷积神经网络完成Flash动画的情感语义识别;分析了网络Flash动画学习资源的内容结构特征与学生学习兴趣的关联度。
二、基于内容的图像检索技术研究与实现(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、基于内容的图像检索技术研究与实现(论文提纲范文)
(1)基于目标检测的图像检索技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 研究现状 |
1.2.1 传统基于内容的图像检索技术 |
1.2.2 基于深度学习的图像检索技术 |
1.3 主要研究内容 |
1.4 章节安排 |
第二章 基础理论及方法 |
2.1 基于内容的图像检索技术介绍 |
2.1.1 常用图像特征简介 |
2.1.2 常用相似度计算方法 |
2.2 目标检测算法介绍 |
2.2.1 R-CNN算法 |
2.2.2 YOLO算法 |
2.3 本章小结 |
第三章 结合高层语义与底层颜色特征的图像检索 |
3.1 图像高层语义的提取与二值化 |
3.2 底层颜色特征的提取 |
3.2.1 颜色直方图特征 |
3.2.2 颜色矩特征 |
3.3 倒排索引和相似度计算 |
3.3.1 倒排索引 |
3.3.2 相似度计算 |
3.4 本章小结 |
第四章 实验结果与分析 |
4.1 实验环境介绍 |
4.2 数据集及配置 |
4.2.1 PASCAL VOC图像数据集 |
4.2.2 Microsoft COCO图像数据集 |
4.3 评价指标 |
4.4 实验结果及分析 |
4.4.1 结合高层语义与底层颜色特征的图像检索性能测试 |
4.4.2 高层语义与底层颜色特征结合的有效性实验 |
4.5 本章小结 |
第五章 图像检索系统的实现 |
5.1 系统功能与设计 |
5.2 系统实现与展示 |
5.3 本章小结 |
第六章 总结与展望 |
6.1 论文总结 |
6.2 工作展望 |
参考文献 |
在学期间的研究成果 |
致谢 |
(2)基于弱监督的社交媒体图像多目标哈希方法研究与检索系统实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 研究现状 |
1.2.1 图像检索研究现状 |
1.2.2 社交媒体图像检索研究现状 |
1.2.3 多目标图像检索研究现状 |
1.3 主要研究内容与创新点 |
1.4 论文组织框架 |
第二章 相关技术理论与方法 |
2.1 图像检索技术 |
2.1.1 基于内容的图像检索 |
2.1.2 哈希图像检索 |
2.1.3 多目标图像检索 |
2.2 弱监督学习 |
2.2.1 弱监督学习定义及分类 |
2.2.2 弱监督哈希学习 |
2.2.3 弱监督目标检测 |
2.3 多任务学习 |
2.4 本章小结 |
第三章 社会标签优化方法 |
3.1 社会标签分析 |
3.2 噪声标签处理 |
3.2.1 WordNet模型 |
3.2.2 语义过滤 |
3.2.3 词性过滤 |
3.3 标签补全优化 |
3.4 标签语义聚类 |
3.5 实验对比 |
3.5.1 社会标签图像数据集 |
3.5.2 评价指标 |
3.5.3 相似性度量方法 |
3.5.4 实验与分析 |
3.6 本章小结 |
第四章 基于弱监督检测的图像多目标哈希学习 |
4.1 基于弱监督检测的多目标哈希模型 |
4.2 目标建议区域特征表示 |
4.3 弱监督目标检测分支 |
4.4 多目标哈希学习分支 |
4.5 模型训练 |
4.6 实验对比 |
4.6.1 实验数据集 |
4.6.2 评估指标 |
4.6.3 相似性度量方法 |
4.6.4 实验与分析 |
4.7 本章小结 |
第五章 基于多目标的图像检索系统的设计与实现 |
5.1 系统开发与运行环境 |
5.1.1 硬件环境 |
5.1.2 软件环境 |
5.2 系统设计 |
5.2.1 系统功能描述 |
5.2.2 系统框架设计 |
5.2.3 系统实现 |
5.3 系统功能展示 |
5.4 本章小结 |
总结与展望 |
参考文献 |
致谢 |
攻读硕士学位期间取得的科研成果 |
(3)基于深层特征的图像检索研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景与意义 |
1.2 国内外研究现状 |
1.2.1 CBIR技术研究现状 |
1.2.2 基于深层特征的图像检索研究现状 |
1.3 主要研究内容 |
1.4 主要章节安排 |
第二章 图像检索相关理论及方法 |
2.1 图像检索的典型流程 |
2.1.1 经典图像检索流程 |
2.1.2 基于深层特征的图像检索流程 |
2.2 低级视觉特征 |
2.2.1 颜色特征 |
2.2.2 纹理特征 |
2.2.3 形状特征 |
2.2.4 局部特征 |
2.3 高级语义特征 |
2.4 相似性度量方法 |
2.5 检索性能评估指标 |
2.6 本章小结 |
第三章 基于多阶段特征整合方案的图像检索 |
3.1 颜色空间转换 |
3.2 颜色特征提取与初始特征融合 |
3.3 多阶段特征整合方案 |
3.3.1 第一阶段边缘特征整合 |
3.3.2 第二阶段边缘特征整合 |
3.3.3 第三阶段边缘特征整合 |
3.4 视觉特征表示 |
3.5 实验结果及分析 |
3.5.1 数据集 |
3.5.2 算法评估及分析 |
3.6 本章小节 |
第四章 基于端到端再训练的深层特征图像检索 |
4.1 深度学习概述 |
4.2 卷积神经网络模型 |
4.2.1 AlexNet |
4.2.2 VGGNet |
4.2.3 GoogLeNet |
4.3 本章算法 |
4.3.1 训练数据集 |
4.3.2 网络初始化 |
4.3.3 训练参数配置 |
4.3.4 端到端孪生网络训练 |
4.3.5 广义平均池化 |
4.3.6 视觉特征表示 |
4.4 实验结果及分析 |
4.4.1 测试数据集 |
4.4.2 主成分分析及白化 |
4.4.3 加权扩展查询 |
4.4.4 算法评估与分析 |
4.5 本章小结 |
第五章 总结与展望 |
参考文献 |
攻读硕士学位期间的科研情况 |
致谢 |
(4)基于内容的图像检索系统的研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 课题研究的背景及意义 |
1.2 国内外研究现状 |
1.2.1 图像检索系统 |
1.2.2 特征匹配算法 |
1.3 主要内容及章节安排 |
1.4 本章小结 |
第2章 相关理论 |
2.1 图像检索系统 |
2.2 图像预处理 |
2.3 基于特征的图像匹配方法及评价指标 |
2.4 相似性度量方法 |
2.5 本章小结 |
第3章 基于多特征融合的图像匹配算法 |
3.1 SIFT算法特征点生成及匹配过程分析 |
3.2 SIFT算法的特征提取与匹配结果 |
3.3 基于SIFT算法的改进算法 |
3.4 图像匹配中的其它经典算法 |
3.5 基于多特征融合的图像匹配算法 |
3.6 本章小结 |
第4章 图像检索系统设计 |
4.1 图像检索系统的模块设计 |
4.2 图像检索系统实现的关键技术 |
4.3 MySQL表格设计 |
4.4 数据图像爬取 |
4.5 系统页面展示 |
4.6 本章小结 |
第5章 实验结果及分析 |
5.1 图像匹配算法的尺度不变性及旋转不变性实验 |
5.2 算法性能评估 |
5.3 图像检索系统性能实验 |
5.4 本章小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读硕士期间的研究成果 |
致谢 |
(5)基于Hadoop的分布式外观专利检索系统的设计与实现(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 本课题研究背景及研究意义 |
1.2 国内外相关研究现状 |
1.2.1 图像检索研究现状 |
1.2.2 专利检索技术研究现状 |
1.2.3 分布式技术研究现状 |
1.3 研究目标和主要贡献 |
1.3.1 课题研究目标 |
1.3.2 论文的主要贡献 |
1.4 本章小结 |
第二章 Hadoop相关技术 |
2.1 Hadoop平台 |
2.1.1 Hadoop概述 |
2.1.2 Hadoop运行流程 |
2.1.3 Hadoop组件及生态圈 |
2.2 分布式文件系统(HDFS) |
2.3 Map Reduce编程模型 |
2.4 Yarn集群及调度策略研究 |
2.4.1 Yarn集群 |
2.4.2 Yarn集群调度策略研究 |
2.5 本章小结 |
第三章 多特征联合检索策略研究 |
3.1 基于内容的图像检索 |
3.1.1 基于内容的图像检索简介 |
3.1.2 低层视觉特征 |
3.1.3 相似性度量方法 |
3.2 全文检索技术 |
3.2.1 全文检索系统架构 |
3.2.2 倒排文档索引原理 |
3.2.3 Lucene |
3.3 基于LIRE的多特征联合检索策略 |
3.3.1 LIRE |
3.3.2 图像特征提取及建立索引 |
3.3.3 特征归一化 |
3.3.4 多特征联合检索策略 |
3.4 本章小结 |
第四章 分布式外观专利检索系统的设计与实现 |
4.1 需求分析 |
4.2 系统总体设计 |
4.3 并行化提取图像特征与并行化检索 |
4.3.1 数据类型适配 |
4.3.2 并行化提取图像特征与检索 |
4.4 分布式索引流程优化 |
4.4.1 问题分析及可行性分析 |
4.4.2 分布式索引优化流程 |
4.5 本章小结 |
第五章 实验与结果分析 |
5.1 实验环境搭建 |
5.2 平台搭建 |
5.3 实验与结果分析 |
5.3.1 系统性能的测试 |
5.3.2 外观专利检索实验 |
5.4 本章小结 |
结论与展望 |
参考文献 |
攻读学位期间取得与学位论文相关的成果 |
致谢 |
(6)基于图像描述的外观设计专利图像分类研究与实现(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 外观设计专利图像检索技术研究现状 |
1.2.2 外观设计专利图像分类技术研究现状 |
1.2.3 图像描述研究现状 |
1.3 主要研究内容 |
1.4 论文结构与安排 |
2 分类依据及图像标注说明 |
2.1 外观设计专利图像分类依据 |
2.2 图像描述数据集标注说明 |
2.3 本章小结 |
3 图像描述模型关键技术 |
3.1 卷积神经网络 |
3.1.1 卷积神经网络概述 |
3.1.2 卷积层 |
3.1.3 池化层 |
3.1.4 参数学习 |
3.2 循环神经网络 |
3.2.1 循环神经网络概述 |
3.2.2 长短期时序记忆网络 |
3.2.3 参数学习 |
3.3 文本向量化 |
3.3.1 独热编码 |
3.3.2 词嵌入 |
3.4 集束搜索 |
3.5 本章小结 |
4 外观设计专利图像描述算法 |
4.1 模型基本框架和实现步骤 |
4.2 外观设计专利图像描述模型的实现 |
4.2.1 图像预处理 |
4.2.2 获取图像编码网络 |
4.2.3 训练图像描述模型 |
4.3 实验设计与结果分析 |
4.3.1 实验环境和数据说明 |
4.3.2 实验及结果分析 |
4.4 本章小结 |
5 总结和展望 |
参考文献 |
致谢 |
攻读硕士学位期间取得的研究成果 |
学位论文数据集表 |
(7)建筑物空间行人监控视频检索系统设计(论文提纲范文)
摘要 |
Abstract |
1 绪论 |
1.1 课题研究背景 |
1.2 课题相关领域发展现状 |
1.2.1 深度学习发展现状 |
1.2.2 目标检测发展现状 |
1.2.3 图像检索研究现状 |
1.2.4 视频图像检索系统研究现状 |
1.3 选题的目的及意义 |
1.3.1 选题的目的 |
1.3.2 选题的意义 |
1.4 论文结构 |
2 建筑物空间行人监控视频检索系统研究方案 |
2.1 行人监控视频检索系统研究内容 |
2.2 行人监控视频检索系统研究方案 |
2.3 行人检测研究 |
2.4 本章小结 |
3 基于内容与深度学习的行人图像检索研究 |
3.1 关于行人图像检索的基础知识 |
3.1.1 相似度计算方法 |
3.1.2 检索性能评价指标 |
3.1.3 行人检索实验数据库 |
3.2 基于HSV颜色直方图的行人图像检索研究 |
3.2.1 HSV颜色直方图概述 |
3.2.2 行人图像检索实验 |
3.2.3 实验结果分析 |
3.3 基于SIFT特征的行人图像检索研究 |
3.3.1 SIFT特征概述 |
3.3.2 行人图像检索实验 |
3.3.3 实验结果分析 |
3.4 基于VGG16预训练模型的行人图像检索研究 |
3.4.1 VGG16概述 |
3.4.2 行人图像检索实验 |
3.4.3 实验结果分析 |
3.5 基于Res Net50 预训练模型的行人图像检索研究 |
3.5.1 Res Net50 概述 |
3.5.2 行人图像检索实验 |
3.5.3 实验结果分析 |
3.6 本章小结 |
4 基于HSV颜色直方图与Res Net50 的行人图像检索研究 |
4.1 两级检索算法概述 |
4.2 两级检索算法的实现 |
4.3 实验结果分析与比较 |
4.4 本章小结 |
5 建筑物空间行人监控视频检索系统设计与实现 |
5.1 系统架构设计 |
5.2 系统开发运行环境 |
5.2.1 硬件环境 |
5.2.2 软件环境 |
5.3 系统功能实现 |
5.3.1 系统开发流程 |
5.3.2 系统可视化界面 |
5.3.3 系统功能模块实现 |
5.4 本章小结 |
结论 |
参考文献 |
在学研究成果 |
致谢 |
(8)基于深度学习的电气设备红外图像检索系统的研究与实现(论文提纲范文)
摘要 |
abstract |
第一章 绪论 |
1.1 课题的研究背景和意义 |
1.2 国内外研究现状 |
1.2.1 红外图像技术在变电站设备监测中研究现状 |
1.2.2 图像检索技术在电力系统领域的研究现状 |
1.2.3 深度学习在电力系统中应用的研究 |
1.3 主要研究内容及章节安排 |
第二章 相关技术及理论 |
2.1 红外热成像技术 |
2.2 卷积神经网络 |
2.2.1 卷积神经网络概述 |
2.2.2 卷积神经网络的类型 |
2.3 图像检索技术 |
2.4 本章小结 |
第三章 基于深度学习的电气设备红外图像检索 |
3.1 总体流程 |
3.2 图像增强 |
3.2.1 直方图均衡化 |
3.2.2 Laplacian算子锐化算法 |
3.2.3 中值滤波算法 |
3.2.4 实验结果对比 |
3.3 实验及分析 |
3.3.1 网络模型结构 |
3.3.2 性能评价 |
3.3.3 实验结果 |
3.4 本章小结 |
第四章 基于深度哈希的电气设备红外图像检索 |
4.1 哈希算法 |
4.1.1 局部敏感哈希(LSH) |
4.1.2 迭代量化哈希(ITQ) |
4.1.3 基于哈希算法的索引方式 |
4.2 深度哈希模型 |
4.2.1 深度哈希算法 |
4.2.2 模型结构 |
4.2.3 损失函数 |
4.3 相似性度量 |
4.3.1 相似性度量算法 |
4.3.2 改进汉明距离 |
4.4 实验及分析 |
4.4.1 实验数据 |
4.4.2 实验结果及分析 |
4.5 本章小结 |
第五章 电气设备红外图像检索系统设计 |
5.1 检索系统框架设计 |
5.2 系统功能设计 |
5.3 系统应用 |
5.4 本章小结 |
第六章 总结与展望 |
6.1 本文总结 |
6.2 展望 |
参考文献 |
个人简历 在读期间发表的学术论文 |
致谢 |
(9)基于多特征融合的商标图像检索技术研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 关于图像检索问题的研究背景和意义 |
1.2 商标图像检索的国内外研究现状 |
1.2.1 传统商标图像检索方法 |
1.2.2 国内外商标图像检索技术现状 |
1.3 研究工作和创新点 |
1.4 论文组织结构 |
第二章 基于内容的商标图像检索 |
2.1 商标图像检索实现原理及方法 |
2.2 多特征商标图像检索的相关工作 |
2.2.1 商标图像分类 |
2.2.2 商标图像预处理 |
2.2.3 特征提取 |
2.2.4 相似度检测 |
2.3 基于内容的商标图像检索中存在的问题 |
2.4 本章小结 |
第三章 商标图像特征提取算法 |
3.1 相关算法研究 |
3.2 形状特征提取 |
3.2.1 PHOG算法原理 |
3.2.2 MPHOG算法的实现 |
3.3 尺度不变性 |
3.3.1 SIFT特征提取 |
3.3.2 改进的SIFT算法 |
3.3.3 局部独立变化的特征图像 |
3.4 颜色特征提取 |
3.4.1 HSV彩色空间量化 |
3.4.2 局部累积直方图 |
3.5 本章小结 |
第四章 商标图像特征融合技术 |
4.1 特征融合技术概述 |
4.2 商标图像特征融合方案 |
4.2.1 特性向量归一化 |
4.2.2 权重分配策略 |
4.3 商标图像检索方法 |
4.3.1 余弦相似度 |
4.3.2 几种检索方法的效果比较 |
4.4 特征融合图像 |
4.4.1 确定融合系数 |
4.4.2 特征融合图像相似度匹配 |
4.5 本章小结 |
第五章 商标图像检索实验 |
5.1 准备工作 |
5.1.1 实验图像数据集 |
5.1.2 搭建实验环境 |
5.1.3 性能评估 |
5.2 基于多特征融合的商标图像检索实验 |
5.2.1 基于单一特征的商标图像检索对比实验 |
5.2.2 基于双特征组合的商标图像检索对比实验 |
5.3 实验结果分析总结 |
5.4 本章小结 |
总结与展望 |
参考文献 |
附录 |
致谢 |
(10)网络Flash动画学习资源的内容结构特征与检索研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 研究现状 |
1.3 研究目的、内容、方法和创新点 |
1.3.1 研究目的 |
1.3.2 研究内容 |
1.3.3 研究方法 |
1.3.4 创新点 |
1.4 论文内容安排 |
第二章 理论基础 |
2.1 教育信息化与数字化学习资源建设 |
2.2 多媒体信息内容管理理论 |
2.3 学习资源的语义分析 |
2.4 元数据描述 |
2.5 基于内容的信息检索技术 |
第三章 网络Flash动画学习资源概述与内容结构特征描述模型 |
3.1 网络Flash动画学习资源分析 |
3.1.1 网络Flash动画学习资源的特点 |
3.1.2 网络Flash动画学习资源的分类 |
3.1.3 网络Flash动画在互联网中的存在形式 |
3.1.4 网络Flash动画学习资源搜索 |
3.2 网络Flash动画在教育教学中的应用分析 |
3.2.1 网络Flash动画在教育教学应用中的优势 |
3.2.2 网络Flash动画在教育教学应用中的属性分析 |
3.3 网络Flash动画学习资源样本集分析 |
3.4 网络Flash动画的内容结构特征描述模型 |
第四章 网络Flash动画学习资源的场景特征分析 |
4.1 网络Flash动画的文件结构 |
4.2 网络Flash动画的场景结构模型 |
4.3 逻辑场景分割 |
4.3.1 逻辑场景 |
4.3.2 逻辑场景分割 |
4.4 视觉场景分割 |
4.4.1 视觉场景 |
4.4.2 视觉场景分割 |
4.5 场景分割实验与场景特征分析 |
第五章 网络Flash动画学习资源的组成元素特征分析 |
5.1 组成元素特征概述 |
5.2 静态视觉特征提取 |
5.2.1 静态视觉特征定义方式 |
5.2.2 静态视觉特征提取方法 |
5.2.3 静态视觉特征分析 |
5.3 动态效果提取 |
5.3.1 动态效果定义方式 |
5.3.2 动态效果提取方法 |
5.3.3 动态效果分析 |
5.4 交互特征提取 |
5.4.1 交互方式与交互特征 |
5.4.2 交互定义方式 |
5.4.3 交互特征提取 |
5.4.4 交互特征分析 |
第六章 网络Flash动画学习资源的画面情感特征分析 |
6.1 多媒体画面情感研究现状 |
6.2 多媒体画面情感描述模型 |
6.2.1 情感分类模型 |
6.2.2 画面特征提取 |
6.3 网络Flash动画学习资源的画面情感识别 |
6.3.1 视觉特征数据预处理 |
6.3.2 情感特征数据获取 |
6.3.3 基于BP神经网络的情感识别 |
6.3.4 基于SVM的学习过程情感识别 |
6.3.5 基于CNN的情感识别 |
6.4 实验结果综合分析 |
6.5 小结 |
第七章 基于内容结构的网络Flash动画学习资源检索系统 |
7.1 检索系统研究现状 |
7.2 检索系统设计 |
7.2.1 系统需求分析 |
7.2.2 功能模块设计 |
7.2.3 数据库设计 |
7.3 检索系统实现 |
7.3.1 环境要求 |
7.3.2 模块实现 |
7.3.3 检索界面 |
7.3.4 系统测试 |
7.4 检索系统的应用 |
7.4.1 系统面向对象 |
7.4.2 系统应用案例 |
7.4.3 案例分析 |
第八章 Flash动画内容结构特征与学习兴趣关联度分析 |
8.1 实验设计 |
8.2 实验平台开发 |
8.3 实验实施过程 |
8.4 实验分析 |
第九章 总结与展望 |
9.1 论文工作总结 |
9.2 工作展望 |
注释 |
参考文献 |
图索引 |
表索引 |
附录 |
攻读博士学位期间的学术成果 |
谢辞 |
四、基于内容的图像检索技术研究与实现(论文参考文献)
- [1]基于目标检测的图像检索技术研究[D]. 骆俊锋. 北方工业大学, 2021(01)
- [2]基于弱监督的社交媒体图像多目标哈希方法研究与检索系统实现[D]. 舒永康. 西北大学, 2021(12)
- [3]基于深层特征的图像检索研究[D]. 褚凯. 广西师范大学, 2021(09)
- [4]基于内容的图像检索系统的研究[D]. 王鑫城. 东华大学, 2021(01)
- [5]基于Hadoop的分布式外观专利检索系统的设计与实现[D]. 李宇. 广东工业大学, 2021
- [6]基于图像描述的外观设计专利图像分类研究与实现[D]. 刘宏宇. 广东技术师范大学, 2020(02)
- [7]建筑物空间行人监控视频检索系统设计[D]. 王辉辉. 内蒙古科技大学, 2020(01)
- [8]基于深度学习的电气设备红外图像检索系统的研究与实现[D]. 杨浩. 华东交通大学, 2020(03)
- [9]基于多特征融合的商标图像检索技术研究[D]. 韩旭. 郑州轻工业大学, 2020(07)
- [10]网络Flash动画学习资源的内容结构特征与检索研究[D]. 石林. 山东师范大学, 2020(08)