导读:本文包含了视频理解和检索论文开题报告文献综述及选题提纲参考文献,主要关键词:图片重排序,图像检索,范本模型,显着图模型
视频理解和检索论文文献综述
陈凯[1](2013)在《基于视觉信息分析的图像和视频理解及检索》一文中研究指出随着互联网的迅猛发展,当前世界不断涌现出各种新兴的社交媒体,例如:Facebook,Flickr,Twitter,Instagram等等。而伴随着这些新的网络媒体的出现,各种图像和视频媒体每天以数以亿记的数量产生,不断地被传播,分享和编辑。如何基于这些图像和视频更有效和快速地理解及检索就成了一个值得研究和有趣的课题。在本文中我们分别对图像和视频的理解和检索进行了讨论,使之能更有效地服务于信息检索引擎的检索和理解。在图像的重排序部分,我们提出了一种重排序图像检索结果的新方法,它可以被适用到对象类和场景类中。我们首先介绍了两种方法:范本模型和显着图模型。范本模式是自上而下的方法,该方法考虑同一个类中图像的感兴趣区域(ROI),它包含很多类似的显着特征。这些显着特征可以被用来训练模型,并重新排名查询的测试图片。另一方面,显着图模型是一个自底向上的方法,该方法采用赢者通吃和返回抑制机制来找出梯度下降显着的区块,其显着图像可以用来进行重排序。在实验中,我们观察到的范本模型在对象类中表现良好,而显着图模型在场景类更好,两个方法专注于不同的方面。最后,我们提出了一个方法ExSM模型,结合了范本模型和显着图模型的优势。ExSM在场景类和对象类中都表现得很好。在视频理解部分,我们提出了一种方法,它结合了权重模板和时空模板来识别人类的动作。首先,考虑到身体的不同部位在不同的行为动作中发挥着截然不同的重要角色。所以在人类动作的识别中,我们建议采用于基于光流局部描述符的权重不同的动作识别模板。然后,我们提出了时空模板,由运动能量图像(MEI)和运动历史图像(MHI)组成,包含了全局描述符和时间信息的描述符。考虑到局部描述符,全局描述符与时间信息,我们融合了权重模板和时空模板来进行识别动作。实验结果表明,融合的模板可以有效地从不同的方面识别人的动作。(本文来源于《复旦大学》期刊2013-03-15)
高平利[2](2005)在《视频理解和检索中文字的检测与提取技术研究》一文中研究指出本论文研究的主要内容是视频中文字信息的检测、提取与识别技术,它是基于内容的视频理解和检索的重要组成部分。作为一个有着广泛应用背景的研究领域,视频文字的检测与提取(Text Detection and Extraction,简称TDE)吸引了大批研究学者的参与。本文在前人工作的基础上,通过对视频分段以及视频数据多级结构的分析,重点研究了非压缩域和压缩域视频中文字的检测与提取方法,设计并实现了一个完整的基于边缘检测—投影的视频TDE系统,并期望在此基础上增强对算法的理解以及对某些问题的求解作出改进。 视频数据包含丰富的语义内容,但同时具有复杂的时空维信息,本文首先对视频数据的分段及多级结构抽象作了分析,进而针对基于内容的视频检索中的若干关键技术(镜头变换检测、关键帧提取和场景分割)进行重点研究和分析。这部分内容是视频文字检测与提取(TDE)算法研究的基础。 在非压缩域视频中文字的检测与提取(TDE)方面,本文着重研究了文字事件检测、候选文字区域的检测与分割、非文字区域滤除、单字分割以及视频文字识别(Video OCR)等内容。针对每种方法,本文都给出了算法分析和实现步骤,并指出其适用范围。在这一部分,本文还研究和实现了一种基于小波变换和形态学操作的TDE算法,并给出实验结果与分析。 在压缩域视频中文字的检测与提取方面,本文主要研究了基于DC图像序列和DCT块的TDE算法。作为基础内容,首先介绍了DCT变换的基本思想以及MPEG视频压缩编码标准。然后详细研究了DC图像的获取方法并给出实验结果,同时对一种基于DCT块的TDE算法做了改进和实验验证。最后,本文还分析了一种基于视频各分量信息抽取、压缩域和空间域结合的文字检测与提取(TDE)方法。 通过对各种边缘检测算法的实验分析,本文设计和实现了一种基于边缘检测一投影的视频TDE实验系统。针对每个关键算法都作了详尽分析和实验结果评价,并指出该算法的优缺点。结果表明,该实验系统取得了较好的文字提取效果。最后,本文还指出了TDE算法研究的发展方向及在视频理解与检索中的应用前景。(本文来源于《西北工业大学》期刊2005-03-01)
视频理解和检索论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本论文研究的主要内容是视频中文字信息的检测、提取与识别技术,它是基于内容的视频理解和检索的重要组成部分。作为一个有着广泛应用背景的研究领域,视频文字的检测与提取(Text Detection and Extraction,简称TDE)吸引了大批研究学者的参与。本文在前人工作的基础上,通过对视频分段以及视频数据多级结构的分析,重点研究了非压缩域和压缩域视频中文字的检测与提取方法,设计并实现了一个完整的基于边缘检测—投影的视频TDE系统,并期望在此基础上增强对算法的理解以及对某些问题的求解作出改进。 视频数据包含丰富的语义内容,但同时具有复杂的时空维信息,本文首先对视频数据的分段及多级结构抽象作了分析,进而针对基于内容的视频检索中的若干关键技术(镜头变换检测、关键帧提取和场景分割)进行重点研究和分析。这部分内容是视频文字检测与提取(TDE)算法研究的基础。 在非压缩域视频中文字的检测与提取(TDE)方面,本文着重研究了文字事件检测、候选文字区域的检测与分割、非文字区域滤除、单字分割以及视频文字识别(Video OCR)等内容。针对每种方法,本文都给出了算法分析和实现步骤,并指出其适用范围。在这一部分,本文还研究和实现了一种基于小波变换和形态学操作的TDE算法,并给出实验结果与分析。 在压缩域视频中文字的检测与提取方面,本文主要研究了基于DC图像序列和DCT块的TDE算法。作为基础内容,首先介绍了DCT变换的基本思想以及MPEG视频压缩编码标准。然后详细研究了DC图像的获取方法并给出实验结果,同时对一种基于DCT块的TDE算法做了改进和实验验证。最后,本文还分析了一种基于视频各分量信息抽取、压缩域和空间域结合的文字检测与提取(TDE)方法。 通过对各种边缘检测算法的实验分析,本文设计和实现了一种基于边缘检测一投影的视频TDE实验系统。针对每个关键算法都作了详尽分析和实验结果评价,并指出该算法的优缺点。结果表明,该实验系统取得了较好的文字提取效果。最后,本文还指出了TDE算法研究的发展方向及在视频理解与检索中的应用前景。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
视频理解和检索论文参考文献
[1].陈凯.基于视觉信息分析的图像和视频理解及检索[D].复旦大学.2013
[2].高平利.视频理解和检索中文字的检测与提取技术研究[D].西北工业大学.2005