导读:本文包含了视频高层语义论文开题报告文献综述及选题提纲参考文献,主要关键词:高层语义概念检测,底层视觉特征,系统融合算法,机器学习
视频高层语义论文文献综述
刘继晴[1](2011)在《基于多特征融合的视频高层语义概念检测》一文中研究指出近年来,随着视频检索技术的快速发展,如何跨越语义鸿沟,使机器像人类一样更好的理解视频中的语义概念,满足用户对视频信息管理和检索的需求,已经成为目前迫切需要解决的一个重要问题。因此,视频高层语义概念检测技术已成为新一代多媒体搜索引擎的研究热点。本文研究基于多特征融合的视频高层语义概念检测技术,全面分析了底层视觉特征的提取技术,并提出了一些新的融合算法,主要内容如下:底层视觉特征方面,本文全面分析和比较了颜色、边缘、纹理等全局特征和SIFT、HOG等局部描述子特征的特点及其在视频语义概念检测中的性能。本文采用Bag-of-Feature关键点投影算法来组织和表达局部描述子特征,有效地量化了关键点特征,提高了分类器的训练速度;在此基础上本文采用了基于空间金字塔的特征匹配技术,克服了以往方法完全丢弃特征点空间信息的问题。另外,本文还引入了文本检索领域的PLSA算法,与空间金字塔技术相结合,在全体数据集上分析视觉词汇的上下文关系,进一步增强了视觉特征的语义表达能力,并降低了计算复杂度。系统融合算法方面,本文在特征级、核函数级和分类器级别上研究视频语义概念检测中的系统融合技术,提出了一种基于多核学习的核函数级系统融合算法和一种基于逻辑回归与线性加权分类器级系统融合算法,将不同视觉特征的优势有效地结合起来,增强了对视频中场景、物体、事件等多类语义概念检测的鲁棒性。在这些算法的基础上,本文还提出了一种结合多种融合算法的多层次融合框架,在实验中获得了更好的概念检测性能。在TRECVID 2009高层特征提取评测和TRECVID 2010的语义索引评测中,本文构建的基于多种底层视觉特征融合的视频高层语义概念检测系统均名列前茅。(本文来源于《北京邮电大学》期刊2011-01-11)
孙子晨[2](2009)在《视频高层语义提取技术研究与应用》一文中研究指出随着数字信息技术的飞速发展,海量的多媒体数据已越来越多地融入了人们的日常生活之中,然而如何能够快速有效地从中查找到所需要的信息却是一个严峻的挑战。同时,在多媒体信息检索的研究中,基于内容的视频检索因其涉及内容数据量大、关系复杂及包含多模态信息等特点成为了颇具代表性的一个子任务。本文对此进行了深入探讨,并着重从测度学习的角度出发,对其中关键的视频高层语义提取技术及其相关的应用系统进行了研究。在基于内容的视频检索中,人们往往喜欢使用描述性的查询来对所需要的高层语义进行近似,也即包含所需要信息的语句、样例图片或视频片断等。对此,通过寻找与查询相似的近邻样本数据点来得到结果,如较常用的K近邻算法等是十分有效的方法。然而,这对相似性的度量提出了很高的要求,一般的欧式空间因缺乏对样本空间较好地描述,而不能得到很好的效果,这样,如何能够学习得到有效的测度在这个背景下就显得十分关键。本文对测度学习,尤其是带监督的测度学习进行了系统的研究,以寻找一种使得在学习得到的测度空间下近邻样本能够真正体现分类信息的有效方法,从而较为准确地得到高层语义。其中,最大边际近邻分析结合了类似支撑向量机的最大边际框架,能够得到很好的泛化性能。本文针对大规模数据特点对其进行了优化,以使得能够有更高的检索效率。同时,作为信息可视化的典型应用,基于内容视频检索的一个目标就是能够将所需要的信息有效地进行组织并呈现给用户。本文结合该思想以及高层语义特征提取相关算法进行了具体系统的设计,特点是一方面能够利用有效的测度学习方法对视频的语义信息进行提取并通过合适的检索模型予以组织,另一方面能够通过合理的前台设计,结合视频的结构特点有效地将后台信息呈现给用户并将用户的反馈及时准确地传输给系统对模型进行优化。针对以上的算法及其应用,我们结合TRECVID和VideOIymipcs视频检索评测进行了实验分析,且取得了不错的实验效果。(本文来源于《复旦大学》期刊2009-04-15)
张治国,刘怀亮,马志辉,张毅,赵娜[3](2007)在《基于高层语义的视频检索研究》一文中研究指出视频语义检索的研究是目前研究的热点之一。现有的视频检索系统技术多是基于底层特征的、非语义层次的检索。与人类思维中所能理解的高层语义概念相去甚远,这严重影响视频检索的实际效果。如何跨越底层特征和高层语义的鸿沟,用高层语义概念进行视频检索是当前研究的重点。通过对视频内容的语义理解、语义分析、语义提取的简要概述,试图构造一种视频语义检索模型。(本文来源于《计算机工程与应用》期刊2007年18期)
许源,薛向阳[4](2006)在《一种视频局部高层语义特征提取算法》一文中研究指出准确提取视频高层语义特征,有助于更好地进行基于内容的视频检索。视频局部高层语义特征描述的是图像帧中的物体。考虑到物体本身以及物体所处的特定场景所具有的特点,我们提出一种将图像帧的局部信息和全局信息结合起来提取视频局部高层语义特征的算法。在TRECVID2005数据集上的实验结果表明,与单独基于局部或者单独基于全局的方法相比,此方法具有较好的性能。(本文来源于《计算机科学》期刊2006年11期)
视频高层语义论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着数字信息技术的飞速发展,海量的多媒体数据已越来越多地融入了人们的日常生活之中,然而如何能够快速有效地从中查找到所需要的信息却是一个严峻的挑战。同时,在多媒体信息检索的研究中,基于内容的视频检索因其涉及内容数据量大、关系复杂及包含多模态信息等特点成为了颇具代表性的一个子任务。本文对此进行了深入探讨,并着重从测度学习的角度出发,对其中关键的视频高层语义提取技术及其相关的应用系统进行了研究。在基于内容的视频检索中,人们往往喜欢使用描述性的查询来对所需要的高层语义进行近似,也即包含所需要信息的语句、样例图片或视频片断等。对此,通过寻找与查询相似的近邻样本数据点来得到结果,如较常用的K近邻算法等是十分有效的方法。然而,这对相似性的度量提出了很高的要求,一般的欧式空间因缺乏对样本空间较好地描述,而不能得到很好的效果,这样,如何能够学习得到有效的测度在这个背景下就显得十分关键。本文对测度学习,尤其是带监督的测度学习进行了系统的研究,以寻找一种使得在学习得到的测度空间下近邻样本能够真正体现分类信息的有效方法,从而较为准确地得到高层语义。其中,最大边际近邻分析结合了类似支撑向量机的最大边际框架,能够得到很好的泛化性能。本文针对大规模数据特点对其进行了优化,以使得能够有更高的检索效率。同时,作为信息可视化的典型应用,基于内容视频检索的一个目标就是能够将所需要的信息有效地进行组织并呈现给用户。本文结合该思想以及高层语义特征提取相关算法进行了具体系统的设计,特点是一方面能够利用有效的测度学习方法对视频的语义信息进行提取并通过合适的检索模型予以组织,另一方面能够通过合理的前台设计,结合视频的结构特点有效地将后台信息呈现给用户并将用户的反馈及时准确地传输给系统对模型进行优化。针对以上的算法及其应用,我们结合TRECVID和VideOIymipcs视频检索评测进行了实验分析,且取得了不错的实验效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
视频高层语义论文参考文献
[1].刘继晴.基于多特征融合的视频高层语义概念检测[D].北京邮电大学.2011
[2].孙子晨.视频高层语义提取技术研究与应用[D].复旦大学.2009
[3].张治国,刘怀亮,马志辉,张毅,赵娜.基于高层语义的视频检索研究[J].计算机工程与应用.2007
[4].许源,薛向阳.一种视频局部高层语义特征提取算法[J].计算机科学.2006