导读:本文包含了视频语义提取论文开题报告文献综述及选题提纲参考文献,主要关键词:语义,视频文本,提取方法,路径
视频语义提取论文文献综述
刘世豪,马焰忠[1](2018)在《基于语义的视频文本提取方法综述》一文中研究指出随着信息技术的研发和广泛性应用,提取视频文本成为逐渐成为人们信息资源的一种途径,借助于视频文本,人们对信息资源的把握更加生动化、直观化和可操作化,在一定程度上极大化地满足了人们对信息资源的多元化需求。因视频文本过于专业化,人们比较倾向于语义的视频文本提取方法,针对语义的视频文本提取方法进行深化研究,有助于人们更加快捷便利提取视频文本。(本文来源于《电脑迷》期刊2018年06期)
姚桐[2](2018)在《视频语义检测关键帧提取算法研究》一文中研究指出随着直播平台的兴起和互联网的发展,视频已经成为了人们产生和获取信息的主要途径,由此引发的海量视频数据的智能分析也逐渐受到人们的关注,视频语义检测作为视频智能分析的基础,具有非常重要的研究意义和价值。而由于视频自身庞大的数据量,目前对视频语义的检测都是在对视频提取关键帧的基础上进行的,因此,对关键帧提取技术进行研究也是非常必要和关键的。本文针对视频关键帧提取和视频对象语义检测两部分展开研究,主要从以下叁个方面进行了阐述:首先研究了基于镜头边界检测的关键帧提取算法,在对常用的镜头边界检测算法分析比较后,提出了改进的双阈值法检测镜头边界,给颜色直方图加入权值模板,并用局部自适应阈值代替固定阈值,避免了人工设置固定阈值对检测的影响;对镜头内部帧进行分类得到子镜头,最后利用帧的差异值判断并提取子镜头内的关键帧。接着针对现有的关键帧提取算法或多或少存在原视频信息损失的问题,把视频浓缩技术引入到关键帧提取中,深入研究了视频浓缩算法的原理,在一定约束条件下建立原始视频到浓缩视频的映射模型,据此定义了适应度函数并求解得到浓缩视频,不仅去除了原视频中的大量冗余,得到了密度更高的帧,而且与传统的关键帧提取算法相比,保留了更多的原视频信息,特别是时间信息和动态信息。最后研究了条件随机场基本理论,在此基础上对视频低层图像特征的条件概率模型以及像素点与对象之间映射的条件概率模型做了详细的理论研究和推导,根据图像特征模型,图像特征的条件概率模型和像素点与对象之间的映射模型,推导出对象语义的条件概率模型。最后在该模型上对关键帧提取算法进行了实验和比较。实验结果表明,改进的镜头边界检测关键帧提取算法和视频浓缩关键帧提取算法的检测结果与传统的双阈值镜头分割关键帧提取算法的检测结果相比有所提高。(本文来源于《中国科学院大学(中国科学院西安光学精密机械研究所)》期刊2018-05-01)
何力[3](2018)在《多层次语义描述的运动视频镜头提取模型》一文中研究指出提出了一种多层次语义描述的运动视频镜头提取模型。首先通过直接比较相邻帧的相似性来判断是否存在镜头切换,然后采用边缘检测的方法进行镜头像素检测,接着将渐变位置的检测转化为求取帧图像方差序列的极值问题,最后根据亮度值判断疑似阴影像素,以提高视频对象的精确性。仿真实验结果表明,本文提出的改进模型具有较高的镜头提取精度和较高的运行效率。(本文来源于《科技通报》期刊2018年01期)
苏晨涵[4](2014)在《视频语义结构化提取与标注的方法》一文中研究指出视频本身具有一定的层次结构,不同层次会产生不同粒度的语义,而且不同粒度的语义之间会形成一定的层次结构。因此,视频语义提取和标注强调语义的结构化。为此,首先,以镜头为单位提取其语义,并组成镜头语义序列。随后,带有简单时序关系的镜头语义序列经过结构化支持向量机的分析将产生结构化的视频语义;最好,将连续且内容相关的镜头作为一个场景,以视频场景为基本单位利用决策树算法C4.5根据镜头的语义信息及镜头之间的结构信息完成场景语义的推理。(本文来源于《电脑知识与技术》期刊2014年26期)
钟忺[5](2013)在《视频语义特征提取方法研究》一文中研究指出在多媒体信息技术发展迅猛的大数据时代,社会发展受到技术变革的巨大影响,人类生活也产生了明显的变化。海量多媒体数据在应用中体现出难以分析、查找和处理等问题,目前的主要检索方法仍然需要依靠人力并消耗大量的时间来处理完成。为了解决上述问题,达到智能和精确的检索目的,专家学者们从内容检索向语义检索逐步推进,并已进行基于对象、行为和事件语义检索等方面的研究。基于语义特征的提取方法与其相关技术的研究是解决语义检索中存在问题的关键。为了更好解决上述问题,需要处理海量视频中存在的大量冗余。通过计算多个MPEG-7描述子组成的特征向量间的距离得到帧间相异性,从而提出了一种基于聚类的冗余帧去除改进算法RRFC (Remove Redundant Frame based on Clustering)。该算法有效地保持了视频帧序列的时序性和视频主要内容的完整性,为后续步骤减小了数据规模和计算量。基于视频图像低层特征提取的研究现状,从颜色、纹理、形状和空间关系等特征以及随机抽样方面进行了分类和分析。根据红外摄影图像的应用需求,提出了一种基于高斯滤波和拉普拉斯边缘增强的图像边缘特征提取算法FEIED (Filtered and Enhanced Image Edge Detection),并以硫系玻璃的缺陷检测为实例进行了实验验证。去除冗余之后减小了数据规模,便于进行视频关键帧的提取。其方法包括特征提取、镜头分割、子镜头分割和关键帧提取四个步骤。特征提取同样采用了MPEG-7描述子的方法计算帧差。镜头分割采用了经典的双阈值分割方法。子镜头是内容更加一致的镜头片段,在子镜头上提取关键帧更能体现视频的主要内容。基于滑动窗口的子镜头分割方法SBDW (Sub shot Boundary Detection based on sliding Window)可以有效地保持视频帧序列的时序性,并将多类问题转化为多个二类问题,减少了时间复杂度和计算量。同时,基于图论的关键帧提取算法KFES (Key Frame Extraction based on Sub shot)可将关键帧提取转化为图的顶点覆盖问题。在此前研究成果的基础上,进一步研究学习视频语义提取的相关方法,并提出了一种基于条件随机域的视频语义特征提取方法,包括参数估计算法MPE (Model Parameter Estimation)和更新算法MR (Model Replace)。该方法可以实现视频语义特征概念本体的自动提取和标注,从而提供语义检索的可行性。针对视频图像检索应用需求的研究可从视频语义特征提取的若干关键问题入手进行研究,提出若干创新性成果。若要满足日益增长的视频图像检索需求,则要构建更高效的语义检索框架来提供包括对象、行为、场景、事件等更为精确的语义描述。(本文来源于《华中科技大学》期刊2013-12-01)
陈翰[6](2013)在《新闻视频的语义提取与自动分类技术研究》一文中研究指出新闻视频作为一种重要的媒体信息,在国家政治、经济、文化和日常生活等领域发挥着重要作用。为了方便人们快速获取新闻关键语义信息,并从海量视频数据中搜索、跟踪感兴趣的新闻,对新闻视频进行语义提取和自动化处理是近年来人们关注和研究的重点。本文从分析新闻视频的关键语义入手,对新闻视频结构化处理、语义特征提取和自动分类等内容进行深入研究,取得的主要创新性成果如下:1.为了更好的对新闻视频分析和理解,本课题围绕形成新闻的六个关键要素(6W,即When、Where、Who、What、Why和How),分析了新闻视频中多媒体元素与之对应的关系,建立了基于新闻关键要素的新闻视频语义抽取方法。提出了一种基于新闻关键要素的新闻视频语义分析模型。2.为了提取新闻视频中的场景、人物、时间及事件等语义信息,本课题重点研究了新闻视频结构化分析和关键语义特征的提取方法,主要从视频的关键帧提取、视觉特征、文本特征叁个方面着手研究,并通过颜色直方图、颜色矩、Canny边缘、LBP纹理特征、SIFT、CRF分词系统等具体技术实现新闻视频语义特征的提取。3.为了实现新闻视频的自动分类,本课题提出了一种基于分层条件随机场的新闻视频自动分类方法,该方法是通过融合反映新闻视频语义的视觉底层特征和文本特征来实现新闻视频自动分类的。通过对优酷网上几种典型新闻视频进行训练和测试,实验验证了该方法的有效性,采用本文方法能够较为准确地进行网络新闻视频自动分类,大大减轻了网络编辑的劳动强度,同时有利于用户追踪同类新闻事件的发展动态。(本文来源于《河南科技大学》期刊2013-05-01)
任希[7](2013)在《视频语义提取方法研究》一文中研究指出随着多媒体和网络的飞速发展,数字视频的数量急剧增加。怎样通过计算机对这些大量的视频进行自动理解,提取出其语义信息,从而方便用户进行高效率的查询和检索,是当前急需解决的问题。目前,视频语义提取技术正在受到广泛关注,已成为研究的热点。标签是表达语义的一种有效方式,根据视频数据的特点,可以采用名词语义标签和动词语义标签相结合的方式来表达其语义信息,其中名词语义标签对应的是视频中的运动对象,动词语义标签对应的是运动对象的具体动作行为,两者结合起来即为视频的语义标签。在提取视频语义标签时,采用机器学习的方法,先构造出视频训练集,然后分别从名词语义标签和动词语义标签两个方面对测试视频进行分析。名词语义标签方面,首先对测试视频进行镜头分割和关键帧提取等操作,得到视频的关键帧,然后对关键帧进行对象识别,即可得到名词语义标签。动词语义标签方面,首先通过运动对象检测和跟踪的相关算法得到测试视频的运动轨迹数据,然后考察测试视频的轨迹数据与训练集视频的轨迹数据之间的语义相似度,同时联系测试视频的名词语义标签以及训练集视频的标注内容,综合分析后即可得到动词语义标签。最后,仿照汉语中的主谓结构,用名词语义标签表示主语,用动词语义标签表示谓语,即可表示出视频的语义信息。(本文来源于《华中科技大学》期刊2013-01-01)
闫建鹏,封化民,刘嘉琦[8](2012)在《一种基于多模态特征的新闻视频语义提取框架》一文中研究指出为提高视频语义信息提取准确率,提出了一种基于多模态特征的新闻视频语义提取框架。在视频中提取主题字幕信息,对音频进行分类和语音识别,根据主题字幕信息借助搜索引擎得到与新闻视频相关的网页;最后利用网页文本对语音识别的结果进行纠错,从而通过视频字幕信息和语音脚本的跨模态融合提高视频语义提取的准确率。在中等规模的新闻视频(含新闻网页)库测试表明了该方法的有效性,经纠错后的语音识别准确率达到了65%左右。(本文来源于《计算机应用研究》期刊2012年07期)
张建明,李梅,李广翠[9](2011)在《基于Simfusion和本体的视频语义提取》一文中研究指出目前大多数的视频语义概念提取研究没有考虑到视频多模态之间的关联共生特性,而在样本的标注方面采用自定义的概念进行标注,会影响语义概念提取的准确率。针对上述问题,提出结合Simfusion算法和用本体知识库标注样本的方法提取视频的语义概念,该方法根据镜头内容变化提取关键帧,在提取出镜头内容时,有效地利用镜头多模态之间的时序关联共生特性,同时运用本体知识库中的概念标注样本、训练分类器,弥补传统方法在标注样本时存在的主观、不规范等不足。实验结果表明,该方法在视频语义概念提取的研究中,有较高的准确度、可操作性强。(本文来源于《计算机工程》期刊2011年15期)
吴昌,王万良,蒋一波[10](2011)在《一种新的基于RVM的视频关键帧语义提取算法》一文中研究指出将相关向量机理论应用于视频关键帧语义提取。该方法把关键帧中的HSV颜色直方图、MPEG-7边缘直方图和灰度共生矩阵相结合,建立特征标定向量集;基于图分割模型对二叉树多分类器结构进行优化,构建最优二叉树语义多分类模型并采用主动训练策略进行训练优化;利用RVM模型对关键帧特征向量集进行训练和检测,进而得到语义。实验结果表明,所提方法与其他方法相比,不但有较高的准确率,而且在模型的稀疏性、分类检测时间等性能方面也有很好的表现。(本文来源于《计算机应用研究》期刊2011年04期)
视频语义提取论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着直播平台的兴起和互联网的发展,视频已经成为了人们产生和获取信息的主要途径,由此引发的海量视频数据的智能分析也逐渐受到人们的关注,视频语义检测作为视频智能分析的基础,具有非常重要的研究意义和价值。而由于视频自身庞大的数据量,目前对视频语义的检测都是在对视频提取关键帧的基础上进行的,因此,对关键帧提取技术进行研究也是非常必要和关键的。本文针对视频关键帧提取和视频对象语义检测两部分展开研究,主要从以下叁个方面进行了阐述:首先研究了基于镜头边界检测的关键帧提取算法,在对常用的镜头边界检测算法分析比较后,提出了改进的双阈值法检测镜头边界,给颜色直方图加入权值模板,并用局部自适应阈值代替固定阈值,避免了人工设置固定阈值对检测的影响;对镜头内部帧进行分类得到子镜头,最后利用帧的差异值判断并提取子镜头内的关键帧。接着针对现有的关键帧提取算法或多或少存在原视频信息损失的问题,把视频浓缩技术引入到关键帧提取中,深入研究了视频浓缩算法的原理,在一定约束条件下建立原始视频到浓缩视频的映射模型,据此定义了适应度函数并求解得到浓缩视频,不仅去除了原视频中的大量冗余,得到了密度更高的帧,而且与传统的关键帧提取算法相比,保留了更多的原视频信息,特别是时间信息和动态信息。最后研究了条件随机场基本理论,在此基础上对视频低层图像特征的条件概率模型以及像素点与对象之间映射的条件概率模型做了详细的理论研究和推导,根据图像特征模型,图像特征的条件概率模型和像素点与对象之间的映射模型,推导出对象语义的条件概率模型。最后在该模型上对关键帧提取算法进行了实验和比较。实验结果表明,改进的镜头边界检测关键帧提取算法和视频浓缩关键帧提取算法的检测结果与传统的双阈值镜头分割关键帧提取算法的检测结果相比有所提高。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
视频语义提取论文参考文献
[1].刘世豪,马焰忠.基于语义的视频文本提取方法综述[J].电脑迷.2018
[2].姚桐.视频语义检测关键帧提取算法研究[D].中国科学院大学(中国科学院西安光学精密机械研究所).2018
[3].何力.多层次语义描述的运动视频镜头提取模型[J].科技通报.2018
[4].苏晨涵.视频语义结构化提取与标注的方法[J].电脑知识与技术.2014
[5].钟忺.视频语义特征提取方法研究[D].华中科技大学.2013
[6].陈翰.新闻视频的语义提取与自动分类技术研究[D].河南科技大学.2013
[7].任希.视频语义提取方法研究[D].华中科技大学.2013
[8].闫建鹏,封化民,刘嘉琦.一种基于多模态特征的新闻视频语义提取框架[J].计算机应用研究.2012
[9].张建明,李梅,李广翠.基于Simfusion和本体的视频语义提取[J].计算机工程.2011
[10].吴昌,王万良,蒋一波.一种新的基于RVM的视频关键帧语义提取算法[J].计算机应用研究.2011