导读:本文包含了视觉单词论文开题报告文献综述及选题提纲参考文献,主要关键词:场景分类,视觉词包,模糊概念格,多值映射
视觉单词论文文献综述
王亚平,张素兰,张继福,胡立华[1](2016)在《基于模糊概念格的视觉单词生成方法》一文中研究指出利用一般概念格生成用于表示场景图像的视觉单词,在一定程度上能提高场景分类的精度,但因该格结构仅表示二值映射关系从而导致场景分类精度不高.模糊概念格不仅具有一般概念格的层次化表示知识的特点,还具有多值映射的特征,成为一种提取不确定知识的有效工具.首先生成关于训练图像视觉词包模型表示的多值映射特征背景,然后在构造的模糊概念格上,利用其层次结构,通过不断缩小隶属函数的取值区间,以约简部分"噪声"视觉单词,进而寻找一个场景分类精度较高的最优取值区间,最后在该区间下有效提取了表示某类场景的视觉单词集,实验验证了该方法的有效性.(本文来源于《小型微型计算机系统》期刊2016年08期)
王亚平[2](2016)在《基于模糊概念格的视觉单词生成方法研究》一文中研究指出视觉词包作为一种常用的图像表示方式,在场景分类中得到了广泛的应用,但由于视觉词包中存在“噪声”单词,严重影响了场景分类精度。模糊概念格是一种有效的提取不确定知识的工具,其概念格结点之间的层次关系有利于提取不同层次的视觉单词集,且格结点的模糊多值映射关系有利于约简“噪声”视觉单词。本文采用模糊概念格,对视觉单词生成及其场景分类方法进行了研究,主要研究成果有:(1)给出了一种基于模糊概念格的视觉单词生成方法。该方法首先生成关于训练图像视觉词包模型表示的多值映射特征背景;其次在构造的模糊概念格上,利用其层次结构,通过不断缩小隶属函数的取值区间,以约简部分“噪声”视觉单词,进而寻找一个场景分类精度较高的最优取值区间;然后在该区间下,提取了表示某类场景的视觉单词集;最后利用实验验证了该方法的有效性。(2)给出了一种基于模糊概念格多取值区间的视觉单词生成方法。针对上述方法选择所有场景类别的最优取值区间的不足,该方法首先生成不同场景类别的视觉词包模型;其次对于每类场景构造的模糊概念格分别在不同的取值区间下单独训练,得到每类场景的不同最优取值区间;然后分别提取每类场景不同最优取值区间下的视觉单词集;最后利用实验验证了该方法的有效性。(3)在上述研究的基础上,利用MATLAB和VB作为开发工具,设计与实现了一个基于模糊概念格的图像场景分类原型系统。(本文来源于《太原科技大学》期刊2016-04-11)
王俊伟[3](2016)在《基于二进制分辨矩阵的视觉单词约简方法研究》一文中研究指出随着大数据时代的来临,互联网上图像数据正在爆炸式增长,面对越来越多的图像数据,传统的人工方式标注图像已无法满足实际需求,寻找一种快速自动标注图像方法成为需要研究的主要内容之一。目前,图像场景分类是图像语义自动标注的一个研究热点,视觉词包模型是图像场景内容表达的一种重要方式,但由于视觉词包模型形成过程中会产生冗余视觉单词、“多义词”和“同义词”,这些视觉单词的存在严重影响了图像场景的分类性能。二进制分辨矩阵方法是粗糙集属性约简中的一种有效方法,本文将二进制分辨矩阵与视觉词包模型相结合,对视觉单词的约简和场景分类方法进行了研究,主要的研究内容如下:(1)给出了一种基于二进制分辨矩阵的冗余视觉单词约简方法。该方法首先通过调整归一化阈值α的取值,对所有训练图像产生不同的0-1信息决策表和构造不同的二进制分辨矩阵;然后以二进制分辨矩阵行列方向上1的个数作为启发信息识别核视觉单词和重要视觉单词;并以这些视觉单词作为描述图像场景分类的决策规则,从而减少了冗余视觉单词对图像场景分类的影响,进而提高了图像场景分类精度。最后在OT库8类图像数据集上进行实验,验证了该方法是有效的。(2)给出了一种基于二进制分辨矩阵的多义视觉单词约简方法。由于在(1)方法中归一化阈值α的选取对决策规则的生成影响较大,而且随着视觉单词容量增大,删除视觉单词过多导致决策规则区分力度下降,因此针对任意两类不同训练图像形成0-1信息决策表并构建二进制分别矩阵;然后根据二进制分辨矩阵约简算法,将其中一类图像分别与其它不同类图像的约简视觉单词求并集运算,并以这个并集作为决定这一类图像的决策规则,从而减少了任意两类图像视觉词包中存在的“多义词”问题,进而形成区分能力更强的决策规则。最后在OT库8类和Fei-Fei Dataset 13类图像数据集进行实验,验证了该方法的有效性。(3)开发了一个基于二进制分辨矩阵的图像场景分类原型系统。基于研究内容(1),以Matlab和Java作为开发工具,设计并实现了一个基于二进制分辨矩阵的图像场景分类原型系统。(本文来源于《太原科技大学》期刊2016-04-10)
张良,鲁梦梦,姜华[4](2016)在《局部分布信息增强的视觉单词描述与动作识别》一文中研究指出传统的单词包(Bag-Of-Words,BOW)算法由于缺少特征之间的分布信息容易造成动作混淆,并且单词包大小的选择对识别结果具有较大影响。为了体现兴趣点的分布信息,该文在时空邻域内计算兴趣点之间的位置关系作为其局部时空分布一致性特征,并提出了融合兴趣点表观特征的增强单词包算法,采用多类分类支持向量机(Support Vector Machine,SVM)实现分类识别。分别针对单人和多人动作识别,在KTH数据集和UT-interaction数据集上进行实验。与传统单词包算法相比,增强单词包算法不仅提高了识别效率,而且削弱了单词包大小变化对识别率的影响,实验结果验证了算法的有效性。(本文来源于《电子与信息学报》期刊2016年03期)
赵鹏坤,时恺泽,张素兰[5](2016)在《一种基于粗糙集的视觉单词生成方法》一文中研究指出针对传统BOV(Bag-of-visual words)模型,存在的歧义视觉单词影响分类精度和效率等问题,采用粗糙集属性约简,提出一种视觉单词生成方法。首先,利用BOV模型,生成训练图像集和视觉词典,并将其抽象为决策信息表,其中:决策表中对象按类分别标记作为决策属性,视觉词典中的视觉单词标记为条件属性;然后根据决策表中决策属性的等价集和条件属性的等价集,建立不相容对象等价集,并对决策表中每一个条件属性进行启发式学习,保留能够引起不相容等价集数目变化的视觉单词,形成必要视觉单词集合;其次,根据必要视觉单词集合,结合相对知识粒度,来衡量决策表中不必要视觉单词的重要度,保存重要度值高的视觉单词,消除属性重要度低的视觉单词,形成约简视觉单词集合,从而有效地消除了视觉词包中,存在的歧义视觉单词;最后通过实验验证了该方法对视觉单词约简是有效的和可行的。(本文来源于《太原科技大学学报》期刊2016年01期)
谢飞,龚声蓉,刘纯平,季怡[6](2015)在《基于局部和全局特征视觉单词的人物行为识别》一文中研究指出基于视觉单词的人物行为识别由于在特征中加入了中层语义信息,因此提高了识别的准确性。然而,视觉单词提取时由于前景和背景存在相互干扰,使得视觉单词的表达能力受到影响。提出一种结合局部和全局特征的视觉单词生成方法。该方法首先用显着图检测出前景人物区域,采用提出的动态阈值矩阵对人物区域用不同的阈值来分别检测时空兴趣点,并计算周围的3D-SIFT特征来描述局部信息。在此基础上,采用光流直方图特征描述行为的全局运动信息。通过谱聚类将局部和全局特征融合成视觉单词。实验证明,相对于流行的局部特征视觉单词生成方法,所提出的方法在简单背景的KTH数据集上的识别率比平均识别率提高了6.4%,在复杂背景的UCF数据集上的识别率比平均识别率提高了6.5%。(本文来源于《计算机科学》期刊2015年11期)
张雪峰,赵莉[7](2015)在《视觉单词优化仿射尺度不变特征变换的视频人脸识别》一文中研究指出针对视频人脸识别中由于光照、表情、姿态等变化而影响识别性能的问题,提出一种基于视觉单词优化仿射尺度不变特征变换的视频人脸识别算法。首先从兴趣点提取仿射尺度不变特征变换的图像描述符,将其作为人脸图像表示法;然后,由高斯差分检测,使用视觉单词的索引取代这些描述符;最后,计算视觉单词之间的巴氏距离,并利用最大相似性原则完成识别。在两大通用视频人脸数据库Honda及Mo Bo上的实验验证了该算法的有效性。实验结果表明,相比其他几种较为先进的视频人脸识别算法,该算法明显提高了识别率,并且大大降低了计算复杂度,有望应用于实时视频人脸识别系统。(本文来源于《计算机应用与软件》期刊2015年07期)
张晋[8](2015)在《一种基于随机游走模型的融合视觉单词共现性的软分配词袋技术》一文中研究指出提取局部兴趣点并通过词袋技术表征图片,是进行图片检索的一种经典方案。在传统的词袋技术中,每一个局部兴趣点的分配都是相互独立的,而没有考虑相邻局部兴趣点分配的相互影响。这样可能会导致某些局部兴趣点不可靠的分配,从而降低图片检索的精确度。通过统计视觉单词的共现性,可以学习到一些有价值的先验知识;同时利用随机游走模型,将视觉单词的共现性融合到传统的软分配词袋技术中,从整体上减少局部兴趣点不可靠的分配,进而提升图片检索的精确度。(本文来源于《现代计算机(专业版)》期刊2015年02期)
杨全,彭进业[9](2014)在《基于手语视觉单词特征的手语字母识别研究》一文中研究指出为有效识别手语字母,提出一种手语视觉单词(SLVW)的识别方法。采用Kinect获取手语字母视频及其深度信息,在深度图像中,通过计算获得手语手势的主轴方向角和质心位置以调整搜索窗口,利用基于深度图像信息的DI_CamShift方法对手势进行跟踪,进而使用基于深度积分图像的Ostu方法分割手势,并提取其尺度不变特征变换数据。将局部特征描述子表示的图像小区域量化生成SLVW,统计一幅手语图像中的视觉单词频率,用词包模型表示手语字母,并用支持向量机进行识别。实验结果表明,该方法不受颜色、光照和阴影的干扰,具有较高的识别准确性和鲁棒性,对复杂背景手语视频中的30个手语字母的平均识别率达到96.21%。(本文来源于《计算机工程》期刊2014年04期)
李士进,仇建斌,于慧[10](2014)在《基于视觉单词选择的高分辨率遥感图像飞机目标检测》一文中研究指出高分辨率遥感图像中飞机目标的检测和识别具有重要的军事和民用价值,针对以往方法易受灰度分布和形态变化及伪装干扰等缺点,提出一种基于视觉词袋模型的高分辨率遥感图像飞机目标检测的新方法。为了精简飞机视觉码本得到最具鉴别力的视觉单词,结合相关性及冗余度分析去除视觉码本中不相关、弱相关以及冗余的视觉单词,选择对飞机目标检测最为重要的视觉单词,减少了计算复杂度,提高了算法的检测性能。(本文来源于《数据采集与处理》期刊2014年01期)
视觉单词论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
视觉词包作为一种常用的图像表示方式,在场景分类中得到了广泛的应用,但由于视觉词包中存在“噪声”单词,严重影响了场景分类精度。模糊概念格是一种有效的提取不确定知识的工具,其概念格结点之间的层次关系有利于提取不同层次的视觉单词集,且格结点的模糊多值映射关系有利于约简“噪声”视觉单词。本文采用模糊概念格,对视觉单词生成及其场景分类方法进行了研究,主要研究成果有:(1)给出了一种基于模糊概念格的视觉单词生成方法。该方法首先生成关于训练图像视觉词包模型表示的多值映射特征背景;其次在构造的模糊概念格上,利用其层次结构,通过不断缩小隶属函数的取值区间,以约简部分“噪声”视觉单词,进而寻找一个场景分类精度较高的最优取值区间;然后在该区间下,提取了表示某类场景的视觉单词集;最后利用实验验证了该方法的有效性。(2)给出了一种基于模糊概念格多取值区间的视觉单词生成方法。针对上述方法选择所有场景类别的最优取值区间的不足,该方法首先生成不同场景类别的视觉词包模型;其次对于每类场景构造的模糊概念格分别在不同的取值区间下单独训练,得到每类场景的不同最优取值区间;然后分别提取每类场景不同最优取值区间下的视觉单词集;最后利用实验验证了该方法的有效性。(3)在上述研究的基础上,利用MATLAB和VB作为开发工具,设计与实现了一个基于模糊概念格的图像场景分类原型系统。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
视觉单词论文参考文献
[1].王亚平,张素兰,张继福,胡立华.基于模糊概念格的视觉单词生成方法[J].小型微型计算机系统.2016
[2].王亚平.基于模糊概念格的视觉单词生成方法研究[D].太原科技大学.2016
[3].王俊伟.基于二进制分辨矩阵的视觉单词约简方法研究[D].太原科技大学.2016
[4].张良,鲁梦梦,姜华.局部分布信息增强的视觉单词描述与动作识别[J].电子与信息学报.2016
[5].赵鹏坤,时恺泽,张素兰.一种基于粗糙集的视觉单词生成方法[J].太原科技大学学报.2016
[6].谢飞,龚声蓉,刘纯平,季怡.基于局部和全局特征视觉单词的人物行为识别[J].计算机科学.2015
[7].张雪峰,赵莉.视觉单词优化仿射尺度不变特征变换的视频人脸识别[J].计算机应用与软件.2015
[8].张晋.一种基于随机游走模型的融合视觉单词共现性的软分配词袋技术[J].现代计算机(专业版).2015
[9].杨全,彭进业.基于手语视觉单词特征的手语字母识别研究[J].计算机工程.2014
[10].李士进,仇建斌,于慧.基于视觉单词选择的高分辨率遥感图像飞机目标检测[J].数据采集与处理.2014