导读:本文包含了姿势估计论文开题报告文献综述及选题提纲参考文献,主要关键词:3D姿势估计,卷积神经网络(CNN),行为分析,现场测试
姿势估计论文文献综述
熊若鑫,宋元斌,王宇轩,段彦娟[1](2019)在《基于CNN的3D姿势估计在建筑工人行为分析中的应用》一文中研究指出为实现建筑工人现场行为的自动化分析,采用卷积神经网络(CNN)检测3D人体姿势并根据现场条件对连续图像进行姿态估计;考虑到动态和杂乱的施工现场环境(部分遮挡等)及多变的工人行为,开发建筑工人姿势图像数据集,从定性和定量2方面综合测试算法性能;将所提出的方法用于施工作业姿势风险评估,利用视频中工人的3D姿势驱动人体生物力学模型,快速、定量计算工人作业时易损伤的部位。结果表明:该人体姿势估计方法具有较好的鲁棒性和较高的准确性,结合生物力学模型可实现更精细的工人行为分析与评估。(本文来源于《中国安全科学学报》期刊2019年07期)
何宏周[2](2019)在《基于深度学习的婴儿姿势估计算法研究》一文中研究指出近年来,随着深度学习领域的火热发展,基于深度学习的许多领域如雨后春笋般快速发展,其中对于人体姿势估计就是一个热门研究方向,并且已经取得了巨大的成果,例如卡内基梅隆大学发布的openpose。然而关于婴儿的动作理解和分析领域目前还是一个孵化期,基于此,本文首次将当下的最先进的姿势估计模型通过迁移学习对婴儿姿势估计展开研究,主要的研究内容有以下叁点:第一,本文首先研究单个婴儿姿势估计,选取经典网络架构stacked hourglass作为预训练模型,构建单个婴儿关键点数据集,采用关键点正确比例(Percentage of Correct Keypoints,归一化采用头部长度,即为PCKh)衡量性能,在测试集上PCK@0.5达到了90.8%,一幅图像平均处理时间为0.2秒。尽管性能较高,但是对于复杂的多个婴儿的情况不能抓取到姿势,会出现误判。第二,为了让模型更加实用,从多个婴儿的角度展开研究,选用当下的明星架构openpose作为网络架构,以tensorflow重构原来的caffe架构,仿照COCO构建多婴儿关键点数据集。本文提出了基于openpose的3-stage模型,然后分别对openpose,训练后的6-stage模型,以及本文的3-satge模型进行实验,其中6-stage和3-stage性能均优于openpose。对于单婴儿情况,6-stage和3-stage分别为91.1%和90.0%,在多婴儿的平均精度均值(mean Average Precision,mAP)比较中,6-stage和3-satge分别为76.8%和75.7%。结果基本在一个精度水准,但是运行时间相比,3-stage单幅图像约为0.22秒,较之于6-stage的约0.4秒几乎提升了一倍。证明了在婴儿的应用场景下,3-stage的调整是成功的,即为本文的创新模型——基于openpose的3-stage婴儿姿势估计预测模型。第叁,将本文的3-stage预测模型应用于视频婴儿姿势估计,对视频采用跨帧处理,结果表明,无论是光线昏暗还是明亮,都能实现对婴儿的姿势准确定位,其中对于单个婴儿视频FPS数值为11,多婴儿视频FPS数值为8秒左右,初步达到视频的跟踪估计。总体来说,本文以深度学习为背景,以迁移学习为指导,借鉴前人的网络模型架构,准备本文的婴儿数据集,分为单婴儿和多婴儿两大路线展开研究,最终确立了基于openpose的多婴儿架构为核心,提出了本文的基于openpose的3-stage婴儿姿势估计预测模型,实现了基于视频的婴儿姿势估计。(本文来源于《电子科技大学》期刊2019-03-20)
陈智[3](2017)在《叁维人脸区域标记和姿势估计研究》一文中研究指出目前,国内外关于二维人脸和叁维人脸方面已经有了大量的研究,其中大部分基于正脸姿势的研究和应用都表现良好,但当人脸处于如侧面等姿势时,效果则有待提高。对于侧脸等姿势的人脸研究,必须用到叁维人脸姿势的估计。叁维人脸姿势估计在当代生活中有着非常广泛的应用同时存在巨大的市场需求,包括人脸识别系统、智能安全监控系统、辅助安全驾驶系统、影视动画、游戏与虚拟现实等众多领域。近年来,场景语义标记问题已经得到了广泛的关注和研究,也取得了不错的效果。然而,在叁维人脸上进行语义标注上却很少有人研究。根据场景语义标记的思想可以将叁维人脸区域语义标记的任务描述成将人脸模型上的眼睛、鼻子、嘴巴等区域标记出来。叁维人脸区域标记可以改善叁维人脸重建、叁维人脸姿势估计、人脸特征点定位等问题的结果,同时促进叁维人脸动画的发展。因此对于叁维人脸区域标记问题的研究是非常有必要的。目前基于图像的人脸相关技术日趋成熟,与二维人脸图像数据相比,叁维人脸数据具有叁维几何信息和不受光照、姿态影响等优势。近年来,学术界深入探索了如何利用人脸的叁维信息来提高系统性能。随着深度传感器、叁维激光扫描仪等硬件设备的不断更新与完善,获取包括深度信息的叁维人脸数据变得更加方便。充分利用叁维数据的特性,可以使叁维人脸相关的众多问题得到有效的解决。本文对叁维人脸模型的叁维信息进行了深入研究,主要包括几何信息描述符和深度图,结合机器学习、深度学习算法的强大拟合能力,对叁维人脸区域标记和姿势估计两个问题进行了以下研究:(1)针对叁维几何局部描述符重要性和叁维人脸区域标记研究较少的问题,提出一种新的叁维人脸模型几何局部特征描述符:正方形切平面描述符。这种描述符是由叁维人脸模型顶点在正方形切平面区域投影距离的平均值构成。首先计算出模型上一点的正方形切平面区域,并将这个正方形等分成一些小正方形。然后将模型上其它点向正方形切平面投影,计算每个小正方区域内所有投影点的投影距离平均值,该描述符由这些投影距离的平均值编码而成。该描述符对叁维人脸模型噪声、模型尺寸、模型分辨率都具有较好的鲁棒性。最后将正方形切平面描述符应用到叁维人脸区域标记问题上,利用随机森林算法强大的学习能力,有效地识别出叁维人脸模型上的眉毛、眼睛、鼻子、嘴巴和脸颊等区域。(2)提出一种基于深度图和卷积神经网络的叁维人脸模型姿势估计的方法。首先,通过采集到的叁维人脸模型数据进行投影获得深度图数据集。将深度图数据集作为卷积神经网络的训练数据进行训练。获得训练好的模型后,分别对叁种不同来源的叁维人脸模型进行了姿势估计,预测叁维人脸模型的Pitch方向、Yaw方向、Roll方向的角度,均获得了不错的预测结果。(本文来源于《江南大学》期刊2017-06-01)
王伟[4](2017)在《单幅图像的叁维人体姿势估计研究》一文中研究指出根据图像中二维人体关节点坐标重建叁维人体姿势时常会遇到一个非凸优化问题,给人体姿势的求解带来很大的困难。叁维人体姿势估计的凸松弛方法虽然解决了该问题,但是存在算法的收敛速度较慢、姿势估计准确度不高的不足。针对这些不足,提出一种基于遗传优化的自适应凸松弛叁维人体姿势估计改进算法。首先根据自适应控制的思想,利用误差评价函数对原凸松弛方法中控制算法迭代步数的变量更新方式进行自适应处理,然后再利用遗传优化算法为该变量的初始值进行寻优,最后利用寻优结果对原凸松弛方法中影响姿势估计准确度的闭式解表达式进行改进。实验结果表明,提出的叁维人体姿势估计改进算法对单幅人体图像的处理速度更快,姿势估计准确度更高,更有利于实际应用。(本文来源于《辽宁工程技术大学》期刊2017-06-01)
刘万军,王伟,付兴武,曲海成[5](2018)在《基于遗传优化的自适应凸松弛人体姿势估计》一文中研究指出针对凸松弛方法在解决叁维人体姿势估计的问题时存在迭代次数较多、准确度不高的不足,提出一种基于遗传优化的自适应凸松弛人体姿势估计算法。该算法首先对关键参数的更新方式进行自适应处理,然后利用遗传优化算法对该关键参数的初始值进行寻优,最后利用寻优结果对凸松弛方法中闭式解的公式进行调整。实验结果表明,提出的算法迭代次数更少,准确度更高,更有利于实际应用。(本文来源于《计算机应用研究》期刊2018年01期)
王恬,李庆武,刘艳,周亚琴[6](2016)在《利用姿势估计实现人体异常行为识别》一文中研究指出异常行为识别是近年来计算机视觉领域的研究热点。为了实现对多人体异常行为精确识别的目标,提出了一种基于人体姿势估计的异常行为识别算法。首先采用基于滤波通道特征的行人检测算法对各个目标人体进行定位;然后对每个人体构建基于图结构框架的外观模型;最终采用霍夫方向计算器算法(HOC)提取人体部件特征,从而进行行为分类。实验结果表明,该文算法可以在单帧图像上对多个人体的行为进行识别,并提供了多类别的异常行为分类,实验效果明显,准确率较高。(本文来源于《仪器仪表学报》期刊2016年10期)
冯宇杰[7](2016)在《融合多姿势估计特征的动作识别研究》一文中研究指出动作识别的研究在人工智能领域越来越热门,受到的关注也越来越多。动作识别分为静态图像的动作识别和视频的动作识别。本文针对静态图像的动作识别进行了研究和详细的分析。静态图像的动作识别在图像搜索,个人相册管理,人机交互等领域具有潜在的应用。在本文中,通过将多个模型下的姿势特征融合,提出了融合多姿估计特征的动作识别方法。融合多姿势估计特征的动作识别将人的动作在多个模型下的姿势估计特征进行融合,然后将多组特征与模板进行匹配,计算相似性,最后对动作进行分类。融合多姿势估计特征的方法对存在遮挡,多目标等复杂环境具有一定的鲁棒性。首先利用已得到的多个动作模型对任意一幅图像进行姿势估计,得到图像的多组姿势特征信息,每组特征信息包括关键点信息和姿势评分。其次将训练集中各个动作下所有图像的区分性关键点提取出来,并计算每一幅图像中区分性关键点之间的相对距离,一个动作所有图像的特征信息共同构成该动作的模板信息。最后测试图像在多个动作模型下进行姿势估计,得到多组姿势特征,从每组姿势特征中提取与对应模板一致的特征信息,将提取的多组姿势特征信息分别与对应的模板进行匹配,并通过姿势评分对匹配值优化,根据最终匹配值进行动作分类。在两个数据集上,本文提出的方法与5种比较流行的动作识别方法进行比较,获得了较好的平均准确率,在数据集PASCAL VOC 2011-val上较其他一些最新的经典方法至少提高近2%。在数据集Stanford 40 actions上,较其他一些最新的经典方法至少提高近6%。由于本文所提出的方法融合了多个姿势特征,并且能够获取关键部位的遮挡信息,所以能较好应对遮挡等复杂环境情况,具有较高的平均识别准确率。(本文来源于《江西理工大学》期刊2016-05-30)
王国桢[8](2016)在《基于图像的人体姿势估计和手势识别研究》一文中研究指出人体姿态估计在各个领域中都有很大的作用,相比较手势识别,更方便的是个人的一些工作。本文主要的研究就在单幅静态图像上的人体姿态估计以及在深度图像上进行的手势识别,论文主要讲述了以下的几个方面:首先,介绍关于姿态估计的一些相关工作。介绍静态图像的人体姿态估计,并且着重强调分析,人体图模型的相关知识和解法。探讨关于Kinect深度相机的硬件,以及数据获取,转化等。最后介绍了深度图像双边滤波,本文所需要用到双边滤波来进行深度图像去噪声。其次,提出一种基于形状上下文的人体姿态估计方法。依据前文的理论知识,目前对于图像中人体姿态估计方法在处理较复杂的背景的时候难以得到理想的效果,其原因是这些方法不好区分人体和复杂背景,从而无法得到其想要的特征值供其使用。本文针对这一不足提出一种姿态分割估计方法,该方法首先是将人体分割后去除复杂背景的影响,并且在图结构模型中,结合使用形状上下文特征的方法训练对比求解得出最优的人体的姿态。实验发现该方法可以较好的在复杂背景下获得人体的姿态估计,克服背景带来的干扰。最后,提出一种基于随机森林的特征方法用来在深度图像上进行手势识别。使用Kinect深度相机采集到人体的深度数据,在用双边的滤波对于深度图像进行去噪处理,得到去噪后的图像。把手部从图像背景中分离出来,得到想要的手部的深度图。然后使用随机森林训练的方法,对于输入的深度图像,在这提出一个利用当前像素和它周围像素之间的关系,逐像素对手部进行分块,并且用了一个适应距离的方法求得这些相邻周围像素。得到人体手部每块后,分别求得关键点,与标准模板进行对比识别出手势结果。(本文来源于《安徽大学》期刊2016-04-01)
王冉[9](2016)在《基于深度卷积神经网络的人体姿势估计研究》一文中研究指出人体姿势估计是实现图像理解和行为识别的关键技术。但是,自身的遮挡,衣着的变化,面内和面外旋转等情况,导致了人体姿势估计问题一直没有得到很好的解决。近年来,深度学习技术的发展为解决姿势估计问题提供了新的工具。与浅层机器学习算法相比,深度学习的模型具有更深的层次,因此具有更强的学习能力。但是,深度学习本身也存在很多待研究的问题,例如,深度学习有效性的理论分析,深度模型在实际应用中难以训练的问题。如何针对姿势估计问题设计深度模型也还有待进一步的研究。本文梳理了姿势估计技术和深度学习技术的发展历程。在此基础上,提出了一种用于姿势估计的适应性全效表达框架。该框架能够同时利用全局和局部视觉线索来准确地估计出人体姿势。特别地,适应性全效表达框架主要包括两部分:(1)全效部分,即全局模型。它可以快速地定位人体关节,生成一个整体正确的人体姿势;(2)适应性部分,即局部模型。它可以在潜在区域的基础上进一步提高姿势估计的精度。全局模型是该框架的核心,它主要实现叁个功能:第一,快速定位人体关节;第二,生成潜在区域,为局部模型缩小搜索空间;第叁,作为空间模型,与局部模型融合,输出更精确的人体姿势。全局模型通过一种叫做独立损失网的卷积神经网络来实现上述功能。在独立损失网中,姿势估计被定义为关于人体关节坐标的分类问题。独立损失网具有两个独立的输出层,用于分别预测关节坐标的两个维度,并且使用独立的损失函数来指导网络的训练。在姿势估计的适应性全效表达框架中,全局模型自身具有完整性,而局部模型是对全局模型的补充。该框架的灵活性使其可以满足不同场景的要求。在多个数据集上的测试结果表明,在保证姿势估计准确率的同时,与现有方法相比,本文框架能够更加高效地进行人体姿势估计。(本文来源于《电子科技大学》期刊2016-03-27)
罗会兰,冯宇杰,孔繁胜[10](2015)在《融合多姿势估计特征的动作识别》一文中研究指出目的为了提高静态图像在遮挡等复杂情况下的动作识别效果和鲁棒性,提出融合多种姿势估计得到的特征信息进行动作识别的方法。方法利用已得到的多个动作模型对任意一幅图像进行姿势估计,得到图像的多组姿势特征信息,每组特征信息包括关键点信息和姿势评分。将训练集中各个动作下所有图像的区分性关键点提取出来,并计算每一幅图像中区分性关键点之间的相对距离,一个动作所有图像的特征信息共同构成该动作的模板信息。测试图像在多个动作模型下进行姿势估计,得到多组姿势特征,从每组姿势特征中提取与对应模板一致的特征信息,将提取的多组姿势特征信息分别与对应的模板进行匹配,并通过姿势评分对匹配值优化,根据最终匹配值进行动作分类。结果在两个数据集上,本文方法与5种比较流行的动作识别方法进行比较,获得了较好的平均准确率,在数据集PASCAL VOC 2011-val上较其他一些最新的经典方法平均准确率至少提高近2%。在数据集Stanford 40 actions上,较其他一些最新的经典方法平均准确率至少提高近6%。结论本文方法融合了多个姿势特征,并且能够获取关键部位的遮挡信息,所以能较好应对遮挡等复杂环境情况,具有较高的平均识别准确率。(本文来源于《中国图象图形学报》期刊2015年11期)
姿势估计论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
近年来,随着深度学习领域的火热发展,基于深度学习的许多领域如雨后春笋般快速发展,其中对于人体姿势估计就是一个热门研究方向,并且已经取得了巨大的成果,例如卡内基梅隆大学发布的openpose。然而关于婴儿的动作理解和分析领域目前还是一个孵化期,基于此,本文首次将当下的最先进的姿势估计模型通过迁移学习对婴儿姿势估计展开研究,主要的研究内容有以下叁点:第一,本文首先研究单个婴儿姿势估计,选取经典网络架构stacked hourglass作为预训练模型,构建单个婴儿关键点数据集,采用关键点正确比例(Percentage of Correct Keypoints,归一化采用头部长度,即为PCKh)衡量性能,在测试集上PCK@0.5达到了90.8%,一幅图像平均处理时间为0.2秒。尽管性能较高,但是对于复杂的多个婴儿的情况不能抓取到姿势,会出现误判。第二,为了让模型更加实用,从多个婴儿的角度展开研究,选用当下的明星架构openpose作为网络架构,以tensorflow重构原来的caffe架构,仿照COCO构建多婴儿关键点数据集。本文提出了基于openpose的3-stage模型,然后分别对openpose,训练后的6-stage模型,以及本文的3-satge模型进行实验,其中6-stage和3-stage性能均优于openpose。对于单婴儿情况,6-stage和3-stage分别为91.1%和90.0%,在多婴儿的平均精度均值(mean Average Precision,mAP)比较中,6-stage和3-satge分别为76.8%和75.7%。结果基本在一个精度水准,但是运行时间相比,3-stage单幅图像约为0.22秒,较之于6-stage的约0.4秒几乎提升了一倍。证明了在婴儿的应用场景下,3-stage的调整是成功的,即为本文的创新模型——基于openpose的3-stage婴儿姿势估计预测模型。第叁,将本文的3-stage预测模型应用于视频婴儿姿势估计,对视频采用跨帧处理,结果表明,无论是光线昏暗还是明亮,都能实现对婴儿的姿势准确定位,其中对于单个婴儿视频FPS数值为11,多婴儿视频FPS数值为8秒左右,初步达到视频的跟踪估计。总体来说,本文以深度学习为背景,以迁移学习为指导,借鉴前人的网络模型架构,准备本文的婴儿数据集,分为单婴儿和多婴儿两大路线展开研究,最终确立了基于openpose的多婴儿架构为核心,提出了本文的基于openpose的3-stage婴儿姿势估计预测模型,实现了基于视频的婴儿姿势估计。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
姿势估计论文参考文献
[1].熊若鑫,宋元斌,王宇轩,段彦娟.基于CNN的3D姿势估计在建筑工人行为分析中的应用[J].中国安全科学学报.2019
[2].何宏周.基于深度学习的婴儿姿势估计算法研究[D].电子科技大学.2019
[3].陈智.叁维人脸区域标记和姿势估计研究[D].江南大学.2017
[4].王伟.单幅图像的叁维人体姿势估计研究[D].辽宁工程技术大学.2017
[5].刘万军,王伟,付兴武,曲海成.基于遗传优化的自适应凸松弛人体姿势估计[J].计算机应用研究.2018
[6].王恬,李庆武,刘艳,周亚琴.利用姿势估计实现人体异常行为识别[J].仪器仪表学报.2016
[7].冯宇杰.融合多姿势估计特征的动作识别研究[D].江西理工大学.2016
[8].王国桢.基于图像的人体姿势估计和手势识别研究[D].安徽大学.2016
[9].王冉.基于深度卷积神经网络的人体姿势估计研究[D].电子科技大学.2016
[10].罗会兰,冯宇杰,孔繁胜.融合多姿势估计特征的动作识别[J].中国图象图形学报.2015
标签:3D姿势估计; 卷积神经网络(CNN); 行为分析; 现场测试;