导读:本文包含了自然场景理解论文开题报告文献综述及选题提纲参考文献,主要关键词:矩形交通标志检测与定位,文字检测,交通符号检测,交通符号识别
自然场景理解论文文献综述
陈亚杰[1](2016)在《自然场景中交通标志版面理解算法研究》一文中研究指出随着城市汽车数量和人口密度的不断增高,城市交通拥堵日益严重。智能交通系统在提高汽车通行效率、减少交通事故等方面具有重要的作用,从而成为一个研究的热点。交通标志检测与识别是智能交通系统的关键问题之一。目前,交通标志识别主要集中在标志的分类,对于既包含文字又包含交通符号的矩形交通标志的研究相对较少。而矩形交通标志包含了丰富的道路信息,对于交通安全和道路通行效率起到了重要的作用。因此,矩形交通标志的理解具有很大的应用前景和实用价值。本论文以自然场景中矩形交通标志的版面理解为目标,研究了自然场景中矩形交通标志的检测与定位、矩形交通标志中的文字检测与定位以及交通符号检测与识别。本文的主要工作包括以下叁个方面:(1)自然场景中矩形交通标志检测与定位。矩形交通标志以蓝色背景为主,颜色是其最显着的特征。为此本文首先利用颜色信息实现矩形标志的粗检测,再采用结合方向梯度直方图和支持向量机的方法实现标志的精确定位。(2)矩形交通标志中的文字检测与定位。本文首先采用霍夫变换对标志图像进行几何校正,然后改进了大津阈值对图像进行二值化,再利用文字区域的几何信息通过连通域分析实现文字的检测。本文给出的基于分块的大津阈值法获得了很好的二值化效果,为文字检测提供了可靠的保证(3)矩形交通标志中的交通符号检测与识别。矩形交通标志既包含了文字信息同时又包含了符号信息。由于交通符号表明道路行驶规则,对于无人驾驶和辅助驾驶系统等至关重要。为此,本文针对矩形交通标志牌中的交通符号检测与识别进行了研究。在进行畸变矫正等的预处理之后,采用基于连通域分析法的方法对交通符号进行检测,然后给出了基于空间视觉词袋模型以及融合支持向量机和随机森林的方法实现交通符号的识别。为了测试算法的性能,本文收集了中国境内城市的矩形交通标志图像3023幅,从中随机选择了1015幅图像作为本文提出算法的测试图像。矩形交通标志检测精度为96.89%,文字检测精度为98.47%,交通符号检测精度为93.40%,针对5类27个交通符号的识别,识别精度为94.29%,实验结果表明了算法的有效性。(本文来源于《北京交通大学》期刊2016-01-01)
孙丽坤,刘波[2](2014)在《基于分层区域合并的自然场景理解》一文中研究指出针对自然场景理解问题,利用图像中的层次结构,提出了一种基于分层合并的图像场景理解方法.该方法通过不断合并相邻区域,直到合并出图像中的各个对象为止;最终得到一个合并森林,森林里的每棵树对应图像中的一个对象.我们设计了一个机器学习模型来描述合并过程、一种贪心推理方法来求解最优的合并森林以及一种基于最大间隔的学习方法来训练模型中的参数,同时采用分层聚类来进行参数的初始化.本文方法可以看成为图像语义理解而设计的一种深度学习方法.实验效果令人满意.(本文来源于《计算机系统应用》期刊2014年11期)
孙丽坤[3](2014)在《基于分层区域合并的自然场景理解》一文中研究指出自然场景理解是现在计算机视觉领域的一个热点研究方向,其目的是识别出自然图像中的对象并给出对象的位置等属性信息。人们发现图像中通常会出现层次结构,即图像中的复杂对象是由一系列的简单部分组成,而这些简单部分是由更简单的小区域组成,这种一层一层的组成就构成了图像的层次结构。该结构不仅能帮助我们识别对象,还能直观地解释各个小区域是如何作用组合成整个对象的。本文方法就是利用图像中的层次结构提出的。图像首先被分割成多个小区域的集合,然后通过不断合并相邻的区域对,并为合并后的超级区域预测可能类别,直到合并出图像中的各个对象为止。最终得到一个合并森林,该森林由多棵树组成,通常每棵树对应图像中的一个对象。此时每棵树都有其可能类别,只需从其可能类别中找出最可能的类别即可,构成树结构的所有小区域所在图像中的位置即为该对象位置。本文方法可以看成为图像语义理解而设计的一种深度学习方法。具体的工作如下:(1)设计了一个机器学习模型来描述区域对的合并过程,包括如何计算区域对分数、设定合并条件、预测合并后超级区域的类别等等。(2)由于图像中相邻区域间的合并有多种可能,直接搜索计算是不可行的,我们设计了一种贪心推理方法来求解最优的合并森林。(3)对于模型中的参数学习,我们采用了最大间隔的方法。(4)采用分层区域的聚类的方法来初始化模型参数。通过对各个类别的不同大小的区域特征进行分层聚类,取聚类中心作为参数的初始值,这些初始值不仅能够获取到各个类别区域在不同阶段的一般性特征,还能帮助模型快速收敛到极值。(5)在特征提取阶段,通过利用区域内像素的特征来计算区域的特征。我们考虑了叁种不同的计算方法来获取区域特征,并分别对模型进行学习和训练,进而对这叁套特征的模型测试结果进行比较和分析。(本文来源于《北京工业大学》期刊2014-06-01)
吴靓[4](2011)在《基于自然语言理解的3D场景构造研究》一文中研究指出自然语言自动生成叁维场景可以减少手工构建所耗费的人力物力,为了减少这些消耗,国内外的很多学者对这方面进行了很多的研究,也取得了很好的成果。基于自然语言构建叁维场景的研究包括叁个步骤:从用户输入提取出空间关系,计算每个模型在场景中的位置,以及渲染场景。论文以自然语言描述的空间关系为研究对象,提出了基于自然语言构建叁维场景的方案。论文对自然语言理解构建叁维场景的工作进行了介绍,针对论文的研究特点,论文建立了词库,对词库的存储结构、应有的字段以及每个字段的赋值和字段包含的含义进行了规定。模型库是渲染场景的基础,论文建立了模型库,在模型库中存储叁维模型,同时为了方便计算,每个模型的模型文件包含一些标注信息。对于空间关系的抽取这一问题,论文采用叁步骤来处理,首先进行第一步的分词,随后对分词的结果进行了两次再处理,第一次再处理是对分词的结果进行进一步的分解,第二次再处理是对进一步分解的结果进行标注,这样提取出了完整的空间关系。在这个过程中采用到了一些规则,这些规则有助于论文更好的提取出完整的空间关系。将空间关系渲染成叁维场景的过程中,论文根据上一步提取出的完整的空间关系,再加上词库和模型库,论文构造出相应的叁维场景。为了将空间关系中的方位词进行合理的数字化,论文给出了每种方位词的计算方法。通过了上述的处理,论文给出的系统让用户可以经过简单的操作就可以构造出与文字一致的叁维场景。(本文来源于《汕头大学》期刊2011-06-01)
庄严,陈东,王伟,韩建达,王越超[5](2010)在《移动机器人基于视觉室外自然场景理解的研究与进展》一文中研究指出对于工作在典型非结构化场景中的移动机器人系统,具有良好的室外自然场景感知与理解能力是其能够自主运行的前提条件.移动机器人使用视觉传感器来进行室外自然场景的理解一直是该领域的研究热点.本文首先介绍了基于视觉的移动机器人自然场景理解的研究现状,对其相关子领域的研究思路与前沿技术进行了着重论述与分析,并从实时性和环境自适应性等方面对相关技术的实用性问题加以讨论.最后对该领域的研究重点和技术发展趋势进行了探讨.(本文来源于《自动化学报》期刊2010年01期)
王冠夫[6](2009)在《移动机器人基于视觉的室外自然场景理解》一文中研究指出机器视觉的研究涉及到模式识别、图像处理、软件工程等学科与技术,其相关研究越来越受到国内外学者的重视。通过视觉传感器对周围环境信息的理解是移动机器人研究的核心问题之一,是移动机器人完成自主导航与环境探索等任务的基础,其中对室外复杂非结构化环境的辨识与理解是该领域研究热点。本文主要研究面向室外非结构化环境的自然场景理解问题。为了实现对室外复杂场景图像的有效辨识与理解,在完成室外环境图像库构建的基础上,提取出图像库中每个训练样本的稳定有效图像特征。本文研究中采用Flea2视觉系统对室外环境进行图像采集和相关图像库的构建。利用高维滤波带对图像库中的样本进行矢量化,并使用聚类学习算法提取出图像的基本结构特征Texton描述符。为了解决机器人在快速运行状态下的避障问题,同时弥补激光测距系统对障碍物区域可能出现的“误判”与“漏判”,本文提出了一种室外动态环境中的快速障碍物检测方法。在利用Texton全局图像直方图对图像场景进行描述的基础上,采用图像全局直方图金字塔匹配方式来完成两幅图像场景间相似度的度量。为了适应环境中多类物体并存的复杂情况,采用支持向量机(SVM)多类分类的方式来构建多类别识别模型,从而实现了对室外动态环境中障碍物的实时检测。为了满足移动机器人自主导航与环境探索任务的需求,自主系统对室外自然场景要具有理解与认知能力。借鉴Boost算法进行数据分类的已有研究结果,本文研究中完成了基于Texton描述符的语义性弱分类器和像素性弱分类器的提取,实现了相应的物体类别的强分类器识别模型构建,从而完成了图像子块的有效分类。由于图像子块中含有大量相似结构信息,采用聚类算法分别构建出不同类别的图像子块模型库,在识别阶段采用模型库匹配算法完成图像子块的识别与分类。为了解决Texton描述符中类别歧义问题,本文提出了一种基于图像子块的语义识别模型,将全局类别分布信息和图像子块的类别信息进行融合,从而显着提高了图像子块类别的平均识别率。实验结果和数据分析验证了本文所提模型和算法的有效性和实用性。(本文来源于《大连理工大学》期刊2009-11-14)
自然场景理解论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对自然场景理解问题,利用图像中的层次结构,提出了一种基于分层合并的图像场景理解方法.该方法通过不断合并相邻区域,直到合并出图像中的各个对象为止;最终得到一个合并森林,森林里的每棵树对应图像中的一个对象.我们设计了一个机器学习模型来描述合并过程、一种贪心推理方法来求解最优的合并森林以及一种基于最大间隔的学习方法来训练模型中的参数,同时采用分层聚类来进行参数的初始化.本文方法可以看成为图像语义理解而设计的一种深度学习方法.实验效果令人满意.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
自然场景理解论文参考文献
[1].陈亚杰.自然场景中交通标志版面理解算法研究[D].北京交通大学.2016
[2].孙丽坤,刘波.基于分层区域合并的自然场景理解[J].计算机系统应用.2014
[3].孙丽坤.基于分层区域合并的自然场景理解[D].北京工业大学.2014
[4].吴靓.基于自然语言理解的3D场景构造研究[D].汕头大学.2011
[5].庄严,陈东,王伟,韩建达,王越超.移动机器人基于视觉室外自然场景理解的研究与进展[J].自动化学报.2010
[6].王冠夫.移动机器人基于视觉的室外自然场景理解[D].大连理工大学.2009
标签:矩形交通标志检测与定位; 文字检测; 交通符号检测; 交通符号识别;