导读:本文包含了字符区域定位论文开题报告文献综述及选题提纲参考文献,主要关键词:自然场景字符区域定位,字符识别,油罐车车号定位与识别,MSER
字符区域定位论文文献综述
王猛[1](2016)在《自然场景下字符区域的定位与识别》一文中研究指出随着手机等各种智能移动设备的发展,人们越来越关注对生活中及工业环境等自然场景下文本信息的获取与利用。自然场景中的文本信息不同于印刷文本,它具有多样的语言文字、不同的字体和大小、复杂背景的干扰、残缺和污损的影响,这些都为自然场景下文本信息的获取与利用带来一定的困难和挑战。本论文致力于对自然场景下文本区域准确定位和识别的研究,重点研究英文字符与数字区域的定位与识别;并在此基础上进一步研究自然场景文本区域定位与识别的一种特殊场景,复杂工业环境下的铁路油罐车车号区域定位与识别。铁路油罐车车号区域作为自然场景下文本区域的一部分,因其字符存在断裂等特点,本论文把复杂工业环境下的铁路油罐车车号区域定位与识别作为自然场景下文本区域定位与识别的一种特殊场景进行研究,以达到从复杂工业环境下的众多干扰中准确定位出铁路油罐车车号区域的目的,并对其进行断裂字符的分隔与识别。本论文在充分对比总结各种文本区域定位方法的基础之上,给出一种既适用于自然场景下普遍存在的英文字母和数字区域的定位,也适用于复杂工业环境下铁路油罐车车号区域定位的通用方法。该方法对尺寸大小不同、存在倾斜、受光照变化影响的文本区域具有较好的定位效果,首先利用最大稳定极值区域(Maximally Stable Extremal Regions,MSER)检测获取极值区域,并从得到的极值区域中筛选、连接成有效区域对,进一步由有效区域对得到叁联体区域,然后由符合一定特征的叁联体区域连接成候选文本区域,并利用支持向量机(Support Vector Machine,SVM)对候选文本区域进行筛选。该方法对自然场景下的文本区域具有较好的定位效果,为验证本方法的通用性,本论文对自然场景下一个特殊应用场景-复杂工业环境下铁路油罐车车号信息的获取进行研究。本论文充分针对铁路油罐车车号字符断裂的特点,给出一种适合于断裂字符的分隔方法。对于字符的识别考虑到自然场景下的字符种类繁多、字体多变,而铁路油罐车车号字符种类固定、字体变化相对较少,采用不同的方法对这两大应用场景中的字符进行识别。对于自然场景下普遍存在的英文字母和数字,使用Tesseract-OCR进行训练与识别;对于铁路油罐车车号字符,本论文利用SVM对其进行分类识别。经过大量实验证明,本论文所采用方法对两大研究场景中的文本信息具有较好的定位与识别效果。(本文来源于《哈尔滨工程大学》期刊2016-05-01)
肖意,姜军[2](2015)在《基于最大稳定极值区域的车牌定位与字符分割》一文中研究指出车牌定位与字符分割是车牌识别系统进行字符识别前重要的两个步骤,论文将介绍一种高效的基于最大稳定极值区域(MSER)的车牌定位与分割算法。首先对图像进行预处理并提取MSER,根据MSER间几何关系将相邻的MSER聚类在一起作为一个车牌候选区域,再利用机器学习及标准车牌的特点对每个候选区域进行分析,定位出车牌区域。然后将车牌区域根据字符的个数及MSER间关系划分为不同等级,并对不同等级的车牌采用不同的分割算法。实验数据表明,该方法车牌定位的准确率是99.07%,字符分割的准确率为97.9%。(本文来源于《计算机与数字工程》期刊2015年12期)
周军[3](2014)在《图像中自然场景字符区域定位》一文中研究指出近几年,由于多媒体技术和互联网的蓬勃发展,全世界数字图像容量迅猛增长。我们生活的每一天都能产生数千兆字节容量的图像,这些图像中的字符承载着非常有用的信息,例如交通道路指示牌、街道名称、商店名字、广告牌、海报、书籍封面等。假如能自动定位图像中的字符区域,那么对于图像高层语义的理解、索引和检索有重大意义。本文结合应用数学相关知识,建立数学模型,围绕图像中自然场景字符区域定位,做了如下工作:首先,利用Canny边缘提取算子与NiBlack算子相结合提取出原图像的边缘图,结合两种算子各自的优点,既可以抑制背景和噪声,又可以将邻近的字符区域分开,为后续的字符特征提取做好准备工作;其次,将边缘图进行填充,进行连通区域分析,利用字符特征,如字符宽高比满足一定比例、笔画宽度相似性等多个特征去除部分背景或者非字符区域,得到字符候选区域粗提取。再次,将粗提取的字符候选区域对比着原图像上色,根据字符区域颜色一致性,采用K均值聚类算法聚成叁类。因为字符区域较非字符区域具有更多的角点,因此再结合Harris角点检测算法通过判断连通区域角点的数目来区分哪一类为字符区域,哪一类为非字符区域,从而将一部分非字符区域去除,得到字符候选区域精提取;最后,针对精提取的字符候选区域仍会有非字符存在的情况,本文提出基于支持向量机结合HOG特征和LBP特征,对字符候选区域进行识别分类。HOG特征通过计算统计图像局部区域的梯度方向直方图获得,LBP能够很好地描述图像纹理特征,采用主成分分析进行特征选择。用训练好的分类器进行识别分类,最终达到图像中自然场景字符区域准确定位的效果。本文提出的图像中自然场景字符区域定位算法可检测图像中存在多类不同字符的情况,也可检测字符区域像素值较背景低的情况。经实验表明,字符区域定位效果好,且不易受光照、字符字体、复杂背景等因素的影响,具有较好的鲁棒性。(本文来源于《东北大学》期刊2014-06-01)
陶志勇,孙劲光,任晓奎[4](2004)在《图像/视频字符区域定位算法的实现》一文中研究指出对图像/视频中的文字检测方法是基于字符的纹理特征进行处理的,首先将图像进行 DCT 变换,因为变换的系数分布代表了不同方向的能量,对变换的系数进行能量计算得到一个比较粗略的选区,然后进行形态学操作,滤掉一些不符合字符特征的区域,从而将图像中的字符区域提取出来,用 matlab 进行了测试,测试中发现,对一些复杂的背景下的字符还存在着漏判和误判现象。(本文来源于《辽宁工程技术大学学报》期刊2004年S1期)
字符区域定位论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
车牌定位与字符分割是车牌识别系统进行字符识别前重要的两个步骤,论文将介绍一种高效的基于最大稳定极值区域(MSER)的车牌定位与分割算法。首先对图像进行预处理并提取MSER,根据MSER间几何关系将相邻的MSER聚类在一起作为一个车牌候选区域,再利用机器学习及标准车牌的特点对每个候选区域进行分析,定位出车牌区域。然后将车牌区域根据字符的个数及MSER间关系划分为不同等级,并对不同等级的车牌采用不同的分割算法。实验数据表明,该方法车牌定位的准确率是99.07%,字符分割的准确率为97.9%。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
字符区域定位论文参考文献
[1].王猛.自然场景下字符区域的定位与识别[D].哈尔滨工程大学.2016
[2].肖意,姜军.基于最大稳定极值区域的车牌定位与字符分割[J].计算机与数字工程.2015
[3].周军.图像中自然场景字符区域定位[D].东北大学.2014
[4].陶志勇,孙劲光,任晓奎.图像/视频字符区域定位算法的实现[J].辽宁工程技术大学学报.2004
标签:自然场景字符区域定位; 字符识别; 油罐车车号定位与识别; MSER;