文本定位与提取论文-熊玲

文本定位与提取论文-熊玲

导读:本文包含了文本定位与提取论文开题报告文献综述及选题提纲参考文献,主要关键词:卷积神经网络,最稳定极值区域,笔画宽度变换,灰度共生矩阵

文本定位与提取论文文献综述

熊玲[1](2016)在《自然场景图像中的文本定位和提取算法研究》一文中研究指出近些年来,随着互联网技术和信息技术的飞速发展,手机、数码相机等便携式设备的普及,人们可以根据需要随时随地获取图像并上传到网络。而文字,作为人与人之间交流的媒介,也是信息传递的重要方式。但是自然场景图像中的文本提取仍然是一个复杂的问题。首先,文本作为人工设计的结构,不同语言的文本会表现出不同的结构特点,例如像中国、日本、韩国等东亚国家拥有大规模的字符集,复杂的字符结构和多样的字形。因此,使用一个简单的方法来检测所有语言仍然难以实现。其次,在图像的采集过程中,不可避免会受到各种因素的影响,如不均匀光照、复杂的背景图案等,这些都给文本检测造成了困难。因此,自然场景图像文本定位识别技术仍然是一个热门的研究课题。图像文本定位作为图像文本信息提取中关键的一步,其定位结果将直接影响着后续的文本识别OCR过程。这里,本文主要针对水平英文文本,研究设计了一种多分辨率策略的自然场景图像文本定位框架,可以对自然场景文本图像进行由粗到精的定位提取,从而获得文本区域图像。首先,在文本区域粗定位阶段,该框架会将每张图像转换为3个尺度,目的是能够让算法检测出不同大小的字符。之后,通过训练卷积神经网络来对提取的对象区域分类。在这一阶段里,主要使用两种方法获得对象区域,第一种是基于最稳定极值区域的提取方法,第二种是基于笔画宽度变换的方法。实验结果证明,由于卷积神经网络能够有效地检测出可能存在的字符区域,所以图像文本区域粗定位阶段的性能效果主要受提取的对象区域集合的影响。在本文实验中,用基于最稳定极值区域方法比使用笔画宽度变换方法得到的对象集更加完整。然后,在文本区域精提取阶段,本文首先设计了一套基于图像灰度共生矩阵特征和对比度显着性特征的规则来对多分辨率图像的粗定位结果进行融合。之后,为了去除假阳性文本区域,本文将融合后的结果送入自适应增强分类器,并得到最终的图像文本行。其中,自适应增强分类器是使用梯度方向直方图作为特征描述器来进行训练的。实验结果证明该阶段的方法能够有效地提高图像文本定位的准确率。从本文设计的自然场景图像文本定位框架里得到的结果可以进一步的使用图像二值化方法来分割处理,最终可以直接利用OCR程序来对其进行文本识别。(本文来源于《东南大学》期刊2016-10-01)

刘子玉[2](2015)在《视频中文本的定位与提取》一文中研究指出当今时代,随着通信设备和数字多媒体技术的飞速发展,带宽和存储已经不再是制约人们观看高清视频的阻碍,互联网媒体传播也逐渐从文本时代、图片时代,走入了视频时代。如果我们能够对视频中的文本进行定位并提取,就能得到视频中非常丰富的文本信息。这是计算机视觉与人工智能领域中有较高研究价值的课题,有助于对视频中高级语义信息的理解和检索。本文分析了现有的视频文本定位与提取系统中存在的问题和难点,提出了一个高效的视频中文本的定位、分割、提取系统。首先对输入的视频文件进行解码,以固定频率抽取视频帧图像。针对视频帧图像,文本定位分为两个阶段:第一阶段,提取视频帧图像的角点响应图,利用灰度级形态学操作和自适应的阈值分割获取文本候选区域。第二阶段,通过提取文本候选区域的笔画宽度直方图特征,利用机器学习的方法判断候选区域是否为文本区域。对于文本区域的分割,采用一种基于模糊C均值聚类的方法,根据像素点的颜色和位置信息进行聚类,对背景图像进行颜色分层,从中提取出文本层。最后,再利用形态学的方法对分割中造成损失的文字骨干进行修复,进而完成字符分割。文本分割的结果输入光学字符识别软件,即可得到文本信息。实验结果表明,对比以往算法,本文系统在查准率、查全率、f-measure等性能上都有了很大的提高。(本文来源于《天津大学》期刊2015-11-01)

王克永[3](2015)在《面向网页文本的地理信息要素提取与空间定位方法研究》一文中研究指出随着互联网技术与计算机技术的飞速发展,网络信息中涉及的地理信息内容越来越多,并逐渐呈现出一种指数爆炸增长趋势,成为地理信息获取与更新的重要的途径。互联网信息中的地理信息与其他网页内容一样,以文本的形式存在,非结构性化特征使这些信息不容易被机器自动识别提取出来,无法作为GIS重要数据源进行进一步的统计和分析,同时海量互联网网页文本中也不乏存在一些泄露国家机密、危害国家安全的地理信息数据,互联网中存在的海量地理信息要素数据亟需被自动提取出来并转换为具有地理坐标的空间数据进行分析。对网页文本的地理信息要素提取与地理信息空间定位是解决这些问题的有效方法。网页地理信息要素提取是将网络爬虫所获取的文本进行语义分析处理,并将其中所包含的地名地址与地理实体有效提取。地理信息要素空间定位则是对提取出的要素通过相似度计算、标准化、地理信息要素匹配处理等方法赋予空间坐标,以便GIS分析工具并进行分析处理。针对网页文本中地理信息的识别提取与空间定位问题,研究结果主要包括以下几个方面:(1)网页文本中地理信息要素提取方法。在国内外研究现状基础上,利用隐马尔可夫模型机器学习的方法对网页文本数据进行词性标注预处理。通过地名地址前后缀特征词识别窗口提取候选地名地址,根据制定的规则对候选地名地址进行匹配过滤,提取地名地址;通过HMM词性标注与词性识别窗口相结合提取候选地理实体,根据地理实体的验证规则进行过滤,提取地理实体。最后利用网页文本数据进行实验验证。(2)提出地名地址与地理实体空间定位策略。地名地址在空间定位之前,首先根据地名地址标准结构体进行标准化处理,并且根据地名地址的前后文信息确定其的大体区域范围,然后通过与定位参考库中的地名地址进行匹配比对,匹配成功的确定空间地理坐标,匹配失败无法确定位置的按空间定位模糊策略进行处理。地理实体空间定位采用实体名称相似度计算的方法,取与地理实体库中相似度最高的地理实体空间坐标作为待定位实体坐标,如果相似度均不在设定阈值范围,则无法对待定位地理实体进行定位。(3)根据文中地理信息识别提取与空间定位方法,对互联网中的多个网站进行地理信息要素提取与空间定位,并在原型系统的前端界面进行了直观的展现。(本文来源于《山东农业大学》期刊2015-04-20)

张建明,王娟,张菊,杜丹,房芳[4](2011)在《基于条件笔画密度提取的文本定位方法》一文中研究指出为了解决视频检索中文本定位精确度不高的问题,提出一种基于条件笔画密度提取的文本定位方法。根据文本笔画的特征对视频图像中的文本进行初步定位,用基于条件密度的方法滤去一部分非文本区域,再利用动态形态学对提取的文本区域精确定位并对其优化得到最终的文本区域。实验结果表明,该方法能滤去大部分非文本信息,得到相对精确的文本区域,并且定位效果较好。(本文来源于《计算机工程与设计》期刊2011年10期)

唐伟伟[5](2009)在《视频图像中文本定位与提取的方法研究》一文中研究指出文本是视频图像中重要的内容信息。视频图像中文本的检测和识别在视频分析过程中起到很大的作用。文本可以作为视频图像的内容标识和索引,例如在视频监控中出现的车牌号码,如同身份证般具有唯一性,可用于视频资料的检索以确定目标车辆。所以对视频图像中文本的检测和分析是视频分析的重要内容。可见,如何从背景复杂的视频图像中快速而准确地定位和提取文本,一直是这些年来国际上热门的研究课题。针对图形文本的角点信息较为丰富的特点,本文给出了一种基于角点检测和形态学的文本定位方法。我们注意到,视频图像中的文本一般都与背景有着颜色与亮度的强度对比,这使得文本区域包含了丰富的角点信息。利用这个特征,可先检测出图像的角点信息,接着就能通过形态学的方法定位出候选文本区域。实验表明,该方法可以提取出大部分的文本区域,特别是对于背景简单的图像或视频帧,具有较高的准确性。随后,本文讨论了阈值分割技术,并成功实现了基于小波变换跟支持向量机、小波变换跟K均值聚类两种文本分割方法,实验结果显示:在复杂背景下,即便是对于字体、大小和位置都不确定的文本信息,该方法仍然具有良好的分割效果。文章在最后还简要地介绍了字符识别原理以及几种常用的字符识别方法。(本文来源于《南京理工大学》期刊2009-06-01)

孙李娜,樊来耀[6](2009)在《视频图像中文本的检测、定位与提取》一文中研究指出视频数据中的文本是视频语义理解和检索的重要信息来源。文中对视频中文本的检测、定位、提取、增强和识别进行了研究。提出了应用小波模极大值算法检测视频帧文本所在的位置,用由粗到精的多层定位方法以及金字塔模型,对于多尺度的静止和滚动中英文文字进行提取,最后对文本区域进行二值化。实验表明文中方法取得了良好的效果。(本文来源于《电子科技》期刊2009年01期)

顾胜兰[7](2008)在《自然场景下的文本定位与提取》一文中研究指出自然场景下的文本定位与提取是当前热门且有实际应用意义的课题。随着高性能、低价格的便携数码产品的普及,场景文本的提取和识别正在快速发展。本文在对现有方法进行分析研究以后,结合自然场景中文本的特征,提出了新的解决方案。本文采用改进的Niblack阈值分割法和8邻接的连通域标记法提取场景图像中的连通分量,然后通过先验知识对连通分量进行限制,剔除比较明显的非文本连通分量,再通过机器学习方法之一——支持向量机(Support Vector Machine, SVM)法对中间结果进行验证,剔除先验知识没有排除掉的非文本连通分量,最终得到文本连通分量。实验结果表明本文所用的方法准确有效。为了更有利于识别,本文还对文本块进行二值化和倾斜校正处理。本文将基于Fisher准则的二值化方法应用在文本块的二值化上,利用Fisher准则函数自动选择最佳色彩特征,然后用Otsu法进行分割,分割效果良好,非常适合背景不太复杂的彩色文本块的分割。在对倾斜的文本行进行倾斜校正时,本文提出了一种用一组等距平行线探测倾斜角的方法,再根据倾斜角进行校正。(本文来源于《上海交通大学》期刊2008-12-01)

王蕾[8](2006)在《面向彩色图像中的文本定位与提取研究》一文中研究指出随着计算机科学、多媒体技术的飞速发展,以彩色图像为主的多媒体信息迅速成为重要的通用信息媒体。在彩色图像中,文字信息包含了丰富的高层语义信息,所以如何从彩色图像中快速而准确地定位和提取文本,成为国际上热门的研究课题。对于彩色图像中的文本来说,字符本身与背景之间存在着明显的边缘轮廓。因此本文在进行彩色图像文本定位与提取时采用基于边缘的方法。首先,对彩色图像进行增强处理,提出了一种改进的矢量中值滤波算法;通过将Prewitt边缘检测算子在彩色空间上进行扩展,本文确定了一种新的彩色边缘检测算子,并利用其对彩色图像进行边缘检测操作;随后进行连通域标记,定位出候选文本区域;最后根据人眼的视觉特性和文本特有的特征对文本块进行筛选,去除虚假文本块,提取出文本区域。由于统计模型在模式识别研究中体现出的优势,本文通过将算法在支持向量机下进行扩充来提高文本检测的准确性,由于采用了主动学习的支持向量机,在减少训练样本数量的同时,取得了不错的实验结果。(本文来源于《哈尔滨工程大学》期刊2006-12-01)

李明[9](2004)在《复杂背景下的文本定位与提取研究》一文中研究指出复杂背景下的文本定位与提取研究对于今天这样一个信息时代有着重要的意义,它丰富了图像处理理论,在实际应用中诸如Internet环境下对于图像和视频的检索、现代交通管理中对车牌的识别等有着巨大的商业价值。所以如何从复杂背景的图像和视频中快速而准确地定位和提取文本,成为国际上热门的研究课题。 本文从复杂背景下文本的定位与提取研究所面临的难题入手,对文本的划分、特征抽取及其识别进行了分析。介绍分析了复杂背景下文本定位与提取的多种方法。 本文对于叁种主要的角点检测算法Harris、IPAN和SUSAN进行了实现,并比较了它们之间的优劣,在着重分析SUSAN角点检测方法的基础上,对该算法进行了改进,实验结果表明,改进的算法取得了更为满意的效果。在此基础上提出了基于SUSAN角点检测的文本定位与提取算法,并且将其扩展到支持向量机的框架下。 我们还重点研究了模糊理论在文本定位与提取上的应用。介绍了子图像变异灰度直方图的概念,将其成功的应用到文本的定位与提取中去,实现了基于子图像变异灰度直方图的文本定位与提取算法,该方法对于图像和视频中的文本/字幕取得了较好的效果。接着将模糊理论与该算法结合起来,使得算法在鲁棒性、正确率和处理速度方面都得到进一步提高。 最后对视频文本的多帧检测问题进行了讨论。(本文来源于《合肥工业大学》期刊2004-06-01)

文本定位与提取论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

当今时代,随着通信设备和数字多媒体技术的飞速发展,带宽和存储已经不再是制约人们观看高清视频的阻碍,互联网媒体传播也逐渐从文本时代、图片时代,走入了视频时代。如果我们能够对视频中的文本进行定位并提取,就能得到视频中非常丰富的文本信息。这是计算机视觉与人工智能领域中有较高研究价值的课题,有助于对视频中高级语义信息的理解和检索。本文分析了现有的视频文本定位与提取系统中存在的问题和难点,提出了一个高效的视频中文本的定位、分割、提取系统。首先对输入的视频文件进行解码,以固定频率抽取视频帧图像。针对视频帧图像,文本定位分为两个阶段:第一阶段,提取视频帧图像的角点响应图,利用灰度级形态学操作和自适应的阈值分割获取文本候选区域。第二阶段,通过提取文本候选区域的笔画宽度直方图特征,利用机器学习的方法判断候选区域是否为文本区域。对于文本区域的分割,采用一种基于模糊C均值聚类的方法,根据像素点的颜色和位置信息进行聚类,对背景图像进行颜色分层,从中提取出文本层。最后,再利用形态学的方法对分割中造成损失的文字骨干进行修复,进而完成字符分割。文本分割的结果输入光学字符识别软件,即可得到文本信息。实验结果表明,对比以往算法,本文系统在查准率、查全率、f-measure等性能上都有了很大的提高。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文本定位与提取论文参考文献

[1].熊玲.自然场景图像中的文本定位和提取算法研究[D].东南大学.2016

[2].刘子玉.视频中文本的定位与提取[D].天津大学.2015

[3].王克永.面向网页文本的地理信息要素提取与空间定位方法研究[D].山东农业大学.2015

[4].张建明,王娟,张菊,杜丹,房芳.基于条件笔画密度提取的文本定位方法[J].计算机工程与设计.2011

[5].唐伟伟.视频图像中文本定位与提取的方法研究[D].南京理工大学.2009

[6].孙李娜,樊来耀.视频图像中文本的检测、定位与提取[J].电子科技.2009

[7].顾胜兰.自然场景下的文本定位与提取[D].上海交通大学.2008

[8].王蕾.面向彩色图像中的文本定位与提取研究[D].哈尔滨工程大学.2006

[9].李明.复杂背景下的文本定位与提取研究[D].合肥工业大学.2004

标签:;  ;  ;  ;  

文本定位与提取论文-熊玲
下载Doc文档

猜你喜欢