导读:本文包含了框线检测论文开题报告文献综述及选题提纲参考文献,主要关键词:表格识别,框线检测,表格线游程,层次聚类
框线检测论文文献综述
白伟,崔喆[1](2018)在《基于游程聚类的表格框线检测算法》一文中研究指出现有的基于游程的表格框线检测算法检测速度快,但对于复杂表格框线检测质量不高,甚至出现大量错误。提出一种基于游程层次聚类的表格框线检测算法。首先,把可能属于同一条横线或纵线的游程划分到一个游程组,定义了两条框之间的相似度;然后以这组游程为初始原子类,通过层次聚类迭代地选择相似度最大的两条横线或纵线合并为一条框线。当相似度最大的两条框线相似度小于预先设定的一个阈值或仅剩下一条框线时迭代停止。针对图像中的标题和说明段等文字信息形成的线条,提出亲属表格线的概念,删除不包含两条亲属表格线的线段,最后对提取的框线进行二次提取。为了对算法加速,提出对各游程组并行聚类。实验结果表明,该算法相比现有算法对一些复杂表格的框线识别率提高了50%以上。(本文来源于《计算机应用》期刊2018年S1期)
周壮[2](2015)在《表格识别系统中框线检测与去除的算法研究》一文中研究指出在日常的商业活动中,我们每天都运用了大量的文档和表格。同时表格文档也广泛地应用于各个领域,通常人们需要手动处理表格文档,例如客户需要采集发票中的金额税额,图书管理员需要采集纸质表格文档中所包含的数据信息。由于光学字符识别(OCR)技术的发展,人们开始尝试利用可获得数据的标准表格图像来提取表格中的数据信息,这可以减少工作时间和减轻工作负担。在商业领域中,利用OCR技术可以提高工作质量,并且可以减少人们花费在处理表格文档上的大量时间。在OCR运用的许多领域中,我们通过获取的表格模板使用户知道图像中印刷体的目标字符串。这些字符串信息包括了许多项目内容如文本信息和数学公式等。然而,表格的存在阻碍了数据信息的提取。因此,表格线检测/去除是印刷体表格识别技术中的一项重要任务。由上可知,我们需要一个实际的表格识别系统来处理这些问题。本文在印刷体文档识别技术的基础上,对表格文档的识别技术进行了深入的研究,并完成了部分表格识别系统的开发工作。传统的表格识别系统可以分为二部分:表格框架识别和图像信息提取与表格重绘。在表格框架识别部分中,首先表格线的检测、去除以及图像识别处理技术都是基于二值图像完成的。因此,本文运用了一种有效的二值化算法将256色灰度图像转化为理想的二值图像。本文提出了新的框线检测算法,完全可以运用于存在框线与字符存在交叉的情况。在完成图像中的表格线的提取之后,针对表格线存在的断裂和非对齐等问题分别做出相应的处理,并且将图像中的横向与纵向表格线重组成表格框架。表格识别过程中的另一个重要任务是将已检测出的框线从原始表格图象中去除。去除框线的难点在于当字符笔画和表格框线相交迭时如何在去除框线的同时完整地保留字符笔画。本文对于表格框线的去除也提出了新思路和算法。(本文来源于《辽宁科技大学》期刊2015-06-07)
曹敏浩[3](2013)在《模具框线位置视觉检测系统研究》一文中研究指出随着汽车制造业的蓬勃发展,汽车零部件质量的检测对于整车的安全性而言显得尤为重要。汽车座椅是汽车的重要零部件之一,而合绵是构成汽车座椅不可或缺的部分,其质量的好坏将直接决定汽车座椅是否合格。同时合绵中的框线也直接决定着合绵的质量,一方面它能够增加合绵的强度,另一方面它用来固定外饰件,因此框线的漏装和框线位置的错误将直接导致合绵的不合格,从而也导致了座椅质量的不合格。传统的合绵中框线的检测是在合绵的生产过程中通过人为的放置框线然后肉眼观察实现的。但是,由于长时间的工作,人眼会产生视觉疲劳,可能带来漏判和误判。这样一方面会导致所生产的合绵不合格,另一方面会浪费原材料,增加了生产的成本。随着现代工业自动化检测技术的发展,基于机器视觉的检测技术因其具有非接触、速度快、精度高等优点,在工业智能化检测中有着广泛的应用和广阔的发展前景。本文在综合考虑生产线上生产合绵的模具种类繁多、大小不一、内部结构复杂等情况的基础上,提出了采用叁相机和组合光源(条形光和线结构光)的方法来进行检测,该方法不仅解决了摄像机视域范围狭窄和运动目标间的遮挡问题,同时也解决了由于模具内部结构复杂和环境光照突变给图像带来的干扰问题,而且提高了图像的对比度;在VS2008的平台上对框线位置识别系统进行了软件开发,系统软件操作简单,交互性好;针对模具图像,研究了图像处理过程中的预处理方法和边缘检测算法并对其进行了仿真,对经典的边缘检测算子Sobel算子进行了改进,探讨了一种对生产线上各类模具中框线识别具有很好适应性的图像处理算法,大大提高了合绵中框线位置检测的可靠性。在结合上述理论研究和现场实验验证的基础上,研制并开发出了一套基于机器视觉的模具内框线位置检测机,该系统在线检测的工位达到118个,检测率在90%以上,检测算法很好的满足了生产线上多种模具在线检测的需求,具有一定的工程应用价值。(本文来源于《湖北工业大学》期刊2013-05-01)
张艳,郁生阳,张重阳,杨静宇[4](2008)在《表格型票据中框线检测与去除算法》一文中研究指出字符笔画与表格线的粘连或交迭是表格型票据中普遍存在的现象,严重影响了后期票据自动识别处理的性能.现有方法大多基于二值图像,未能充分利用灰度图中的框线特征.基于票据图像中的框线特征,提出一种表格型票据预处理中的框线检测与去除算法,首先充分利用票据灰度图像的特点准确地检测出框线,再采用一种连通链结构描述迭加后的框线区域,然后对交迭进行判断和标记,根据标记保留字符笔划去除框线干扰.经过实际银行支票图像测试证明了算法的有效性和鲁棒性.(本文来源于《计算机研究与发展》期刊2008年05期)
周绍光,赵建泉[5](2008)在《任意倾角表格框线的快速检测》一文中研究指出表格的识别近年来受到了越来越多的关注,已取得一些行之有效的成果。其中的部分算法可抗任意角度的倾斜,然而其运行效率却都低于投影类方法。而投影方法虽然效率很高,但不能处理严重倾斜的表格。文章给出一种新的检测倾斜表格框线的途径。算法利用数字影像中直线段的结构特征高效地检测出表格的一条边框线,并由此获得所需的角度值,进而沿着角度所指定的方向迅速搜索出边框线。整个检测方法的效率类似于投影法,同时可抗任意角度的旋转。(本文来源于《计算机工程》期刊2008年03期)
张艳,张重阳,郁生阳,杨静宇[6](2007)在《基于框线检测的票据图像分类方法》一文中研究指出针对表格型票据,提出了一种基于框线检测的多类别票据图像分类方法。准确提取票据图像的框线特征,根据票据框线的拓扑结构建立起模板库;通过基于框线相关性的相似度模型,与标准模板库中模板的框线特征进行匹配,进而确定票据的分组类别。实际的票据分类实验证实了该方法的有效性和鲁棒性,为票据自动处理打下了坚实的基础。(本文来源于《南京理工大学学报(自然科学版)》期刊2007年04期)
郑秀清,付茂名[7](2004)在《一种改进的自动表格框线检测方法》一文中研究指出基于数学形态学的原理对表格框线进行检测,以横线与竖线的交点作为特征点。对结构元素采用了智能选取的方式,一方面可避免由于结构元素过小,将文字的横(竖)线当作表格线提取,另一方面可防止由于结构元素过大,漏掉部分表格线的提取。本文还对已提取的表格线进行断点补偿,去除噪声带来的干扰。实验结果表明,该方法效果较好。(本文来源于《中国民航飞行学院学报》期刊2004年04期)
刘长松,潘世言,郑冶枫,丁晓青[8](2002)在《一种表格框线检测和字线分离算法》一文中研究指出该文提出了一种基于有向单连通链的表格框线检测算法,能够合理地利用单连通链边沿的全局统计特性和单连通链之间的局部位置关系,精确地提取表格框线,具有抗倾斜,抗断裂,抗字线交迭等优点。在此基础上,提出了一种能够分离交迭字线的表格框线去除算法,并成功应用于实际的表格识别系统中。(本文来源于《电子与信息学报》期刊2002年09期)
郑冶枫,刘长松,丁晓青,潘世言[9](2002)在《基于有向单连通链的表格框线检测算法》一文中研究指出表格框线检测是表格识别的基础.现有的表格框线检测算法或者速度慢,或者鲁棒性差,而且没有充分利用表格框线之间的约束信息提出了一种基于所定义的图像结构基元“有向单连通链”的自底向上表格框线检测算法.在此算法中,有向单连通链是一种黑像素游程序列,作为非常合适的矢量基元,在引入一定表格框线约束信息的条件下合并单连通链,有效地去除伪框线,补全断裂的框线,提高了算法的鲁棒性,可以准确而快速地提取表格框线.通过滤除噪声单连通链,加快单连通链的合并速度,算法速度提高了3~10倍,满足了实用要求、实验证明,该算法具有速度较快、鲁棒性高、抗任意角度的倾斜、抗断裂等优点.(本文来源于《软件学报》期刊2002年04期)
框线检测论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在日常的商业活动中,我们每天都运用了大量的文档和表格。同时表格文档也广泛地应用于各个领域,通常人们需要手动处理表格文档,例如客户需要采集发票中的金额税额,图书管理员需要采集纸质表格文档中所包含的数据信息。由于光学字符识别(OCR)技术的发展,人们开始尝试利用可获得数据的标准表格图像来提取表格中的数据信息,这可以减少工作时间和减轻工作负担。在商业领域中,利用OCR技术可以提高工作质量,并且可以减少人们花费在处理表格文档上的大量时间。在OCR运用的许多领域中,我们通过获取的表格模板使用户知道图像中印刷体的目标字符串。这些字符串信息包括了许多项目内容如文本信息和数学公式等。然而,表格的存在阻碍了数据信息的提取。因此,表格线检测/去除是印刷体表格识别技术中的一项重要任务。由上可知,我们需要一个实际的表格识别系统来处理这些问题。本文在印刷体文档识别技术的基础上,对表格文档的识别技术进行了深入的研究,并完成了部分表格识别系统的开发工作。传统的表格识别系统可以分为二部分:表格框架识别和图像信息提取与表格重绘。在表格框架识别部分中,首先表格线的检测、去除以及图像识别处理技术都是基于二值图像完成的。因此,本文运用了一种有效的二值化算法将256色灰度图像转化为理想的二值图像。本文提出了新的框线检测算法,完全可以运用于存在框线与字符存在交叉的情况。在完成图像中的表格线的提取之后,针对表格线存在的断裂和非对齐等问题分别做出相应的处理,并且将图像中的横向与纵向表格线重组成表格框架。表格识别过程中的另一个重要任务是将已检测出的框线从原始表格图象中去除。去除框线的难点在于当字符笔画和表格框线相交迭时如何在去除框线的同时完整地保留字符笔画。本文对于表格框线的去除也提出了新思路和算法。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
框线检测论文参考文献
[1].白伟,崔喆.基于游程聚类的表格框线检测算法[J].计算机应用.2018
[2].周壮.表格识别系统中框线检测与去除的算法研究[D].辽宁科技大学.2015
[3].曹敏浩.模具框线位置视觉检测系统研究[D].湖北工业大学.2013
[4].张艳,郁生阳,张重阳,杨静宇.表格型票据中框线检测与去除算法[J].计算机研究与发展.2008
[5].周绍光,赵建泉.任意倾角表格框线的快速检测[J].计算机工程.2008
[6].张艳,张重阳,郁生阳,杨静宇.基于框线检测的票据图像分类方法[J].南京理工大学学报(自然科学版).2007
[7].郑秀清,付茂名.一种改进的自动表格框线检测方法[J].中国民航飞行学院学报.2004
[8].刘长松,潘世言,郑冶枫,丁晓青.一种表格框线检测和字线分离算法[J].电子与信息学报.2002
[9].郑冶枫,刘长松,丁晓青,潘世言.基于有向单连通链的表格框线检测算法[J].软件学报.2002