二值文档论文-王鑫睿

二值文档论文-王鑫睿

导读:本文包含了二值文档论文开题报告文献综述及选题提纲参考文献,主要关键词:信息熵,笔画宽度变换,能量函数,形态学闭操作

二值文档论文文献综述

王鑫睿[1](2019)在《历史文档图像二值化算法研究》一文中研究指出文档分析与识别包含影像预处理、文字特征抽取以及数据库对比等技术,文档图像二值化对于整个系统至关重要,二值分割准确率直接影响识别结果的可靠性,由于历史文档图像存在页面污渍、字符褪色、纤细笔画、光照不均、墨迹浸润以及折迭印痕等多种退化因素,导致现有算法难以取得较好分割效果,因此本文围绕低质量历史文档图像二值化算法展开研究,主要工作及创新点如下:(1)针对低质量历史文档图像对比度较低问题,提出一种结合背景估计与能量函数的历史文档图像二值化算法。算法首先利用最小均值法对彩色图像进行灰度化,均衡字符灰度差异,增强图像对比度,其次利用基于信息熵的笔画宽度变换算法估计图像的字符宽度,然后采用形态学闭操作估计文档图像的大致背景,最后将去除背景的图像映射至能量函数,构造基于能量函数的图结构,通过图的最小割寻找能量函数的最优解,获取二值化图像。实验结果表明,算法能较好地抑制污渍背景,有效处理文字暗背景亮、文字亮背景暗的历史文档图像。(2)针对历史文档图像的二值化存在噪点问题,提出一种基于混合金字塔U型卷积神经网络(Hybrid Pyramid U-Net,HPU-Net)的文档图像二值化算法。首先基于上述算法的背景估计过程,获取去除背景后的文档图像,然后结合对数损失与Dice系数作为损失函数,采用卷积神经网络(HPU-Net)对减除背景的历史文档图像像素点进行分类,最后利用全局最优阈值方法(Otsu)获得二值分割图像。实验结果表明,该算法不仅可以保留笔画细节,而且分割精度较高。(3)采用文档图像二值化竞赛(Document Image Binarization Contest,DIBCO)所提供的数据集和评估指标,将本文提出的两种算法与十叁种图像二值化方法作对比,实验结果表明,在2016至2018年文档图像二值化算法竞赛,本文提出两种算法的F值(F-Measure,FM)、伪F值(pseudo F-Measure,p-FM)、峰值信噪比(Peak Signal to Noise Ratio,PSNR)、距离倒数失真度量(Distance Reciprocal Distortion,DRD)相较于性能次优的二值化算法最高分别有5.00%、5.82%、1.22dB、2.86%的性能提升。(本文来源于《湖北工业大学》期刊2019-06-01)

冯炎[2](2019)在《基于对比度归一化的历史文档图像二值化算法》一文中研究指出多数历史文档图像存在背景污渍、涂抹和字迹模糊等对比度较低的情况,从而给历史文档二值化增加了较大难度。前期研究发现,历史文档中文本内容通常与文档背景的亮度水平不同,利用文档背景估计值可以有效削弱退化区域并突出字符信息;根据这两个观点,提出了一种基于对比度归一化的历史文档图像二值化算法。所提出的方法包含叁个步骤:首先采用图像修复算法和Niblack算法结果来粗略估计背景;然后使用文档背景对历史文档图像存在的不同退化类型进行归一化处理,并对归一化处理后的文档图像进行增强、二值化,将文档中的文本分割出来。采用DIBCO数据库和H-DIBCO数据库对所提出的算法进行测试,取得了较好的实验结果。(本文来源于《科学技术与工程》期刊2019年01期)

完颜勇[3](2018)在《基于对比度增强和背景估计的文档图像二值化》一文中研究指出针对文档图像存在的退化状况对其二值化处理的影响,文中提出一种基于对比度增强和背景估计的文档图像二值化算法,用于对退化的文档图像进行二值化增强处理。该算法根据不同子区域亮度信息的差异采用不同对比度增强算法对文档图像进行增强处理,通过运用形态学闭运算对增强后的文档图像进行处理来移除文档图像的背景,结合Ostu和Sauvola算法获取文档图像的二值化图像,并通过基于边缘像素邻域灰度值的分布情况进行文本断笔修复。实验结果表明,该算法的F-Measure(FM)为90.47%,峰值信噪比(PSNR)达到19.15 d B,负率指标(NRM)低至0.053 8,分类错误度量(MPM)降至0.000 33,验证了本文提出的二值化算法的有效性。(本文来源于《电子科技》期刊2018年04期)

林凯[4](2018)在《文档图像自适应二值化与字符识别》一文中研究指出现代办公逐步走向数字化,将纸质文档图像转化为数字电子文档的需求逐渐增多,但是直接将其扫描成图像存储或者人工录入,显然效率低,数据量大。OCR技术使得纸质文档图像到数字文档转存更加便捷,随着OCR技术的逐渐成熟,OCR也开始不断被各行各业所应用。目前OCR适合识别高质量的文档图像,但是对于处理低质量类型的文档图像效果并不理想。因此对于OCR技术应用于识别这些低质量文档图像的算法仍需进一步的研究。本文通过研究降质类型文档图像特点,发现对于降质文档图像的OCR处理性能关键在于图像的预处理也就是二值化处理过程,而对于多字体印刷体汉字的识别,需要在保证其具有高效的识别率同时保证识别系统的稳定性。因此本文通过大量研究国内外二值化算法以及字符识别算法,分别对低质量文档图像二值化以及多字体印刷体汉字的识别进行相应的改进研究,以提高OCR系统的识别率和稳定性。本文的主要工作如下:第一,本文根据图像的灰度直方图之间即存在一定差异又存在一定联系的特性,分析了经二值化算法分类后的图像灰度直方图特征属性,通过将已有的二值化算法与SVM结合,实现对任意文档图像实现自适应选择二值化算法,该算法首先对DIBCO标准库中的图像进行处理,按优以预定的二值化方法对处理后的图像进行归类,其次提取图像的灰度直方图的特征属性作为特征向量,其对应的图像二值化算法作为标签建立训练样本,最后采用SVM建立自适应选择模型,以达到自适应选择二值化方法的目的。第二,本文深入研究了多字体印刷体汉字的特点以及卷积神经网络的结构,提出了一种基于Le Net-5结构的改进网络结构,主要对Le Net-5结构中包括对输入层、隐藏层、激励函数以及输出层进行改进。增加特征提取层的同时又通过减少全连接层来降低训练参数,从而减少训练成本。以改进的Le Net-5网络结构对一级字表中的不同笔画结构的100个不同字体的印刷体的汉字进行识别。(本文来源于《哈尔滨理工大学》期刊2018-03-01)

熊炜,徐晶晶,赵诗云,王改华,刘敏[5](2018)在《基于支持向量机的低质量文档图像二值化》一文中研究指出针对低质量文档图像受墨迹浸润、页面污渍、背景纹理或光照不均等因素的影响,提出一种基于支持向量机(SVM)的低质量文档图像二值化方法。该方法对文档图像进行分块,并增强每个图像块的局部对比度;利用SVM将这些图像块分成叁类,对不同图像类采用不同的阈值处理,实现粗略分割;通过笔画宽度估计确定邻域窗尺寸,从而实现局部精细二值化。实验结果表明,该算法无论从二值化图像质量,还是各种评估参数,较其他经典文档二值化方法都具有明显优势。(本文来源于《计算机应用与软件》期刊2018年02期)

徐晶晶[6](2017)在《低质量文档图像的二值化算法研究》一文中研究指出文档图像二值化是文档分析与识别(DAR)技术中极其重要的一个关键环节,二值化的好坏对整个DAR系统的性能起着决定性作用。由于低质量文档图像自身的复杂性以及退化因素的多样性(如墨迹浸润、页面污迹、光照不均、背景纹理等),要找到一种适应各类型退化图像的二值化算法成为学术界关注的热点问题。本文的主要工作如下:(1)针对退化图像常有的弱对比度现象,提出基于高对比度像素检测和笔画宽度变换的二值化方法。该算法首先对输入的彩色文档图像进行最小均值(Min-avg)灰度化,既能增加前景与背景的对比度,又减小了前景像素间的灰度差异;其次采用非线性双边滤波算法滤除噪声,由于结合了像素空间邻近度及灰度相似性,具有保边除噪的优点;然后通过局部对比度增强技术,使图像具有明显的双峰特征,并利用全局最优阈值法(Otsu算法)检测出高对比度像素作为“种子”像素;最后,采用笔画宽度变换算法(SWT)估计图像的笔画宽度,并确定滑动窗口的大小,从而实现基于邻域窗的局部精细二值化。结果表明,该算法在抑制背景的同时,能较完整地保留字符前景,实现正确分类。(2)针对低质量图像存在复杂变化的背景特性,提出基于背景估计和能量最小化的二值化方法。首先沿用了前述算法的预处理过程(最小均值灰度化和双边滤波去噪);然后通过形态学闭操作估计出图像的大致背景,并根据差值图像确定高置信背景像素,从而去除估计背景;之后对背景减除图像构造Laplacian能量函数,基于此能量函数将图像映射为图结构;最后根据图论算法的原理,采用网络最大流方法使能量函数取最小值,求得最优二值图像。实验表明,去除估计背景后的图像对比度有明显提升,前景与背景的分割更精确。(3)对本文研究的两种方法和七种经典方法进行对比分析,选用国际文档图像二值化竞赛(DIBCO)评判指标作为衡量评价算法性能的指标参数。实验证明,本文两种方法相比于性能较好的LMM算法在F-measure上分别有0.5%和3%的提升。(本文来源于《湖北工业大学》期刊2017-06-01)

熊炜,赵诗云,徐晶晶,赵楠[7](2016)在《低质量文档图像二值化算法研究》一文中研究指出针对低质量文档图像中存在的墨迹浸润、页面污渍或背景纹理等退化因素,提出一种低质量文档图像二值化算法。算法首先基于文档图像的局部对比度实现字符笔画像素检测,然后采用Otsu算法对其进行全局最优阈值化处理,最后通过估计字符笔画宽度确定邻域窗尺寸,从而实现字符前景与页面背景的精细分割。实验结果表明,该算法在F-measure、PSNR、SSIM、NRM、DRD等性能指标方面较其它经典的文档二值化算法具有明显优势。该算法不仅能够较好地保留笔画细节外,还能够较好地抑制文档背景。(本文来源于《计算机应用与软件》期刊2016年07期)

赵诗云[8](2016)在《低质量文档图像二值化算法研究》一文中研究指出文档图像二值化是文档自动识别与分析的关键预处理步骤,其性能优劣直接影响系统的后续操作(如文字提取和识别)的准确度。由于图像受墨迹浸润、页面污迹、背景纹理等退化因素影响,使得低质量文档图像的二值化仍是目前的研究重点和难点。本文对低质量的文档图像二值化深入研究,提出了两种算法,一种基于局部对比度和笔画宽度估计的文档图像二值化算法,以及在其基础上利用支持向量机(SVM)分类的一种改进算法。基于局部对比度和笔画宽度估计算法首先提高文档图像的局部对比度,然后使用Otsu算法进行全局最优阈值化处理,最后利用比例轮廓法确定估计字符笔画宽度,根据笔画宽度确定邻域窗尺寸大小,从而实现字符前景与页面背景的精细分割。由于这种算法使用了Otsu对文档图像进行初步阈值分割,其二值化的结果也会影响最终结果,为了让二值化的效果更可观,作者继续对图像二值化深入研究,在基于局部对比度和笔画宽度估计的图像二值化算法基础上做出改进,提出了一种新的改进算法。该算法首先将整幅图像分割成5×5大小的图像,即每幅图像均分成25块,以块的形式对其单独处理,然后采用SVM对每块文档图像进行分类。通过提取文档图像的11种特征,将文档图像分为叁类,依次对这叁种不同类型的文档图像采用不同的全局阈值处理,实现其初步二值化处理。接着,将每块图片合成一张完整的二值化图像,最后利用笔画宽度确定滑动窗口尺寸大小,对每块文档图像实行局部二值化以消除噪声点和误判区。本文采用了10种经典算法与文中提出的两种算法进行对比实验,以F-measure、PSNR、SSIM、NRM、DRD、MPM等性能指标作为评估参数。实验结果表明,本文提出的基于局部对比度和笔画宽度估计的文档图像二值化算法不仅能够较好地保留笔画细节,而且还能够较好地抑制文档背景。在其基础上利用SVM分类器的改进算法得到进一步提高,无论从二值化图像质量,还是各种评估参数,利用SVM分类器的改进算法都具有明显优势。(本文来源于《湖北工业大学》期刊2016-06-01)

曾凡锋,王战东,郭正东[9](2015)在《非均匀光照文档图像快速二值化方法》一文中研究指出拍照方式获取的文档图像在OCR识别中,可能因光照不均而导致识别率低下。针对此问题,提出一种基于分块的自适应文档图像快速二值化方法。根据文档区域亮度特征划分光照均匀区域、阴影区域及亮光区域,对不同区域自适应地选取最有效的二值化算法。为解决传统White算法自适应能力的不足,对其进行改进,有效减少了伪影和断笔的产生。实验结果表明,该方法能明显提高光照不均文档图像的OCR识别率,且校正速度快、鲁棒性好。(本文来源于《计算机应用与软件》期刊2015年11期)

梁添才,刘建平,罗攀峰[10](2015)在《一种改进拉普拉斯能量的文档图像二值化方法》一文中研究指出图像二值化是将文本从背景中分离的算法,是后继识别任务的关键预处理步骤。低质量的文本图像往往包含各种退化情况,比如:光照不均匀、笔画灰度变化过大、背面渗透等。这些退化情况导致其二值化非常困难。近几年出现的基于Laplacian能量的二值化方法对退化文档进行二值化取得较好的结果,但是上述方法容易导致细长弱笔画丢失。为此提出一种改进Laplacian能量的方法,利用笔画有较强的双边缘响应,对笔画区域的Laplacian算子响应进行加强,使得细长弱笔画得以保留。针对DIBCO2013数据测试表明本文的方法能够较好的处理细长弱笔画的二值化问题。(本文来源于《计算机仿真》期刊2015年09期)

二值文档论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

多数历史文档图像存在背景污渍、涂抹和字迹模糊等对比度较低的情况,从而给历史文档二值化增加了较大难度。前期研究发现,历史文档中文本内容通常与文档背景的亮度水平不同,利用文档背景估计值可以有效削弱退化区域并突出字符信息;根据这两个观点,提出了一种基于对比度归一化的历史文档图像二值化算法。所提出的方法包含叁个步骤:首先采用图像修复算法和Niblack算法结果来粗略估计背景;然后使用文档背景对历史文档图像存在的不同退化类型进行归一化处理,并对归一化处理后的文档图像进行增强、二值化,将文档中的文本分割出来。采用DIBCO数据库和H-DIBCO数据库对所提出的算法进行测试,取得了较好的实验结果。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

二值文档论文参考文献

[1].王鑫睿.历史文档图像二值化算法研究[D].湖北工业大学.2019

[2].冯炎.基于对比度归一化的历史文档图像二值化算法[J].科学技术与工程.2019

[3].完颜勇.基于对比度增强和背景估计的文档图像二值化[J].电子科技.2018

[4].林凯.文档图像自适应二值化与字符识别[D].哈尔滨理工大学.2018

[5].熊炜,徐晶晶,赵诗云,王改华,刘敏.基于支持向量机的低质量文档图像二值化[J].计算机应用与软件.2018

[6].徐晶晶.低质量文档图像的二值化算法研究[D].湖北工业大学.2017

[7].熊炜,赵诗云,徐晶晶,赵楠.低质量文档图像二值化算法研究[J].计算机应用与软件.2016

[8].赵诗云.低质量文档图像二值化算法研究[D].湖北工业大学.2016

[9].曾凡锋,王战东,郭正东.非均匀光照文档图像快速二值化方法[J].计算机应用与软件.2015

[10].梁添才,刘建平,罗攀峰.一种改进拉普拉斯能量的文档图像二值化方法[J].计算机仿真.2015

标签:;  ;  ;  ;  

二值文档论文-王鑫睿
下载Doc文档

猜你喜欢