导读:本文包含了版面分割论文开题报告文献综述及选题提纲参考文献,主要关键词:藏文历史文献,文本提取,版面分析,块投影
版面分割论文文献综述
张西群[1](2018)在《面向藏文历史文献的版面分割方法研究》一文中研究指出近年来,随着人们对传统历史文化的保护和传承工作越来越重视,研究人员对历史文献数字化研究投入的精力也越来越多。藏族是一个拥有丰富传统文化的民族,是五千年中华文明不可或缺的重要组成部分;藏文历史文献是传统藏族文化宝库中一颗璀璨的明珠,其作为承载藏族古老文明的载体,受到了历史学家、语言学家、佛学家等的广泛关注。采用数字化技术对现有藏文历史文献中的文本部分进行提取、识别并转化为数字形式存储,对藏族历史文化的研究、保护和传承具有非常重要的意义。版面分割是历史文献数字化过程中重要的基础步骤,为了探索适合藏文历史文献的版面分割方法,本文的主要研究工作如下:首先,本文回顾了国内外版面分割的研究现状和发展趋势,分析适用于不同文献版面的分割方法特点,寻找适合藏文历史文献的版面分割方法。通过对之前研究者针对不同特点的文献版面所提出方法的总结,本文学习到了研究者在对不同类型的版面进行版面分割时所采用的策略。其次,本文研究发现藏文历史文献图像的文本区域相较其他区域角点密度比较大,并尝试将其与连通区域分析相结合,进行藏文历史文献文本区域提取,为了研究角点密度和连通区域分析结合的方法,本文提出了一种基于块投影的藏文历史文献文本提取方法。通过结合连通区域分类信息和角点密度信息,对均分的藏文历史文献的图像块进行过滤;分析过滤后图像块的投影,可以获取文本区域的近似边缘位置;结合文本区域的近似边缘位置和文本区域边缘搜索策略可以搜索得到文本区域的近似边缘;最后为了矫正由于字符粘连等造成的文本区域边缘不规则,通过矫正策略对文本区域边缘点进行坐标矫正。在藏文历史文献数据集上的实验表明,本方法能够比较有效的从藏文历史文献中提取出较规则、完整的文本区域。最后,本文构建了一个卷积降噪自编码器框架,并提出了一种基于卷积降噪自编码器的藏文历史文献版面分析方法。本方法首先对原图像进行超像素聚类,将原图像中具有相似性的局部像素点聚类成一个超像素块;通过卷积降噪自编码器对超像素块进行特征提取;然后利用SVM分类器对超像素块进行分类。实验表明,本方法能够对藏文历史文献图像中属于不同版面元素的超像素块进行有效的分类。(本文来源于《北京工业大学》期刊2018-06-01)
曾凡锋,许博臣[2](2018)在《基于SVM的复杂版面分割方法》一文中研究指出对文本图像的灰度、纹理、相位一致性等关键特征进行了较为全面的分析,研究出版面中文字、图像等区域在各种特征层面上的差异。针对具有复杂版面的图像,选取图像的纹理特征和相位一致性统计特征,借助SVM对图像进行版面分割。该方法提取出的特征向量可以有效地区分图像中各类不同的区域。比传统的版面分割方法更为有效,具有较强的应用价值。(本文来源于《电子技术与软件工程》期刊2018年10期)
王莉丽,陈晔,刘玲[3](2017)在《基于投影轮廓分析的文本图像版面分割算法研究》一文中研究指出本文提出了一种新的基于投影轮廓分析的版面有效分类;随后详细介绍了该方法的实现技术流程,给出了该方法进行版面分析所依据7个特征的含义及作用。实验结果表明:提出的新方法,能够对复杂版面文本图像进行有效的版面分割及区域类型分类,并能够准确的识别如页眉这样的特殊区域,版面分析结果准确。(本文来源于《数字技术与应用》期刊2017年03期)
戴素素[4](2016)在《论报纸版面编排的空间分割艺术》一文中研究指出网格系统空间分割艺术的应用,为报纸版面编排技术水平的提升创造了良好的条件,不仅能够协调版面各个元素之间的比例、布局,向读者展示和谐、统一的内容布局,更有利于通过视觉审美艺术水平的提升为报纸媒体的发展提供更大的空间。(本文来源于《新闻战线》期刊2016年10期)
魏传义,陈勤,张旻[5](2016)在《基于投影的文本图像版面分割算法研究》一文中研究指出版面分割算法是版面分析的重要组成部分,考虑自顶向下方法的效率优势以及所处理对象的特殊性,提出一种分列投影版面分割算法。该算法首先将文本图像进行列分区,划分为若干个列,然后对每一列进行投影扫描,通过多次投影将文本图像分割成若干个子区域。实验结果表明,该方法继承投影法本身计算速度快的特点,同时还可以避免图像信息弧度对版面分割的影响,并且对版面较复杂的文本图像也能够准确地分割。(本文来源于《现代计算机(专业版)》期刊2016年10期)
蔺兰,张汝波,赵戈,刘冠群[6](2015)在《基于稀疏度差异的快速版面分割方法》一文中研究指出为简化版面分割方法、提高检测效率,提出了一种基于稀疏度差异的快速版面分割方法.将稀疏度作为版面区域的特征描述,根据内容及背景区域间稀疏度的差异进行均值分类,得出各区域的类别标签,实现版面分割.在复杂版面图集上得到74.1%的识别率和1.61s的平均计算时间,表明方法有效且快速,较改进的基于连通域的版面分割方法,过程简单,计算简便,具有更好的适用性.(本文来源于《华中科技大学学报(自然科学版)》期刊2015年S1期)
于明,郭佥,王栋壮,于洋[7](2013)在《改进的基于连通域的版面分割方法》一文中研究指出版面分割是版面分析的重要组成部分,经过大量的研究,如今已到了一个比较成熟的阶段。对基于连通域的版面分割算法进行了改进,能有效快速地分割较为复杂的版面图像,同时有效减少原有算法中阈值引起的分割错误的情况。先对文本图像进行单个字体的区域扩充,使后续的连通间距统计更为准确和方便,再通过连通间距的统计对图像进行模糊整合,进行文本图像的连通区域分割。实验结果表明,改进的基于连通域的算法分割版面准确,速度快,适用范围广,对于较为复杂的版面分割更具有优越性。(本文来源于《计算机工程与应用》期刊2013年17期)
付芦静,钱军浩,钟云飞[8](2015)在《基于汉字连通分量的印刷图像版面分割方法》一文中研究指出针对彩色印刷图像背景色彩丰富和汉字存在多个连通分量,连通域文字分割算法不能精确提取文字,提出基于汉字连通分量的彩色印刷图像版面分割方法。利用金字塔变换逆半调算法对图像进行预处理,通过颜色采样和均值偏移分割图像颜色,标记文字连通分量,根据汉字结构和连通分量特性重建汉字连通分量,分析文字连通分量连接关系确定文字排列方向实现文字分割。实验结果表明,该方法能够有效地重建汉字连通分量,在彩色印刷图像中实现对不同字体、字号、颜色的文字分割。(本文来源于《计算机工程与应用》期刊2015年05期)
刘妍妍[9](2013)在《版面分析中图文分割方法研究及应用》一文中研究指出OCR技术是指将纸质印刷文字转换成文本图像,进而识别成可编辑的数字化信息。对于图文混排的版面,在OCR识别前需要对图像进行版面分析。版面分析的任务就是把文本图像按类型分割成不同的区域,标定区域的属性(类型:文本、表格、图像,以及位置等信息),并确定文本域的先后顺序。版面分析是OCR和文档重构的前提,版面分析结果的准确性,直接影响文档识别和复原的效果。目前对图文混排的中文复杂版面的分析仍存在图文分割不准确问题,需要进一步改进和优化。图文混排版面分析中主要问题有:(1)对文本页面中嵌入的不规则图像,易出现文字被分割到图像区域,导致识别后文字信息丢失。(2)页眉页脚在识别后干扰正文内容的逻辑与完整性。本课题对现有版面分析方法,特别是图文分割算法和页眉页脚判别方法进行了深入研究,针对上述问题提出了解决方法,应用于视障者阅读辅助器具。其研究成果有:(1)基于邻域分析的图文分割方法针对图像域中的文字,采用基于邻域的分析方法利用邻域的文字信息去探测图像域中的文字,按行(列)分割文字,实现图与文的分割,然后调整文本域。实验结果表明本文图文分割方法能正确把一般的不规则图像与所在矩形区域的文字分割开。(2)基于分割线和区域特征的页眉页脚判别方法针对页眉页脚与主体部分的判别,采用了基于分割线和区域特征的方法进行判别。实验结果表明该算法具有一定的有效性和通用性。本课题来源于国家“十一五”科技支撑计划重点项目-“视障者阅读辅助器具的研制”(2009BAI71B02)。该项目的主要目标是研制一款基于文字识别的有声电子阅读产品,通过拍照方式获取印刷文字信息,采用OCR和语音合成技术,将印刷文字转换为语音后输出。借助该产品,盲人可阅读纸质书籍杂志等。版面分析作为其中文字识别功能中必不可少的技术环节,提高版面分析处理能力,将页眉页脚与主体部分加以分离、图像与文字正确分离对提高文字识别率和文字内容的逻辑完整性具有重要意义。(本文来源于《北方工业大学》期刊2013-06-30)
刘丽晖,费向东[10](2013)在《西夏文献图像版面分割与分类算法研究与实现》一文中研究指出随着世界上西夏学研究的兴起,西夏文献作为西夏文物的重要组成部分越来越受到重视。本文介绍了西夏古籍文献的研究意义、图像处理、分割以及分类等问题。对比分析了西夏文字图像预处理的方法,设计实现了西夏文字图像版面的分割的算法,并分析了采用模版匹配的方式对分割后图像按一定特征分类的算法。分割后的西夏文字更易于辨认研究,且有利于计算机自动进行识别和理解图像,对西夏学的研究有着重要的意义。(本文来源于《计算机光盘软件与应用》期刊2013年04期)
版面分割论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
对文本图像的灰度、纹理、相位一致性等关键特征进行了较为全面的分析,研究出版面中文字、图像等区域在各种特征层面上的差异。针对具有复杂版面的图像,选取图像的纹理特征和相位一致性统计特征,借助SVM对图像进行版面分割。该方法提取出的特征向量可以有效地区分图像中各类不同的区域。比传统的版面分割方法更为有效,具有较强的应用价值。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
版面分割论文参考文献
[1].张西群.面向藏文历史文献的版面分割方法研究[D].北京工业大学.2018
[2].曾凡锋,许博臣.基于SVM的复杂版面分割方法[J].电子技术与软件工程.2018
[3].王莉丽,陈晔,刘玲.基于投影轮廓分析的文本图像版面分割算法研究[J].数字技术与应用.2017
[4].戴素素.论报纸版面编排的空间分割艺术[J].新闻战线.2016
[5].魏传义,陈勤,张旻.基于投影的文本图像版面分割算法研究[J].现代计算机(专业版).2016
[6].蔺兰,张汝波,赵戈,刘冠群.基于稀疏度差异的快速版面分割方法[J].华中科技大学学报(自然科学版).2015
[7].于明,郭佥,王栋壮,于洋.改进的基于连通域的版面分割方法[J].计算机工程与应用.2013
[8].付芦静,钱军浩,钟云飞.基于汉字连通分量的印刷图像版面分割方法[J].计算机工程与应用.2015
[9].刘妍妍.版面分析中图文分割方法研究及应用[D].北方工业大学.2013
[10].刘丽晖,费向东.西夏文献图像版面分割与分类算法研究与实现[J].计算机光盘软件与应用.2013