印刷体数学公式识别论文-伞童威

印刷体数学公式识别论文-伞童威

导读:本文包含了印刷体数学公式识别论文开题报告文献综述及选题提纲参考文献,主要关键词:公式识别,粘连符号,公式切分,卷积神经网络

印刷体数学公式识别论文文献综述

伞童威[1](2017)在《印刷体数学公式识别关键问题研究》一文中研究指出印刷体数学公式识别是指将以图像方式输入的数学公式转化为可编辑的符号,从而实现公式的重用。目前,主流的OCR系统对普通文本的识别已达到较高水平,但在数学公式的识别方面还不理想,其中由于数学公式复杂的二维结构所导致的多种符号粘连以及数学符号种类、字体、大小的多样性是影响识别率的主要因素,需要更为有效的粘连符号切分和识别方法,从而提高数学公式整体的识别质量。论文首先对印刷体数学公式识别系统的构成及关键技术、识别中的难点进行介绍和讨论。其次,对数学公式粘连符号的切分方法进行了深入研究。针对普遍存在也更为复杂的斜体粘连问题,提出了基于优选路径评估的切分算法。该方法首先找到可能的粘连位置,利用特征因子对可能的粘连处切分线进行两步综合评估,选出性能良好的切分线,再针对不同粘连方向构建相应的组合折线切分路径,完成最终的图像切分。该方法提高了切分路径预测的准确性,有效地避免了切分对正常笔画的破坏。此外,应用深度学习理论中的卷积神经网络模型进行公式符号的识别,构建了识别公式字符的卷积神经网络,并通过实验优化网络参数。该卷积神经网络具有2个交替的卷积层与采样层,卷积层与采样窗口大小分别为5×5和2×2大小,选择线性矫正单元作为激活函数,并在网络的连接中使用了Dropout连接方式。通过大量的学习训练实现数学符号模式特征的自动提取并分类,从而解决现存方法中人工提取特征的不足,提高数学公式符号识别的准确性。为了验证方法的有效性,本文在Visual Studio 2010环境下,使用C++语言并结合OpenCV技术编程实现了基于优选评估的切分算法,用Keras框架搭建了面向公式识别的卷积神经网络。通过实验对比,本文所提出的切分方法准确率可达到90.14%,水平粘连符号切分准确率可达到85.60%。在识别测试中,神经网络对普通的公式字符集进行识别,识别率为97.46%,对经过切分处理前后的公式字符集进行识别,识别率分别为88.24%和97.29%。(本文来源于《沈阳工业大学》期刊2017-05-18)

张自强[2](2016)在《印刷体文档中的数学公式识别算法的研究》一文中研究指出随着计算机的普及和互联网技术的快速发展,通过计算机网络传播和交换科技信息的方式越来越受到人们的青睐。因此,将一些书籍和文献资料转化成电子格式变的迫切需要。目前OCR技术发展已经成熟,它已经可以高效地识别文档图像中的汉字、英文字符和数字,完成大部分科技资料的电子化,但是对一些数学公式的识别结果却不尽如人意。而且正确地分析与识别数学公式,不仅需要正确的切分和识别单个字符,而且需要准确地分析数学公式的整体结构。由于数学公式结构复杂多样且大多以二维结构的形式存在,这些公式的自身特点给确定字符与字符之间的逻辑关系带来很大困难,因此公式识别也变的更具挑战性。论文完成的工作主要包括:(1)公式定位提取。在文档中数学公式主要有嵌入型和独立型两种存在形式。为了提高定位准确度本文采用两次定位,采用基于字符宽度中心矩的公式定位算法进行第一次定位,由于该方法对于内嵌型公式的定位效果不理想,所以采用了基于汉字拒识的内嵌公式定位方法进行了二次定位。(2)公式字符切分。公式字符切分的目的是把公式切分成一个个独立的字符,在此部分中混合采用了投影分割法和连通域分割法,二者取长补短、相互配合达到公式字符切分的目的。(3)字符识别。采用传统的模板匹配方法对每一个字符进行识别,在此部分中主要完成了特征提取、建立字符模板库和模板匹配等处理。(4)公式结构分析与表示。采用了基于特征字符的方法对公式进行结构分析,确定公式字符间的语法关系,最终利用Word EQ域作为公式描述工具将公式转化成文本格式。(本文来源于《安徽工业大学》期刊2016-05-18)

王琪辉[3](2016)在《基于深度学习的印刷体数学公式符号识别方法研究》一文中研究指出印刷体数学公式识别是光学字符识别领域中的一个重要研究课题,目的是将以图像方式输入的印刷体数学公式转化为可编辑的符号,实现公式的重用。由于数学公式结构复杂,数学符号种类繁多且字体多样、大小不一,目前其识别效果并不理想,需要更为有效的识别方法。本文将深度学习中的卷积神经网络理论应用到数学符号识别中,旨在克服传统符号识别方法中手工提取特征的不足,通过构建具有多个隐含层的深度网络模型并使用大量的训练数据来学习得到更有用的特征,进而提升公式符号分类的准确性。本文对数学公式识别的关键技术、研究现状以及卷积神经网络的理论进行了研究,在此基础上建立了面向公式符号识别的卷积神经网络结构,并通过大量的对比实验确定网络的最优参数。该网络由一个输入层、输出层、两个卷积层和采样层交替组成,输入层直接对应经公式定位及分割处理后的公式符号图像,采用5×5大小的卷积核对符号图像进行特征抽取。执行卷积时,将传统的Sigmoid和双曲正切激活函数替换为更接近生物神经的ReLU激活函数,以提高模型训练的收敛速度,并解决梯度消失问题。对提取到的卷积特征图采用2×2的最大池化方式进行采样,从而在降低特征维数、保留特征的同时,减少参数计算量,这种卷积与采样相结合的方式使特征具有一定的旋转不变性。输出层采用Dropout连接方式减轻了网络的过拟合程度并提高泛化能力。此外,针对卷积神经网络训练速度慢的问题,本文采用基于CUDA的GPU编程方法,实现了对训练速度的大幅度提升。为验证所提出算法的有效性,本文应用VS2010设计并实现了一个印刷体数学公式识别系统。以包含公式的文档图像作为系统的输入,经过版面校正处理、公式图像预处理、公式符号识别和公式结构分析,最后将结果输出。通过大量的实验和对比,本文所提出方法的公式符号的平均识别率可以达到99%,高于现有识别方法,可以满足实际应用的需要。(本文来源于《沈阳工业大学》期刊2016-02-27)

白士御[4](2015)在《基于SVM的印刷体数学公式识别方法研究与系统设计》一文中研究指出光学字符识别(OCR)是近年来广泛应用于银行、邮电、物流等领域的一种识别技术,目的是将以图像方式输入的印刷体或手写体字符转化为可编辑的符号。目前,对印刷体文档中的中英文以及阿拉伯数字的识别已达到较高水平,但由于数学公式符号的种类多,变化大,结构复杂,实现正确、快速的识别比较困难,需要探索更有效的识别方法。本文针对印刷体数学公式识别中的几个关键问题展开研究,重点解决倾斜图像的快速与准确校正、粘连符号的有效分割和基于SVM的多层分类器的符号识别问题。为了提高版面倾角检测的效率和精度,提出了一种基于连通域分析和Hough变换的倾斜校正方法,通过连通域分析预估倾角,以较长的连通域为依据划分出文本区域,结合经边缘检测处理后的版面区域,以不同角度步长分别进行Hough变换,得到最终精确的倾角。同时,通过凹凸轮廓和分割因子确定待分割位置,进而对分割后的符号进行识别验证。由于公式符号众多,为了有效地降低分类器的负担并提高分类的准确性,对公式符号的特征进行详细筛选和分类,并以此为基础构造了粗、细分类相结合多层分类器。在细分类时,利用一对多的方法改进了传统DAG-SVM训练模型中的一对一方法,提高了分类器的训练效率,并利用类间可分性对DAG-SVM中的节点进行重新组合,降低了误差累积对识别所造成的影响。实验和分析表明,所提出的算法能够高效检测出版面的倾角,实现准确的粘连字符分割,完成有效的公式符号识别。基于上述方法,本文应用VC++设计并实现了一个印刷体数学公式识别系统。以包含公式的文档图像作为系统的输入,经过版面分析、公式图像预处理、公式符号识别和公式结构分析,将其以Latex的格式输出。通过对识别结果的分析,使用本文所提出的改进的SVM分类器对数学符号进行识别,可以达到94.7%的识别率,要高于现有的SVM分类器的识别率。(本文来源于《沈阳工业大学》期刊2015-03-01)

宗亚辉,李双庆[5](2015)在《印刷体数学公式的结构分析与识别》一文中研究指出针对印刷体数学公式中的结构分析,提出将"自下而上"和"自上而下"相结合的策略。自上而下是针对特殊结构的分析,特殊结构包括根号、矩阵、上下标等。自上而下是对公式整体结构的分析,并且用递归的方式对各个子表达式采用同样的分析方法。结构分析成功后,用树形结构表示整个公式的二维空间布局。实验结果表明,此种分析策略有效地提高了印刷体数学公式的结构分析成功率。(本文来源于《计算机工程与应用》期刊2015年09期)

喻志强[6](2012)在《印刷体数学公式识别的研究与实现》一文中研究指出目前,OCR技术逐步发展成熟,可以快速、准确地使大部分书籍资料电子化。虽然OCR技术对文字和数字的识别效果很好,但对数学公式的识别效果并不理想,原因在于数学公式有复杂的二维结构,字符之间的逻辑关系种类多样。正确的识别数学公式不仅对单个数学符号进行正确的分割和识别,同时还要求对公式结构进行准确的分析。本文设计了一个数学公式识别系统,实现了对印刷体数学公式的识别功能。系统以图片形式输入,经过图像预处理、字符分割、字符识别和结构分析等处理操作后,将其转化为以Txt格式的文本形式输出。字符分割部分使用了循环的投影分割法与连通域分割法相结合的方法,先利用垂直与水平投影法循环投影将公式切分为子字符块,再利用连通域法把投影法无法分割开的字符块分割开,这种混合分割的方法比起使用单一的方法效果要好。对字符粘连部分提出了基于矩形框的分割方法,利用字符库中字符的宽和高对粘连字符进行切分,切分后有验证步骤,进而降低了分割错误的概率。在结构分析部分提出了字符块编码与构建分叉树相结合的分析方法,该方法在公式分割时就将字符块按垂直和水平分割法分开时进行了有序的编码,为结构分析奠定了基础。在结构分析阶段利用编码与分叉树对公式的各个字符块进行分析重构。本文在对数学表达式识别各阶段所使用的各种方法进行总结分析的同时,对使用到的方法编程实现,并给出了实验结果。通过实验验证,本文提出的方法可以有效的分割和识别出单个字符和粘连字符,经过识别和结构分析,最终以文本形式输出。(本文来源于《沈阳工业大学》期刊2012-01-14)

卢晓卫[7](2009)在《印刷体数学公式识别系统的研究与实现》一文中研究指出书籍是人类文明的载体,是人类社会进步和发展的重要媒介。随着信息和通信技术的迅速发展,以及互联网的广泛普及,电子形式的书籍和文献资料已经成为重要信息载体,信息资源尤其是包含大量数学公式的科技文献的电子化成为了一项重要的工作。如今,OCR技术逐步发展成熟,可以快速、高效地完成大部分书籍资料的电子化。虽然OCR技术对中英文字和数字等都有很好的识别效果,但其在数学公式的识别方面效果并不理想。其原因在于数学表达式具有复杂的二维结构,字符之间的逻辑关系复杂多样,难以界定。正确的数学公式识别不但要求对单个数学符号进行正确的分割和识别,同时还要求对公式结构进行准确的分析。本文设计了一个数学公式识别系统,实现了对印刷体数学公式的识别。系统的输入为以图片形式存在的数学公式,经过图像预处理、字符分割、字符识别和结构分析等处理过程后,将其转化为以Latex语言表示的文本输出。论文所完成的主要工作包括:1,图像预处理。公式图像中存在噪声干扰和数据冗余,为了达到后端处理要求,需要先对其进行滤波、二值化、细化等预处理操作。2,公式字符识别。主要包括字符分割和字符识别两部分。前一部分从公式图像中提取出单个字符及其空间坐标信息,在此部分中联合采用了投影分割法和连通域分割法;后一部分通过模板匹配方法对每一个字符进行识别,在此部分中提出了一种基于辐射线交点数的特征提取方法。3,公式结构分析。在字符分割和识别的基础上,确定字符之间的空间关系,进而得到对公式整体结构的描述。在此部分中提出了一种分块树结构分析方法,该方法首先对待处理公式进行分类,将其划分为若干种类型的子模块,再对每一个子模块进行处理。该方法具有很强的可扩展性,对嵌套类型的公式具有较好的处理效果。4,数学公式的显示。利用Latex语言对字符识别和结构分析的结果进行描述,得到文本形式的公式,完成数学公式识别的全过程。(本文来源于《国防科学技术大学》期刊2009-11-01)

陈峰,郑春光[8](2009)在《印刷体文档中的数学公式识别方法综述》一文中研究指出数学公式识别是将中文电子文档中包含的数学公式识别出来的方法。印刷体文档中的数学公式识别是由预处理,数学公式的抽取分割定位和结构分析识别3部分组成。主要介绍了目前数学公式识别的研究现状,并对已提出的各种成熟识别方法进行总结。(本文来源于《信息技术》期刊2009年03期)

陈德裕,朱学芳,苏啸晨,杭月芹[9](2009)在《印刷体文献中数学公式识别及描述系统研究》一文中研究指出印刷体数学公式识别系统的建立,需要对数学公式结构本身及其字符识别方法和识别后的描述方法进行研究。为此建立了数学公式识别及描述实验系统,实现了部分数学公式的结构本身及其字符的识别,能完成从图像到文本的转换,对识别的结果能用数学建模语言进行有效表示。(本文来源于《计算机应用》期刊2009年03期)

陈峰[10](2009)在《印刷体文档中的数学公式识别技术研究》一文中研究指出伴随着计算机技术的不断发展,信息资源的电子化成为至关重要的问题。数学公式是许多科技文献的重要组成部分,由于手工输入困难,自动输入技术的研究尤为重要。现有的OCR(Optical Character Recognition)技术虽然对中英文字符和数字等符号都能获得较好的识别效果,但是无法正确处理数学公式。其原因在于数学公式具有复杂的二维嵌套结构,并且公式符号含义具有多样性,这使得数学公式在识别和结构分析方面存在很多困难。因此,数学公式识别已经成为OCR领域的一个研究热点。本课题研究的是印刷体文档中的数学公式识别问题。印刷体文档中数学公式识别系统主要包括叁个组成部分:公式提取,公式识别和公式结构分析重构。由于字符识别技术相对成熟,本文的主要工作是数学公式的提取和公式的分析与重构。本文对公式提取和公式的分析与重构做了较深入的研究,主要从以下的两个方面进行了改进。首先在公式提取阶段结合数学公式自身的特征,提出了一种基于模糊C-均值算法的印刷体数学公式提取方法。模糊C-均值算法利用数学公式行与一般的文本文字行的行间距、宽高比、行密度的不同,将数学公式行提取出来。通过这种方法可以有效的提高提取数学公式的识别率,改善字符分割的质量,在试验中采用该提取算法取得了较好的效果。其次在公式的分析与重构阶段,利用基准线找到中心点在同一阈值内的字符,根据各个字符之间的位置关系,放在不同的子节点中,构建出初始结构树;然后利用语法和语义知识将结构树转化成以运算符为子节点,操作数为叶子节点的树,最终得到输出结果。(本文来源于《哈尔滨理工大学》期刊2009-03-01)

印刷体数学公式识别论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

随着计算机的普及和互联网技术的快速发展,通过计算机网络传播和交换科技信息的方式越来越受到人们的青睐。因此,将一些书籍和文献资料转化成电子格式变的迫切需要。目前OCR技术发展已经成熟,它已经可以高效地识别文档图像中的汉字、英文字符和数字,完成大部分科技资料的电子化,但是对一些数学公式的识别结果却不尽如人意。而且正确地分析与识别数学公式,不仅需要正确的切分和识别单个字符,而且需要准确地分析数学公式的整体结构。由于数学公式结构复杂多样且大多以二维结构的形式存在,这些公式的自身特点给确定字符与字符之间的逻辑关系带来很大困难,因此公式识别也变的更具挑战性。论文完成的工作主要包括:(1)公式定位提取。在文档中数学公式主要有嵌入型和独立型两种存在形式。为了提高定位准确度本文采用两次定位,采用基于字符宽度中心矩的公式定位算法进行第一次定位,由于该方法对于内嵌型公式的定位效果不理想,所以采用了基于汉字拒识的内嵌公式定位方法进行了二次定位。(2)公式字符切分。公式字符切分的目的是把公式切分成一个个独立的字符,在此部分中混合采用了投影分割法和连通域分割法,二者取长补短、相互配合达到公式字符切分的目的。(3)字符识别。采用传统的模板匹配方法对每一个字符进行识别,在此部分中主要完成了特征提取、建立字符模板库和模板匹配等处理。(4)公式结构分析与表示。采用了基于特征字符的方法对公式进行结构分析,确定公式字符间的语法关系,最终利用Word EQ域作为公式描述工具将公式转化成文本格式。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

印刷体数学公式识别论文参考文献

[1].伞童威.印刷体数学公式识别关键问题研究[D].沈阳工业大学.2017

[2].张自强.印刷体文档中的数学公式识别算法的研究[D].安徽工业大学.2016

[3].王琪辉.基于深度学习的印刷体数学公式符号识别方法研究[D].沈阳工业大学.2016

[4].白士御.基于SVM的印刷体数学公式识别方法研究与系统设计[D].沈阳工业大学.2015

[5].宗亚辉,李双庆.印刷体数学公式的结构分析与识别[J].计算机工程与应用.2015

[6].喻志强.印刷体数学公式识别的研究与实现[D].沈阳工业大学.2012

[7].卢晓卫.印刷体数学公式识别系统的研究与实现[D].国防科学技术大学.2009

[8].陈峰,郑春光.印刷体文档中的数学公式识别方法综述[J].信息技术.2009

[9].陈德裕,朱学芳,苏啸晨,杭月芹.印刷体文献中数学公式识别及描述系统研究[J].计算机应用.2009

[10].陈峰.印刷体文档中的数学公式识别技术研究[D].哈尔滨理工大学.2009

标签:;  ;  ;  ;  

印刷体数学公式识别论文-伞童威
下载Doc文档

猜你喜欢