导读:本文包含了蒙古文字识别论文开题报告文献综述及选题提纲参考文献,主要关键词:蒙古文字识别,Hadoop,MapReduce编程,卷积神经网络
蒙古文字识别论文文献综述
姚志鹏[1](2016)在《基于Hadoop平台的印刷体蒙古文字识别系统的研究与实现》一文中研究指出印刷体蒙古文字识别是蒙古文字识别的一个重要部分,随着内蒙古地区蒙古族文化的发展,产生了大量的蒙古文文献资料。将纸质文献资料手工录入到计算机会浪费大量的人力物力,而且在录入过程中极可能出现人为错误。因此,蒙古文字识别技术应运而生,蒙古文字识别技术实现了蒙古文文本图像向可编辑蒙古文文本的自动转换。但是,二十一世纪是一个信息爆炸的时代,现有的蒙古文字识别算法在效率上已经不能满足应用的需求。因此,本文重点解决了将蒙古文字识别算法并行化的问题。Hadoop原本来自于Google一款名为MapReduce的编程模型。Google的MapReduce框架可以将一个应用程序分解为若干并行计算指令,通过大量的计算节点运行海量的数据集。MapReduce编程框架主要包含两部分:Map部分和Reduce部分,其中Map部分用于将输入数据切分成若干小的数据块进行计算;Reduce部分用于获取Map部分计算产生的小数据块,经过汇总后输出结果。随着大数据和深度学习的发展,本文对当前热门的大数据处理技术Hadoop和卷积神经网络深度学习算法做了深入的分析和研究后,结合现有蒙古文字串行识别算法存在的问题,提出使用MapReduce编程框架来实现并行蒙古文字识别算法。Map部分将识别任务分配给集群中各个节点,Reduce部分将各个节点上的识别结果进行汇总。卷积神经网络对图像中内容有丰富的表达能力,可以自适应的提取蒙古文字字元图像特征。本文设计实现了完整的蒙古文字识别系统,该系统主要包括两个部分,一部分是用户提交识别作业界面;另一部分是搭建在Linux系统上的并行蒙古文字识别算法的MapReduce程序,这种设计结构使得程序易于维护、便于扩展。本文通过一系列实验来测试并行蒙古文字识别算法在蒙古文字元识别方面的高准确性和执行效率的高效性,平均识别正确率达到92.03%,在叁万字的数据规模下蒙古文字识别平均耗时为0.161秒/个。通过实验对比了并行蒙古文字识别算法与现有蒙古文字识别算法在大规模数据下的表现,证明了并行蒙古文识别算法的可行性、高效性。(本文来源于《内蒙古大学》期刊2016-05-30)
春花[2](2014)在《印刷体蒙古文文字识别的研究》一文中研究指出本文重点介绍了印刷体蒙古文的结构特征、印刷体蒙古文的切分方法.特征选择种类繁多,从大量模糊特征中选择出有效特征进行分类,再对印刷体蒙古文的切分方法(行切分、字元切分)进行了详细的说明.(本文来源于《内蒙古民族大学学报(自然科学版)》期刊2014年06期)
白文荣,寿震坤[3](2012)在《蒙古文字识别之分类器的设计》一文中研究指出文字识别分为联机手写识别和脱机手写识别,其中联机手写识别是通过数字设备采集手写输入信号,然后根据文字特征加以匹配识别的过程。但是由于手写体笔迹变动非常大,精确识别比较困难。针对这种情况,我们提出一套手写体蒙古文字识别多分类器的设计,依次采用了贝叶斯(Bayes)决策方法、判别函数法,以及HMM模型与最近邻方法等。显着提高了系统的识别率和正确率。(本文来源于《教育教学论坛》期刊2012年20期)
白文荣[4](2009)在《手写体蒙古文字识别——切分技术的研究》一文中研究指出针对蒙古文字连笔的特殊书写特征,本论文主要论述了手写体蒙古文字识别的切分技术。我们依次采用了去除噪声的预处理技术、基于粗分类和细分类特征提取技术,以及结合了蒙古文自身结构特征的切分技术等。基于以上技术,我们开发出一个蒙古文字切分实验系统。实验结果表明,蒙古文单词平均准确切分率达到80%,系统整体性能良好稳定,切分率初步达到实用化水平。(本文来源于《科技经济市场》期刊2009年06期)
白文荣[5](2007)在《联机手写蒙古文字识别技术的研究》一文中研究指出蒙古文输入法的研究开始于上世纪八十年代初期,主要集中在键盘输入上,对蒙古文文字识别的研究非常少。针对这种情况,我们提出研制一套手写体蒙古文字识别系统,为蒙古文提供了一种快速、高效、智能的输入方式。联机手写识别的根本任务是通过数字设备采集手写输入信号,从中提取输入特征,再与特征库加以匹配识别的过程。但是由于手写体笔迹变动非常大,精确识别比较困难。特别是连笔字的识别,由于字母切分的困难使得识别难度大增。近年来,随着个人数字助理(PDA)等便携式移动计算设备的普及,手写输入的应用越来越广泛。现在有很多汉字和英文的联机手写识别产品问世。而蒙古文字作为一种在蒙古族等少数民族地区流行的语言文字,研究它的手写识别方法对促进民族地区的信息与科技发展都是大有裨益的。本论文主要论述了联机手写蒙古文字识别技术。我们依次采用了去除噪声的预处理技术、基于蒙古文自身结构特征的基元切分技术、粗分类和细分类特征提取技术,以及结合了HMM模型与DTW方法的多分类器设计技术等。基于以上技术,我们开发出一个蒙古文字识别实验系统。实验结果表明,受训人员的单词正确识别率达到90%,笔迹受限的单词正确识别率达到83%。系统整体性能良好稳定,识别率初步达到实用化水平。(本文来源于《内蒙古大学》期刊2007-05-10)
魏宏喜,高光来[6](2006)在《印刷体蒙古文字识别中蒙古文字特征的选择》一文中研究指出从文字识别的角度出发,依据印刷体蒙古文字的特点,选择笔划轮廓结构特征、笔划穿越特征、关键特征点、蒙古文构词法等作为蒙古文字的特征,并以这些特征来设计分类器.该分类器已经被成功地用于印刷体蒙古文字识别软件中,取得了较高的识别率,从而证明了选取这些特征是合理的、有效的.(本文来源于《内蒙古大学学报(自然科学版)》期刊2006年06期)
魏宏喜[7](2006)在《印刷体蒙古文字识别中关键技术的研究》一文中研究指出蒙文输入法的研究开始于上世纪八十年代初期,主要集中在键盘输入上,对蒙文文字识别的研究非常少。针对这种情况,我们提出研制一套多字体印刷蒙文识别系统,为蒙文提供了一种快速、高效、智能的输入方式,这对继承和发展少数民族文化、促进少数民族地区社会进步都具有十分重要的意义。本文在总结前人研究成果的基础上,进行了诸多改进和创新。主要研究内容包括: 1、蒙文文本图像的自动倾斜检测。提出了一种基于最小二乘法的蒙文文本图像的倾斜检测方法:先找到图像中的文字连通域,然后依据连通域的上下位置进行文字列的合并;对同一列中的每个连通域以它们的质心为参考点,使用最小二乘法进行直线拟合,可以得到倾斜角度。 2、蒙文文本图像的版面分析。提出了一种基于连通域的蒙文文本图像的版面分析方法,它是一种“自底向上”与“自顶向下”相结合的方法,先搜索版面中的连通域,然后依据连通域的大小进行聚类分析,可以得到不同类型的版面元素,最后把文字连通域合并成文字列和文字块。 3、蒙文字母切分方法的研究与实现。提出了一种基于主干线的蒙文字母切分方法,为进行特征提取和特征匹配提供前提条件。 4、蒙古文字特征选择。在充分分析印刷体蒙古文字特点的基础上,找到了适合进行蒙文识别的多个特征,包括:粗分类特征和细分类特征。 实验证明,以上关键技术的实现,使得印刷体蒙古文字识别系统的性能和(本文来源于《内蒙古大学》期刊2006-05-08)
吴伟[8](2005)在《联机手写蒙古文字识别技术的研究与实现》一文中研究指出联机手写识别的根本任务是模式分类,即通过数字设备采集手写输入信号,从中提取输入特征,加以分类识别词典中的文字。但是由于手写体笔迹变动非常大,精确识别比较困难。特别是连笔字的识别,由于字母切分的困难使得识别难度大增。 近年来,随着个人数字助理(PDA)等便携式移动计算设备的普及,手写输入的应用越来越广泛。现在有很多汉字和英文的联机手写识别产品问世。而蒙古文字作为一种在蒙古族等少数民族地区流行的语言文字,研究它的手写识别方法对促进民族地区的信息与科技发展都是大有裨益的。蒙古文字是一种拼音文字,其书写方式在当今世界是非常独特的,与汉文和西文有很大不同。蒙文是从左到右、从上到下竖写,每个词中所有字母连着写,形成一个竖直的主干线,且每一个字母在一个词的词首、词中和词尾所取的字形不一样。这些特点给蒙古文字的识别带来很大的困难。 本论文主要论述了联机手写蒙古文字识别技术。我们采用了基于多种特征的多分类器识别方法,并结合了联机与脱机信息进行字母切分。分类器采用HMM模型和基于DTW匹配距离的最近邻分类方法。基于以上技术,我们开发出一个蒙古文字识别实验系统。实验结果表明,依赖特定人的单词识别率达到95%,笔迹不受限的识别率在83%~92%之间。前10字识别率可达98%以上。系统整体性能良好稳定,识别率初步达到实用化水平。(本文来源于《内蒙古大学》期刊2005-05-10)
李振宏,高光来[9](2003)在《印刷体蒙古文文字识别中常用特征的获取》一文中研究指出蒙古文印刷体识别技术和蒙古文印刷体识别软件的研究与开发对少数民族地区信息化的发展有着很重要的作用。基于这种需求,文中讨论和分析了蒙古文印刷体识别中常用的特征,并且讨论了这些特征的提取方法。文中所述特征已应用于蒙古文印刷体文字识别软件的设计。结果证明这些特征是可行的、高效的,可以应用于识别软件的设计。蒙古文文字识别的研究将会推动少数民族地区信息化的进程。(本文来源于《微机发展》期刊2003年11期)
李振宏,高光来,侯宏旭,李伟[10](2003)在《印刷体蒙古文文字识别的研究》一文中研究指出分析了蒙文文字的结构特征,论述了蒙文印刷体文字识别的原理,提出了从蒙文文字的预处理到特征提取以及模式分类等各处理阶段的实现方法,并且已将这些方法应用于蒙文印刷体文字识别软件的设计中,试验结果表明这些方法是可行的和高效的.(本文来源于《内蒙古大学学报(自然科学版)》期刊2003年04期)
蒙古文字识别论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文重点介绍了印刷体蒙古文的结构特征、印刷体蒙古文的切分方法.特征选择种类繁多,从大量模糊特征中选择出有效特征进行分类,再对印刷体蒙古文的切分方法(行切分、字元切分)进行了详细的说明.
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
蒙古文字识别论文参考文献
[1].姚志鹏.基于Hadoop平台的印刷体蒙古文字识别系统的研究与实现[D].内蒙古大学.2016
[2].春花.印刷体蒙古文文字识别的研究[J].内蒙古民族大学学报(自然科学版).2014
[3].白文荣,寿震坤.蒙古文字识别之分类器的设计[J].教育教学论坛.2012
[4].白文荣.手写体蒙古文字识别——切分技术的研究[J].科技经济市场.2009
[5].白文荣.联机手写蒙古文字识别技术的研究[D].内蒙古大学.2007
[6].魏宏喜,高光来.印刷体蒙古文字识别中蒙古文字特征的选择[J].内蒙古大学学报(自然科学版).2006
[7].魏宏喜.印刷体蒙古文字识别中关键技术的研究[D].内蒙古大学.2006
[8].吴伟.联机手写蒙古文字识别技术的研究与实现[D].内蒙古大学.2005
[9].李振宏,高光来.印刷体蒙古文文字识别中常用特征的获取[J].微机发展.2003
[10].李振宏,高光来,侯宏旭,李伟.印刷体蒙古文文字识别的研究[J].内蒙古大学学报(自然科学版).2003
标签:蒙古文字识别; Hadoop; MapReduce编程; 卷积神经网络;