导读:本文包含了蒙古文编码识别论文开题报告文献综述及选题提纲参考文献,主要关键词:编码识别,蒙古文编码范围,位置关系,拉丁转写
蒙古文编码识别论文文献综述
李倩[1](2014)在《多种蒙古文编码自动识别方法的研究》一文中研究指出随着计算机技术和网络技术的飞速发展,蒙古文信息处理的工作也取得了很大的进步。但是由于蒙古文国际标准编码出台的相对滞后,目前市场上各种软件厂商采取自己的编码标准,使得各种蒙古文资料、网站之间不能兼容,信息不能共享,从而严重影响了蒙古文信息处理工作的发展。因此将不同厂商的蒙古文编码转换为统一的编码标准就成为了一项重要的工作。多种蒙古文编码自动识别工作是在不确定所属编码类型的情况下所做的识别工作,属于编码转换的前期工作,是下一步编码转换工作的基础。本文主要对智能、蒙科立、明安图叁种编码规则做了分析后采用两种方法来做编码识别工作。一种方法是根据蒙古文字母所属范围和在单词不同位置所表示的字型及编码不同来做的识别;另一种方法是采用蒙古文单词转拉丁后分音节而作的蒙古文识别。在具体的研究过程中,本文分别对蒙古文叁种编码所属的编码范围、蒙古文编码的词首、词中、词末及独立形式做了深入研究并做了初步划分。此外还深入研究蒙古文的拉丁转写规则,对叁种编码的蒙古文字母做了拉丁转写工作。本文还对蒙古文的分音节理论做了深入研究,根据分音节的规则,画出了蒙古文单词分音节划分流程图,并用该流程图对叁种蒙古文编码的拉丁形式分别进行了分音节识别工作。(本文来源于《内蒙古大学》期刊2014-05-02)
王睿[2](2008)在《蒙古文网页抓取及编码识别转换研究》一文中研究指出随着Internet技术的发展和广泛应用,人们获取信息的方式也从传统的书本渐渐转移到了网络,造成网络信息飞速增长,网页数量不断增加,人们查找自己真正需要的信息难度也相应增加了。这样就促生了人们对信息查找工具—搜索引擎的需求。通过使用搜索引擎能够使人们比通过传统方式更迅速地找到信息、产品和服务。经过这几年蒙古文信息化建设,蒙古文网页也随之渐渐增多,获取蒙古文信息的范围也渐渐扩大起来,其中要寻找需要的信息的困难也相对增加起来。目前搜索引擎对信息检索起到很大作用,但是蒙古文搜索引擎却一直没有发展起来,其中主要的原因是蒙古文没有统一的编码,并且蒙古文网页编码多样化、(各种编码之间无相互转换规则)无规则、互相间无联系性,所以通过这些编码编辑的网页文本也会是各异的,这也是蒙古文搜索引擎一直没有出现的技术难题之一。然而对于普通用户只关注网页中的内容,并不关心它是使用何种技术、何种编码所制作。因此,我们对于一个未知编码的网页要想正确取得其内容,需要对其做出判断,以确定其是什么编码的网页,然后才能正确识别其内容,所以对蒙古文网页进行抓取、编码识别并转换为统一中间编码成为我们的研究的方向。(本文来源于《内蒙古大学》期刊2008-05-30)
蒙古文编码识别论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着Internet技术的发展和广泛应用,人们获取信息的方式也从传统的书本渐渐转移到了网络,造成网络信息飞速增长,网页数量不断增加,人们查找自己真正需要的信息难度也相应增加了。这样就促生了人们对信息查找工具—搜索引擎的需求。通过使用搜索引擎能够使人们比通过传统方式更迅速地找到信息、产品和服务。经过这几年蒙古文信息化建设,蒙古文网页也随之渐渐增多,获取蒙古文信息的范围也渐渐扩大起来,其中要寻找需要的信息的困难也相对增加起来。目前搜索引擎对信息检索起到很大作用,但是蒙古文搜索引擎却一直没有发展起来,其中主要的原因是蒙古文没有统一的编码,并且蒙古文网页编码多样化、(各种编码之间无相互转换规则)无规则、互相间无联系性,所以通过这些编码编辑的网页文本也会是各异的,这也是蒙古文搜索引擎一直没有出现的技术难题之一。然而对于普通用户只关注网页中的内容,并不关心它是使用何种技术、何种编码所制作。因此,我们对于一个未知编码的网页要想正确取得其内容,需要对其做出判断,以确定其是什么编码的网页,然后才能正确识别其内容,所以对蒙古文网页进行抓取、编码识别并转换为统一中间编码成为我们的研究的方向。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
蒙古文编码识别论文参考文献
[1].李倩.多种蒙古文编码自动识别方法的研究[D].内蒙古大学.2014
[2].王睿.蒙古文网页抓取及编码识别转换研究[D].内蒙古大学.2008