导读:本文包含了文本压缩论文开题报告文献综述及选题提纲参考文献,主要关键词:中文文本,压缩算法,前缀,深度
文本压缩论文文献综述
曾党泉[1](2015)在《基于PDC编码的中文文本压缩算法》一文中研究指出针对中文文本结构的特点以及传统压缩算法对中文文本压缩的不足,提出并实现了一个基于PDC编码的中文文本压缩算法。该算法采用的是字典压缩方式。根据单个汉字在中文文本出现的概率,采用Huffman编码方式进行前缀变长编码;定义由某个汉字为前缀的词组和短语的深度;对具有相同前缀和相同深度的词组和短语进行局部的定长编码,构成一部压缩编码字典。通过对相同文本分别使用该算法和传统的LZW和LZSS编码算法压缩后得到的数据结果对比,压缩率有2.53%~40.48%的提高,表明该压缩算法有较好的压缩效果。(本文来源于《计算机工程与应用》期刊2015年17期)
李康[2](2014)在《基于LZW文本压缩解压器的设计与实现》一文中研究指出本文介绍了LZW的压缩和解压算法,采用C语言实现了一个基于LZW的简单的文本压缩解压器,可以实现文本文件内容的压缩和解压,具有很好的效果。(本文来源于《数字技术与应用》期刊2014年05期)
陈庆辉,陈小松,韩德良[3](2014)在《中文文本压缩的LZW算法》一文中研究指出结合中文文本中的汉字编码方式、大字符集以及重复字串不长叁个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式叁方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19提高了19%且压缩和解压速度与后者相当,其对较长的中文文本的平均压缩比已接近或者超过了压缩软件WinRAR。(本文来源于《计算机工程与应用》期刊2014年03期)
胡顺,覃基笙[4](2012)在《大学英语移动学习系统中的文本压缩技术研究》一文中研究指出为了节约大学英语移动学习系统中的网络开销成本,提出一种适合当前网络传输状况的文本传输算法就变得十分必要。结合当前的无损压缩算法,采取叁重压缩:基于固定字典的文本一次压缩,基于哈弗曼的二次压缩算法,基于编码固定位长算法的叁次压缩。这种算法可有效节约通讯成本,而且在移动客户端可以拥有高效的解压缩效率。(本文来源于《科技通报》期刊2012年06期)
包长明,陈继忠,付萍[5](2012)在《一种Symbian S60数据库应用中的文本压缩方法》一文中研究指出为了提高Symbian S60数据库中文本数据存储的效率,同时使数据库应用具有良好的响应速度,在研究该类数据库的特点和"字典码"压缩算法的基础上,提出通过提取隐含在"字典码"压缩算法压缩的文件中的字典并独立存储和维护,实现对数据库记录级的文本压缩。该方法只有在用户用到数据库记录数据时,相应记录中被压缩的数据才被解压缩,因此数据库的响应速度快,内存占用也更少,开始运行软件时数据库加载也更快。该方法在数据记录短,文本数据量大的数据库应用中更具有优势。(本文来源于《计算机应用与软件》期刊2012年05期)
魏星,张磊,吴义国[6](2011)在《一种基于多模式匹配的文本压缩算法》一文中研究指出基于LZSS算法,提出引入WM多模式匹配思想的压缩算法(WM_LZSS压缩算法),该算法通过一个模式库自动记录在已读入文本中出现过的匹配长度较长的短语,在压缩的过程中预先对文本进行多模式匹配。通过对WM_LZSS算法测试的实验,表明WM_LZSS压缩算法在文本文件压缩应用中压缩比比LZSS算法高,特别适合于对文本相似度高的长文件进行压缩。(本文来源于《现代计算机(专业版)》期刊2011年06期)
边巴旺堆,武强,米玛加措,马元强,桑珠[7](2010)在《基于LZ77算法的藏文文本压缩算法设计与实现》一文中研究指出随着信息量的不断增加,用计算机处理的文本文件越来越大,需要对庞大的藏文文本进行数字化处理,如何节约资源对藏文文本进行高效压缩显得极为重要。项目在LZ77算法基础上结合藏文的特点和当前文本压缩的技术主流完成了关于藏文文本压缩的设计和实现工作,按照藏文特点有效的提高了藏文文本压缩率。这种压缩算法是针对藏文特点的两个子算法和目前主流的LZ77压缩算法合成的。(本文来源于《西藏大学学报(自然科学版)》期刊2010年02期)
常为领,方滨兴,云晓春,王树鹏,余翔湛[8](2010)在《一种支持ANSI编码的中文文本压缩算法》一文中研究指出该文提出了一种高效的中文文本压缩算法CRecode,算法根据中文文本中字词的概率分布特点,对中文字词根据其使用频率,采用8bit、16bit和24bit叁种长度的编码重新编码,克服了Huffman编码在压缩中文数据时打乱数据中蕴含的语义信息,致使其压缩数据再压缩性差的缺点。测试中,CRecode在与现有主流压缩软件联合使用时,可提高压缩率4%到30%,最大平均压缩比可达2.86。CRecode作为独立压缩算法,压缩中文文本时可获得优于Huffman编码、接近于LZ系列算法的性能。(本文来源于《中文信息学报》期刊2010年05期)
陈国香,张世伟,宫玉晓[9](2009)在《文本压缩的实现原理及方法》一文中研究指出无论是在存储设备中存储文件,还是用因特网传输文件,经常会用到一些压缩算法来节省空间,提高传输速度。文中利用聚焦最有效的压缩算法Huffman编码,并用Java来实现这个过程。(本文来源于《电脑编程技巧与维护》期刊2009年16期)
李彦军,苏红旗,杨峰,李述迪,姚书科[10](2009)在《基于BWT的文本压缩算法研究》一文中研究指出为了理解高效的文本压缩算法,探究文本压缩的原理和意义,对基于BWT的字符串轮转理论进行了深入的理解;游程编码作为一种简单有效的压缩方式,在数据压缩中有十分广泛的应用,文本压缩的研究对于多媒体的压缩研究有着十分重要的意义。把BWT结合游程编码对选定的文本信息进行了压缩比较,实验证明了该算法的高效性和实用性。同时对基于BWT压缩算法的发展趋势进行了展望及分析。(本文来源于《计算机技术与发展》期刊2009年05期)
文本压缩论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文介绍了LZW的压缩和解压算法,采用C语言实现了一个基于LZW的简单的文本压缩解压器,可以实现文本文件内容的压缩和解压,具有很好的效果。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
文本压缩论文参考文献
[1].曾党泉.基于PDC编码的中文文本压缩算法[J].计算机工程与应用.2015
[2].李康.基于LZW文本压缩解压器的设计与实现[J].数字技术与应用.2014
[3].陈庆辉,陈小松,韩德良.中文文本压缩的LZW算法[J].计算机工程与应用.2014
[4].胡顺,覃基笙.大学英语移动学习系统中的文本压缩技术研究[J].科技通报.2012
[5].包长明,陈继忠,付萍.一种SymbianS60数据库应用中的文本压缩方法[J].计算机应用与软件.2012
[6].魏星,张磊,吴义国.一种基于多模式匹配的文本压缩算法[J].现代计算机(专业版).2011
[7].边巴旺堆,武强,米玛加措,马元强,桑珠.基于LZ77算法的藏文文本压缩算法设计与实现[J].西藏大学学报(自然科学版).2010
[8].常为领,方滨兴,云晓春,王树鹏,余翔湛.一种支持ANSI编码的中文文本压缩算法[J].中文信息学报.2010
[9].陈国香,张世伟,宫玉晓.文本压缩的实现原理及方法[J].电脑编程技巧与维护.2009
[10].李彦军,苏红旗,杨峰,李述迪,姚书科.基于BWT的文本压缩算法研究[J].计算机技术与发展.2009