导读:本文包含了甚低码率论文开题报告文献综述及选题提纲参考文献,主要关键词:混合激励线性预测(MELP),多帧联合量化,矢量量化器,性能测试
甚低码率论文文献综述
李强,张玲,朱兰,明艳[1](2018)在《一种甚低码率声码器的设计》一文中研究指出在混合激励线性预测(mixed excitation linear prediction,MELP)模型的基础上,以超帧为单位,采用多帧联合编码技术,分模式对子帧的语音特征参数进行联合量化,实现了一种码率为600 bit/s的声码器。为了进一步减小量化误差,设计出了一种基于高斯混合模型的预测分类分裂矢量量化器(predictive switched split vector quantization based on Gauss mixture model,GMM-PSSVQ),该量化器对超帧中某些子帧的线谱频率进行量化,并利用帧间预测和线性插值等方法提高编码效率。采用谱失真对设计的矢量量化器进行性能评估,并分别与多级矢量量化和预测分裂矢量量化算法进行性能比较;通过客观感知语音质量评估和主观判断韵字测试对实现的声码器进行性能测试。测试结果表明,设计的矢量量化器平均谱失真最低,实现的声码器合成语音具有较高的清晰度和可懂度。(本文来源于《重庆邮电大学学报(自然科学版)》期刊2018年06期)
朱兰[2](2017)在《MELP甚低码率声码器的研究及实现》一文中研究指出随着移动通信技术的发展,用户数量的增多,无线通信中的频带资源变得越来越宝贵。降低语音的编码速率可以提高频带资源的利用率,因此高质量、低速率的语音编码技术被广泛应用于各种无线通信系统。混合激励线性预测(Mixed Excitation Linear Prediction,MELP)编码在线性预测模型的基础上采用了混合激励等五大机制来提高合成语音的质量,能在低于2.4kbps的速率上重建出较高质量的合成语音,可应用于卫星通信、军事通信和水下通信等频带资源极其宝贵的领域。因此基于MELP编码模型的甚低速率声码器是语音编码领域的一个重点研究方向。作为一种高质量的数据压缩算法,矢量量化在甚低速率语音编码领域起着非常重要的作用。本文通过对矢量量化算法进行研究,在预测分裂矢量量化算法中引入分类矢量量化,提出了一种基于高斯混合模型的预测分类分裂矢量量化(GMM-based Predictive Switched Split Vector Quantization,GMM-PSSVQ)算法。用GMM-PSSVQ算法对2.4kbps MELP声码器中的线谱频率(Line Spectrum Frequency,LSF)参数进行量化,并与多级矢量量化算法和预测分裂矢量量化算法进行对比,实验结果表明使用GMM-PSSVQ算法的声码器合成的语音的平均谱失真最小,客观感知语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)值最高,证明该算法能有效地降低LSF参数的量化失真,进而提高合成语音的质量。本文在深入研究标准MELP声码器算法原理的基础上,通过采用多帧联合量化和线性插值等技术降低编码速率,设计出了一种基于MELP的甚低速率声码器,编码速率为600bps。该声码器以20ms为一子帧,5个子帧组成一个超帧,根据子帧的清/浊音判决结果,将超帧划分为16种模式,对每种模式下的语音特征参数用60bit进行联合量化。在语音特征参数比特分配方案中,编码端采用GMM-PSSVQ算法只对一个超帧中2~3个子帧的LSF参数进行量化;解码端解码出这几帧的LSF参数后,利用相邻子帧之间的相关性,采用拉格朗日插值法计算出该超帧其它子帧的LSF参数。通过PESQ和判断韵字测试(Diagnostic Rhymer Test,DRT)对本文设计的声码器进行了性能测试,结果表明本文设计的600bps MELP声码器合成的语音具有较高的清晰度和可懂度。(本文来源于《重庆邮电大学》期刊2017-04-07)
游世军,王潇[3](2009)在《一种甚低码率下快速的匹配追踪视频编码算法》一文中研究指出文章提出一种快速的基于遗传匹配追踪(MP)的甚低码率视频编码算法,同时结合MP特性,用排序差分法对稀疏分解结果进行编码。仿真实验证明,在甚低码率下该算法与H.264编码算法相比,减少了块效应,提高了视频的主观质量和PNSR;与同类型算法相比,该算法速度更快,编码效率更高。(本文来源于《大众科技》期刊2009年02期)
甘勇,周兵,李晓强,钱德沛[4](2008)在《甚低码率视频编码器码率控制策略》一文中研究指出根据甚低带宽信道的远程视频传输的应用需求,提出一种甚低码率控制策略,通过在视频编码器增加I帧码率控制,引入二阶率失真模型,以及改进P帧的码率控制算法,提高了视频编码器码率控制的精度和传输图像的质量,有效地解决了甚低带宽下视频编码器的码率控制问题。实验结果表明,该算法既降低了编码缓冲区延迟,又提高了重建图像的质量。(本文来源于《计算机工程》期刊2008年23期)
蓝炳伟,单鲁宁[5](2008)在《基于H.264的甚低码率实时视频传输》一文中研究指出本文采用视频数据压缩技术来降低数据量,研究开发了一套基于H.264的甚低码率视频传输系统。该系统采用了Windows套接字网络编程API,使用了UDP通信方式,用VC++实现了视频数据的采集、压缩、传输和再现。(本文来源于《计算机系统应用》期刊2008年10期)
李平,曾毓敏,吴婷婷,吴华玉[6](2007)在《基于GMM的甚低码率语音编码器》一文中研究指出提出了一种新颖的基于高斯混合模型(GMM)的甚低码率语音编码系统。该编码器利用GMM对短时语音谱包络进行拟合的方法来对语音进行参数化表示。编码时,语音经预处理、分帧加窗后,再经FFT分析得到分帧语音的信号频谱,并获得平滑谱包络。然后采用GMM对谱包络进行拟合,用GMM参数(均值、方差、权重)对语音谱加以表示。由于GMM参数较少,从而可以使得码率甚低。解码时,根据编码逆运算生成谱包络,浊音信号利用正弦模型加以合成,清音信号经IFFT合成。实验仿真结果表明:该编码器在传输码率降低到2.35 kb/s时,仍可获得音质令人满意的解码语音。(本文来源于《光电子技术》期刊2007年02期)
张刚[7](2007)在《甚低码率低延迟语音编码算法研究》一文中研究指出本论文为响应ITU提出的LD-CELP编码算法新指标(延迟低于5毫秒,速率低于8Kb/s,长话音质)开展研究。主要研究目标为:1.设计并提出在长话音质下延迟2.5毫秒(帧长20样点)码率接近8Kb/s算法;2.设计并提出在通信质量下延迟5毫秒(帧长40样点)码率接近6Kb/s算法。为实现上述目标,论文在以下五个方面开展研究并取得创新性的进展。第一,提出了一种不依赖量化信噪比评价增益滤波器性能的方法,可在增益量化之前直接比较评价增益预测器的各种优化方案,形成了增益预测器与增益量化器分别独立进行优化的方法。研究评价了多个不同的预测器方案后发现有限记忆递推滤波器性能最高;而神经网络滤波器以最低计算代价获得了优于G.728杜宾递推公式的性能。对增益量化,研究比较了固定量化与自适应量化的特性。自适应量化的主要难点是自适应步长因子的优化涉及到海量运算。提出了一种基于人工免疫原理的克隆思维进化算法:N-进制编码方法,用来优化复杂目标函数多个变量,为解决这一问题贡献了一个新的方案。本研究的第二个创新性贡献是利用小波分析工具开发出语音信号后向实时基音检测算法。现有基音检测都是宽延迟的前向算法,包括G.728标准在内的所有低延迟语音编码算法均无基音检测过程。本研究基于小波分析提出了后向实时基音检测算法,可在2.5ms(20样点)帧内监测到基音脉冲的出现并计算出基音周期。在本研究领域,首次使基音分析用于低延迟语音编码算法成为可能。研究工作的第叁个创新结果是在低延迟语音编码算法中引入自适应码书搜索。低延迟算法每样点少于1bit码率资源,使用自适应码书搜索不利于降低码率。本研究提出新的解决方案是:先利用实时后向基音检测算法对最佳自适应码字标号进行初步定位,然后以此为基准进行自适应码书的修正搜索。一方面降低了自适应码书的码率消耗,另一方面改善了实时后向基音检测算法的精度,用在低延迟语音编码算法中取得理想的效果。第四,在前面工作的基础上给出了延迟2.5毫秒(帧长20样点)8Kb/s算法。首先基于G.728的结构将帧长由5样点提高到20样点,通过大量反复实验表明,当码率降到8.8K/s以下时音质无法得到保证,计算复杂性也大大超过了实时性要求,必须使用与现有任何算法不同的新结构。研究并提出了叁种延迟2.5毫秒的8Kb/s算法:方案1:自适应码书、固定码书各10bit(其中增益3bit,波形7bit)。方案2:偶数帧搜索自适应码书,奇数帧使用偶数帧的搜索结果,节省的码率资源用来扩大固定码书尺寸。方案3:结合后向实时基音检测的自适应码书搜索方案。实验表明,叁种延迟2.5毫秒的8Kb/s算法编码质量都接近了长话音质,计算复杂性与G.728相当。最后讨论了进一步降低码率的情况。与其它后向编码算法不同,本研究采用代数码激励作固定码书,设计并提出了延迟40样点(5ms)的后向实时基音检测结合自适应码书修正搜索的编码方案,在6.2K/s码率时仍能保持通信质量。(本文来源于《太原理工大学》期刊2007-05-01)
梁科,孙立峰,钟玉琢[8](2005)在《ADVC:面向甚低码率ad-hoc网络应用的自适应分布式视频编码》一文中研究指出分布式视频编解码框架是与目前传统视频编解码框架相反的一种编解码方式。它将运动搜索,运动补偿转移到解码端而拥有一个低复杂度的编码端和高复杂度的解码端。然而ad-hoc网络环境下的终端都是计算能力、带宽受限的手持移动设备,高复杂的解码端不适应ad-hoc网络环境下的视频应用。因此,我们提出了一种适用于ad-hoc网络视频应用的自适应的分布式视频编解框架:ADVC。从试验结果可以看出,ADVC在低码率的条件下的性能比传统分布式视频编码框架有较大的提升…(本文来源于《第一届建立和谐人机环境联合学术会议(HHME2005)论文集》期刊2005-10-01)
刘玉珍,王玉洁,杨会玉[9](2004)在《甚低码率视频信号压缩编码技术》一文中研究指出针对电话线低码率传输的视频监控工业环境,基于 H.263 标准,提出了一种新的视频压缩编码方法,即在帧内编码 DCT 变换后的系数量化策略上,采用量化表的方法来替代视频图像帧内编码的常规处理方法,在帧间编码的预测算法上,采用了半像素精度运动估计和 PB-帧工作模式。通过 C++编程,对该算法进行了仿真分析。结果表明该算法不但提高了系统的运行速度;而且提高了图象压缩比。(本文来源于《辽宁工程技术大学学报》期刊2004年06期)
胡学龙,刘中伟,吴镇扬[10](2004)在《H.26L甚低码率视频压缩标准的性能分析》一文中研究指出H.26L是VCEG(视频编码专家组)制定的新的甚低码率图像压缩标准,主要应用于可视电话和网络视频传输。本文讨论了H.26L的编码原理及其相对于H.263视频编码标准的新发展,分析了该标准的优点及实用化遇到的问题。计算机对比实验表明H.26L通过采用1/4精度运动估计、增强的先进帧间预测编码和帧内预测编码,在保证图像质量的情况下,压缩码率有明显改善,但同时运算的复杂度也大大增加。(本文来源于《微电子学与计算机》期刊2004年08期)
甚低码率论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
随着移动通信技术的发展,用户数量的增多,无线通信中的频带资源变得越来越宝贵。降低语音的编码速率可以提高频带资源的利用率,因此高质量、低速率的语音编码技术被广泛应用于各种无线通信系统。混合激励线性预测(Mixed Excitation Linear Prediction,MELP)编码在线性预测模型的基础上采用了混合激励等五大机制来提高合成语音的质量,能在低于2.4kbps的速率上重建出较高质量的合成语音,可应用于卫星通信、军事通信和水下通信等频带资源极其宝贵的领域。因此基于MELP编码模型的甚低速率声码器是语音编码领域的一个重点研究方向。作为一种高质量的数据压缩算法,矢量量化在甚低速率语音编码领域起着非常重要的作用。本文通过对矢量量化算法进行研究,在预测分裂矢量量化算法中引入分类矢量量化,提出了一种基于高斯混合模型的预测分类分裂矢量量化(GMM-based Predictive Switched Split Vector Quantization,GMM-PSSVQ)算法。用GMM-PSSVQ算法对2.4kbps MELP声码器中的线谱频率(Line Spectrum Frequency,LSF)参数进行量化,并与多级矢量量化算法和预测分裂矢量量化算法进行对比,实验结果表明使用GMM-PSSVQ算法的声码器合成的语音的平均谱失真最小,客观感知语音质量评估(Perceptual Evaluation of Speech Quality,PESQ)值最高,证明该算法能有效地降低LSF参数的量化失真,进而提高合成语音的质量。本文在深入研究标准MELP声码器算法原理的基础上,通过采用多帧联合量化和线性插值等技术降低编码速率,设计出了一种基于MELP的甚低速率声码器,编码速率为600bps。该声码器以20ms为一子帧,5个子帧组成一个超帧,根据子帧的清/浊音判决结果,将超帧划分为16种模式,对每种模式下的语音特征参数用60bit进行联合量化。在语音特征参数比特分配方案中,编码端采用GMM-PSSVQ算法只对一个超帧中2~3个子帧的LSF参数进行量化;解码端解码出这几帧的LSF参数后,利用相邻子帧之间的相关性,采用拉格朗日插值法计算出该超帧其它子帧的LSF参数。通过PESQ和判断韵字测试(Diagnostic Rhymer Test,DRT)对本文设计的声码器进行了性能测试,结果表明本文设计的600bps MELP声码器合成的语音具有较高的清晰度和可懂度。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
甚低码率论文参考文献
[1].李强,张玲,朱兰,明艳.一种甚低码率声码器的设计[J].重庆邮电大学学报(自然科学版).2018
[2].朱兰.MELP甚低码率声码器的研究及实现[D].重庆邮电大学.2017
[3].游世军,王潇.一种甚低码率下快速的匹配追踪视频编码算法[J].大众科技.2009
[4].甘勇,周兵,李晓强,钱德沛.甚低码率视频编码器码率控制策略[J].计算机工程.2008
[5].蓝炳伟,单鲁宁.基于H.264的甚低码率实时视频传输[J].计算机系统应用.2008
[6].李平,曾毓敏,吴婷婷,吴华玉.基于GMM的甚低码率语音编码器[J].光电子技术.2007
[7].张刚.甚低码率低延迟语音编码算法研究[D].太原理工大学.2007
[8].梁科,孙立峰,钟玉琢.ADVC:面向甚低码率ad-hoc网络应用的自适应分布式视频编码[C].第一届建立和谐人机环境联合学术会议(HHME2005)论文集.2005
[9].刘玉珍,王玉洁,杨会玉.甚低码率视频信号压缩编码技术[J].辽宁工程技术大学学报.2004
[10].胡学龙,刘中伟,吴镇扬.H.26L甚低码率视频压缩标准的性能分析[J].微电子学与计算机.2004
标签:混合激励线性预测(MELP); 多帧联合量化; 矢量量化器; 性能测试;