并行解码论文-杜桂宇

并行解码论文-杜桂宇

导读:本文包含了并行解码论文开题报告文献综述及选题提纲参考文献,主要关键词:双向并行解码,神经机器翻译,注意力机制

并行解码论文文献综述

杜桂宇[1](2019)在《基于双向并行解码的神经机器翻译》一文中研究指出机器翻译技术可以有效地帮助那些未熟练掌握外语的人们阅读和理解外文信息。当前机器翻译可分成统计机器翻译和神经机器翻译两类,其中神经机器翻译模型采用神经网络技术,主要由编码器和解码器构成。虽然编码器从两个方向上对输入序列进行编码已经成为事实标准,但多数模型的解码器仍然仅沿单一方向进行解码,这就使得解码器对未来可能存在的单词完全未知,也即存在可用信息不充分的问题。已有研究人员对双向解码进行研究。BLSTM通过让译文在双向解码器上都能取得较高概率,但它仅是间接使用反向译文信息。ABD-NMT采用异步方式组合双向解码器让正向解码器可以同时利用输出序列信息和反向解码器的隐含层状态信息进行解码,但反向解码器仍然存在信息不充分的问题。受双向编码的启发,并基于“单词预测的准确性正比于该单词上下文信息的丰富程度”的认知,本文提出双向并行解码模型。本文的模型采用两个解码器同时从左向右和从右向左生成输出序列,且解码器在预测单词的每一时步都会使用相反方向解码器的内部信息。我们设计了两种融合反向解码器信息的策略,分别将反向信息视为对输出序列上下文的补充和对输入序列的补充。我们采用加权求和的方式融合信息,并设计了两种不同的权值设置方式,分别是手动赋值和自动学习。本文工作包含如下五个方面:(1)我们将本文提出的双向并行解码模型与RNNsearch、BLSTM和ABDNMT进行对比。实验结果表明双向并行解码要明显优于不使用反向信息的RNNsearch和间接使用反向信息的BLSTM,且略优于仅单方面使用反向信息的ABD-NMT。(2)我们对比分析了不同融合策略和权值设置方式对翻译效果的影响。从结果可知:将反向信息充当记忆信息的融合策略要优于充当查询信息的融合策略;手动赋值的权重大小与模型翻译效果之间没有线性关系;采用手动赋值方式的模型的训练波动更小且收敛更快。(3)为了分析错误传播带来的输出不平衡问题在各模型中的程度,我们将译文按照不同粒度分段,然后评估各段译文的BLEU值。通过计算和分析相邻两段的平均差值和首尾两段的绝对差值,我们认为双向并行解码有助于缓解输出不平衡问题。(4)为了规避解码过程中错误传播的影响和集束搜索的约束,我们让模型直接基于真值进行单词预测,以此探究双向并行解码对单词准确性的影响。从实验结果可知在基于真值进行单词预测时,双向并行解码模型比单向解码模型更为精确。(5)我们分析了训练步长和束宽大小对模型的影响。实验结果表明即使损失函数已经收敛但模型翻译效果仍有可能提升,此外模型翻译效果与束宽大小之间没有线性关系。(本文来源于《吉林大学》期刊2019-05-01)

韩峰[2](2018)在《基于多核处理器的任务级与数据级相结合的HEVC并行解码技术与实现》一文中研究指出与以往视频编解码标准相比,最新的HEVC视频编解码标准面临着计算复杂度迅速增加的问题,这直接影响了它的运行和实现,而提高处理速度、增强计算能力的有效方法之一就是在多核平台上进行并行化处理。本文将采用美国Tilera公司提供的Tilera-Gx36多核处理器作为硬件实验平台,并基于该多核平台实现多层次任务级与数据级并行的HEVC解码方法。论文的主要研究内容和创新点如下:(1)提出了一种基于CTU单元像素依赖关系的低时延去方块滤波并行方法。通过对图像帧中的各滤波边界的依赖性分析,探究其可采用的并行方法,并分析现有的基于CTU行的去方块滤波并行方法,对其加以改进,实现基于CTU单元的并行处理,进一步提升去方块滤波模块的解码效率。同时依据CTU单元解码依赖关系设计出合理的CTU单元划分结构,来进一步提升解码器的解码效率。(2)提出了一种多层次任务级与数据级并行的解码方法。利用HEVC数据中的依赖性,将整个HEVC解码器划分为5个任务模块,分别为码流读取模块、熵解码模块、像素重构模块、去方块滤波模块以及样点自适应补偿模块;针对不同的解码任务模块分别设计并行方法,并对缓冲存储空间进行有效管理,同时在各模块间利用各CTU单元的依赖关系实现不同解码任务间基于CTU单元的流水线并行处理,采用线程池技术为解码任务动态分配线程资源,实现以功能模块和处理数据单元划分的多层次任务级与的数据级并行的解码,获得了比标准WPP方法更高的解码加速比。(3)提出了结合多核平台资源的快速解码方法。为所设计的基于多核平台任务级与数据级相结合的HEVC并行解码方法提供了多种优化方法,包括多任务并行处理时使用线程池技术以减少系统开销,同时在HEVC解码器各任务模块中引入数据冗余减少机制用来减少冗余的数据操作以及使用多核处理器平台提供的各种优化方法以进一步提升HEVC解码器的整体解码性能。针对本文所设计的基于多核平台的HEVC解码方法,本文设计了多个对比实验,并对实验结果进行分析,从而验证各并行解码方法的效果。由实验数据结果可知,本文所设计的去方块滤波并行方法,在不同的量化QP值下,并行加速比均有着显着地提升,且最大加速比达到了8倍。同时相比于WPP并行算法,本文所设计的像素解码重构并行算法在不同的量化QP值下,最大加速比达到了10倍。采用各类优化处理,解码器可以提升接近两倍的加速比。本文最终设计的HEVC并行解码器可完成未使用任何编码工具的高清视频码流的实时解码。(本文来源于《南京邮电大学》期刊2018-11-14)

汪少锴,李伟,金燕华[3](2018)在《基于GPU的H.264并行解码优化》一文中研究指出H.264视频编码标准因其很好的压缩率而成为目前的主流标准之一;针对H.264解码复杂度提高、计算量增大的现状,根据GPU适合通用并行计算的特性,提出其基于GPU的并行解码优化;使用GPU对帧内预测与滤波器模块解码,CPU负责控制GPU以及对剩余部分解码;通过对帧内预测解码的分析,提出一种优化的帧内预测并行算法,经实验证明相比有优化前算法解码效率被提高20%;通过对滤波器模块的研究,提出一种滤波强度并行求取算法以及并行滤波执行算法,经实验证明滤波器的处理速度提升了30%,且相比原图像△PSNR最大为0.10,△SSIM为0.01;最终通过实验证明,使用GPU对视频解码的关键模块处理,能大大提高处理效率。(本文来源于《计算机测量与控制》期刊2018年07期)

徐杰[4](2018)在《AVS2视频编码RDOQ的快速算法及基于OpenMP的帧级并行解码的实现》一文中研究指出AVS2(Audio Video StandardП)是我国具有自主知识产权的第二代视频编解码标准,压缩性能与国际最新标准HEVC(High Efficiency Video Coding)相当,比上代H.264或AVS1性能提升了一倍。同时对场景监控、3D视频编码有特殊的优化。但是它具有较高的计算复杂度,不满足实时的需求。所以无论是对编码还是解码的研究都具有深刻的意义。本文首先概述了视频编解码标准的历史和最新进展。然后详细介绍AVS2编码标准中的基本原理和关键技术,结合官方源代码RD14.0分析了重要模块的具体实现过程。AVS2标准是一种有损的视频压缩技术,视频质量损失的主要原因在量化模块。同时量化过程也影响着编码比特率。AVS2在源代码RD14.0中采用了两种量化方式,一种是率失真优化量化((rate-distortion optimization quantization,RDOQ)算法,它首先计算出每个像素值的多个候选量化值,然后结合率失真优化技术,对每个候选量化值进行预处理估算出码率和失真,最后折中地选择出最佳的量化值。虽然RDOQ过程使视频压缩率得到很大的提高,但同时较高的计算复杂度也使编码效率下降。另一种量化是传统的标量量化,它计算复杂度较低,但同时视频压缩率也较低。本文对比分析了两种量化的关系,针对率失真优化量化算法提出了叁种优化的方案,并在代码RD14.0上将其实现。测试结果表明:叁种方案都能有效提高编码速度,同时保持较高的压缩率。但是不同的方案有不同的优势和缺点,实验结果显示新改进后的方案编码速度平均提高了14%~21%,亮度峰值信噪比平均下降0.022dB~0.058dB。上述分析都是针对AVS2的编码器,除此之外,本文还针对AVS2解码器进行了并行优化。AVS2编解码器并不像HEVC标准那样支持波前并行或者Tile级并行。本文先分析avs码流结构以及解码过程,利用OpenMP接口对解码器程序进行修改,实现了在All_intra编码模式下对avs码流的帧级并行解码。最后实验结果显示,在4核CPU平台下如果4个线程同时解码,并行的加速比可以达到2.32~3.07。(本文来源于《西南交通大学》期刊2018-04-01)

张喜威[5](2016)在《解码四川普惠金融规划:四大任务并行 构建“特色化”体系》一文中研究指出自2016年1月份国务院发布《推进普惠金融发展规划(2016~2020年)》之后,普惠金融的发展被提升到一个新高度,各地相继出台实施细则等相关文件。如今,全国首个省级普惠金融发展规划在四川落地。12月28日,《每日经济新闻》从四川省金融办(本文来源于《每日经济新闻》期刊2016-12-29)

方狄[6](2016)在《基于Tilera多核处理器的HEVC多层次并行解码方法的研究与实现》一文中研究指出HEVC是面向高清和超高清视频应用的新一代视频编码标准,但其极高的运算复杂度是应用中面临的重要障碍,采用多核处理器是解决问题的有效途径。本文以TILERA公司推出的Tilera GX36多核处理器为硬件平台,对HEVC视频的并行解码技术进行了深入的研究,通过对解码器中关键模块并行化处理,实现基于Tilera多核处理器的HEVC多层次并行解码,从而达到对未使用任何并行方式编码形成的高清、超高清视频码流的实时解码目标。论文的主要工作和创新如下:1.研究并实现了解码过程中熵解码模块(ED),CTU行像素解码模块(CTU),去方块滤波模块(DF)等叁个模块的并行处理方法。基于帧类型依赖性分析和CU块数据的关联性分析,分别实现了熵解码帧级并行算法,CTU行像素并行解码算法和去方块行级并行滤波算法,在保证重建图像质量的同时,提高了解码并行加速比。2.研究并实现了基于Tilera多核处理器HEVC多层次并行解码算法。对HEVC解码器的熵解码模块(ED)、CTU行像素并行解码模块(CTU)、去方块滤波模块(DF)等加以有机结合,并通过流水线并行设计,提高多核利用率,降低各个模块之间的延时,实现了CTU级与帧级处理并存的多层次并行架构的HEVC解码算法。建立了CTU行并行加速分析的数学模型,解释了多核并行加速可能出现的瓶颈现象。3.实现了基于Tilera多核处理器的平台级优化方法。通过Tilera GX36多核处理器平台提供的多媒体应用的优化方法,实现了编译器优化、存储器优化、指令集优化、FeedBack优化等,进一步提高了HEVC并行算法的处理性能。论文通过对不同的高清视频测试序列对上述方法进行了实验和分析,验证了所提出的各并行解码方法的有效性。实验结果表明,所提出的帧级熵解码并行算法的加速比达到了1.6,CTU行像素并行解码的加速比达到了9.5,去方块并行滤波并行算法的加速比达到了2.0,提出的多层次并行解码算法对高清和超高清普通视频码流的解码最大并行加速比达到了15.9,比WPP并行方式高出37%左右,帧率达到了30帧/s以上,实现了实时解码目标。论文最后对做的工作进行了总结,并展望了未来的进一步研究方向(本文来源于《南京邮电大学》期刊2016-11-18)

张文辉,曹强[7](2015)在《为基于XOR的RAID-6码设计的并行编解码算法》一文中研究指出RAID-6被广泛应用于存储系统中对数据进行保护.其中基于XOR的RAID-6码具有计算复杂度低的优点,因而受到广泛的关注和应用.但是,这类编码的潜在并行能力还没有被充分地挖掘和发挥.分析了基于XOR的RAID-6码的编解码过程,把校验方程的计算分解为预计算和递归求解2个阶段,其中预计算阶段可以被并行执行.此外,还观察到多种RAID-6码具有z-turn性质——只要失效情况在该RAID-6码的容错能力范围内,就至少有1个校验方程只包含1个不可用的数据块.基于此,设计了一个并行的编解码算法EOPC(equation-oriented parallel coding),用以实现具有z-turn性质的基于XOR的RAID-6码的编解码过程.在RDP码和P-Code上的编解码实验表明,使用EOPC实现的编解码过程与传统串行实现方法相比,在编解码吞吐率上有超过50%的性能提升.(本文来源于《计算机研究与发展》期刊2015年S2期)

蔡二龙[8](2015)在《并行BCH编解码的快速实现方法》一文中研究指出NAND Flash是一种非易失性存储器,具有较高的存储密度,写入和擦除速度较快,广泛应用于各种消费电子产品和其他存储设备中。在NAND Flash中存在CRC校验,但是CRC校验的纠错能力有限,随着NAND Flash存储密度的大幅度增加,数据在存储过程中出错的概率也在增大,所以需要更强纠错能力的ECC算法,BCH码拥有很强的纠错能力,很好的满足了这一需求。已知NAND Flash的接口是单字节的,所以为了适应NAND Flash,BCH码需要采用单字节流输入和输出的编解码算法。本文首先介绍了有限域的基本性质,生成矩阵和校验矩阵的关系,最小码距与重量谱的基本概念。然后介绍了BCH编码器的单比特流输入结构,该单比特流输入结构的数据处理速度不高,继而又介绍了BCH编码器的8比特流输入结构,但是该结构涉及太多的矩阵运算,设计起来异常复杂,为了满足时钟频率和设计容易的要求,提出了一种BCH编码器的8比特流输入的设计结构,也称之为BCH编码器的并行算法。编码器的并行算法提出之后,又重点研究了BCH码的译码算法,译码一共包括叁个过程:伴随式计算、错误位置多项式求解、Chien搜索。经典的伴随多项式算法和Chien搜索算法都是串行结构,虽然能够满足时钟频率的要求,但是数据处理速率较慢,于是本文在串行算法的基础上提出了并行算法结构,极大的提高了数据的处理速度。通过研究错误位置多项式求解的两个算法:BM算法,无逆的BM算法,发现两个算法针对各种数据类型都成立,而本文所采用的是BCH码的二进制码流,可以在无逆的BM算法的基础上进行进一步的优化,迭代次数降低为改进前的二分之一。按照传统的思路把伴随式计算模块、错误位置多项式求解模块、Chien搜索模块结合在一块的话,不论在任何时候,始终只有一个模块在工作,其他模块处于空闲的状态。针对这种情况,本文在译码中引入了流水线的结构,这样在大多数情况下叁个模块都在同时工作,极大的提高了数据的处理速率,实现了快速并行BCH译码器的设计。最后对并行编码器算法和并行译码器算法进行了功能仿真和硬件测试,证明了所设计的快速并行BCH编解码算法的正确性。(本文来源于《西安电子科技大学》期刊2015-12-01)

张世能[9](2015)在《多线程技术在GNSS数据并行解码中的应用》一文中研究指出随着GNSS技术在日常生活以及工程建设方面的应用日益广泛,对数据处理的效率和准确性的要求也越来越高。介绍RINEX标准数据格式以及中海达Q5接收机二进制数据格式,研究将原始观测值数据以及导航电文通过解码转换为RINEX标准格式的算法流程,并引入多线程技术实现多测站观测数据的实时并行解码。通过编程以及实际测试,验证该算法在工程应用中的可行性。(本文来源于《交通科技与经济》期刊2015年05期)

袁长征,肖兴国,张恒[10](2015)在《基于多线程技术的GPS数据实时并行解码》一文中研究指出本文在介绍RINEX标准数据格式及中海达Q5接收机原始二进制数据格式的基础上,分析研究了将原始观测值数据、导航电文通过解码转换为RINEX标准格式的算法流程;引入多线程技术,实现了多测站观测数据的实时并行解码;最后通过编程实现以及实际测试,验证了该算法在工程应用中的可行性。(本文来源于《卫星导航定位与北斗系统应用2015——北斗耀全球 璀璨中国梦》期刊2015-09-01)

并行解码论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

与以往视频编解码标准相比,最新的HEVC视频编解码标准面临着计算复杂度迅速增加的问题,这直接影响了它的运行和实现,而提高处理速度、增强计算能力的有效方法之一就是在多核平台上进行并行化处理。本文将采用美国Tilera公司提供的Tilera-Gx36多核处理器作为硬件实验平台,并基于该多核平台实现多层次任务级与数据级并行的HEVC解码方法。论文的主要研究内容和创新点如下:(1)提出了一种基于CTU单元像素依赖关系的低时延去方块滤波并行方法。通过对图像帧中的各滤波边界的依赖性分析,探究其可采用的并行方法,并分析现有的基于CTU行的去方块滤波并行方法,对其加以改进,实现基于CTU单元的并行处理,进一步提升去方块滤波模块的解码效率。同时依据CTU单元解码依赖关系设计出合理的CTU单元划分结构,来进一步提升解码器的解码效率。(2)提出了一种多层次任务级与数据级并行的解码方法。利用HEVC数据中的依赖性,将整个HEVC解码器划分为5个任务模块,分别为码流读取模块、熵解码模块、像素重构模块、去方块滤波模块以及样点自适应补偿模块;针对不同的解码任务模块分别设计并行方法,并对缓冲存储空间进行有效管理,同时在各模块间利用各CTU单元的依赖关系实现不同解码任务间基于CTU单元的流水线并行处理,采用线程池技术为解码任务动态分配线程资源,实现以功能模块和处理数据单元划分的多层次任务级与的数据级并行的解码,获得了比标准WPP方法更高的解码加速比。(3)提出了结合多核平台资源的快速解码方法。为所设计的基于多核平台任务级与数据级相结合的HEVC并行解码方法提供了多种优化方法,包括多任务并行处理时使用线程池技术以减少系统开销,同时在HEVC解码器各任务模块中引入数据冗余减少机制用来减少冗余的数据操作以及使用多核处理器平台提供的各种优化方法以进一步提升HEVC解码器的整体解码性能。针对本文所设计的基于多核平台的HEVC解码方法,本文设计了多个对比实验,并对实验结果进行分析,从而验证各并行解码方法的效果。由实验数据结果可知,本文所设计的去方块滤波并行方法,在不同的量化QP值下,并行加速比均有着显着地提升,且最大加速比达到了8倍。同时相比于WPP并行算法,本文所设计的像素解码重构并行算法在不同的量化QP值下,最大加速比达到了10倍。采用各类优化处理,解码器可以提升接近两倍的加速比。本文最终设计的HEVC并行解码器可完成未使用任何编码工具的高清视频码流的实时解码。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

并行解码论文参考文献

[1].杜桂宇.基于双向并行解码的神经机器翻译[D].吉林大学.2019

[2].韩峰.基于多核处理器的任务级与数据级相结合的HEVC并行解码技术与实现[D].南京邮电大学.2018

[3].汪少锴,李伟,金燕华.基于GPU的H.264并行解码优化[J].计算机测量与控制.2018

[4].徐杰.AVS2视频编码RDOQ的快速算法及基于OpenMP的帧级并行解码的实现[D].西南交通大学.2018

[5].张喜威.解码四川普惠金融规划:四大任务并行构建“特色化”体系[N].每日经济新闻.2016

[6].方狄.基于Tilera多核处理器的HEVC多层次并行解码方法的研究与实现[D].南京邮电大学.2016

[7].张文辉,曹强.为基于XOR的RAID-6码设计的并行编解码算法[J].计算机研究与发展.2015

[8].蔡二龙.并行BCH编解码的快速实现方法[D].西安电子科技大学.2015

[9].张世能.多线程技术在GNSS数据并行解码中的应用[J].交通科技与经济.2015

[10].袁长征,肖兴国,张恒.基于多线程技术的GPS数据实时并行解码[C].卫星导航定位与北斗系统应用2015——北斗耀全球璀璨中国梦.2015

标签:;  ;  ;  

并行解码论文-杜桂宇
下载Doc文档

猜你喜欢