数据置换论文-张婷

数据置换论文-张婷

导读:本文包含了数据置换论文开题报告文献综述及选题提纲参考文献,主要关键词:SIMD,向量转置单元,PowerPC

数据置换论文文献综述

张婷[1](2015)在《128位向量ALU数据置换指令子集的RTL设计》一文中研究指出为了追求更高的数据处理能力,处理器操作数的精度在不断提高,而实际上很多运算操作并不需要处理如此高精度的数据,这样的操作方式没有充分发挥数据处理资源的全部潜力,造成资源的浪费,因而提出了基于单指令多数据流(SIMD)的子字并行优化策略。然而SIMD寄存器是以字对齐方式为访问形式的存储单元,实际存储器以字节对齐进行访存,因此在并行操作前后需要一个额外的数据转置单元(Permute)对数据进行转置处理,得到符合SIMD寄存器规格的操作数。为实现单指令多数据流SIMD并行处理机制中的数据转置功能,本文研究了基于Power PC的体系架构与AltiVec机制(Power PC体系架构通用处理器的多媒体指令集的扩展)的向量ALU数据转置单元,通过对Power PC体系架构与该处理器指令集的分析,设计实现了SIMD向量并行数据处理技术中负责数据处理的向量转置(Permute)模块。本设计模块处理128位的操作数,采用两级流水线,设计实现了Power PC_ISA指令集数据转置模块中包括向量打包指令、向量解包指令、向量合并指令、向量复制拼接指令、向量选择指令、向量置换指令、向量移位指令和向量聚集指令共八类53条向量转置指令的操作,该转置模块解决了SIMD向量寄存器与实际数据访存操作之间因数据格式不一致而导致并行操作技术对性能优化程度不高的问题。设计电路使用Verilog硬件描述语言完成电路描述,实现电路功能,最后对完成的设计电路进行功能仿真,保证其功能的正确性。本设计在第二级的流水线中引入了交叉开关矩阵(Crossbar Switch)结构完成了数据处理后的数据选择操作,该交叉开关矩阵模块完成了转置模块所有指令的数据选择操作,无阻塞的内部结构保证数据传输速度,根据分析指令之间的操作相似之处,实现指令间的模块共用,精简了电路结构,消除冗余电路,优化模块面积,提高处理速度。(本文来源于《西安电子科技大学》期刊2015-12-01)

陈向,沈立[2](2012)在《一种面向自动向量化和数据置换操作的中间表示》一文中研究指出在现有的SIMD程序设计中,编译器或程序员都需要借助置换指令对参与运算的向量操作数进行重新组织,才能符合SIMD指令的要求。这些置换指令带来了较大的性能损失。本文提出了一种新的中间表示,它能够完整地记录标量和向量操作数的存储地址信息,使得置换指令的产生尽可能地推后,减少了冗余置换指令的产生。利用这种中间表示实现了一种数据置换操作的优化算法,它能够有效地减少置换指令带来的性能损失。面向一组典型的多媒体程序进行测试的结果表明,本文提出的方法可以平均获得7%的性能加速。(本文来源于《计算机工程与科学》期刊2012年07期)

陈向,沈立,李家文[3](2011)在《SIMD数据置换操作的自动生成和优化》一文中研究指出SIMD指令能够高效开发数据级并行,因此当前绝大多数通用微处理器都支持这种机制。但是应用程序和算法的一些固有特性,如访存地址不对齐、非连续存储访问以及控制流等,使得编译器或程序员必须借助置换指令重新组合向量的各个元素,才能得到符合SIMD指令要求的操作数。这些冗余的置换指令已成为当前挖掘数据级并行的主要性能瓶颈。提出一种自动的数据置换指令生成和优化算法,以有效地减少置换指令带来的性能损失。该算法基于提出的一种新中间表示形式,其中包含有足够的操作数地址信息,因此可以将置换指令的生成转换为数据流图中冲突边的识别问题,而将置换指令的优化转化为用最少的置换指令来删除所有冲突边的问题。面向一组典型多媒体程序进行测试的结果表明,提出的算法可平均获得7%的性能加速。(本文来源于《计算机科学》期刊2011年05期)

陈向[4](2010)在《SIMD数据置换指令的自动生成与优化》一文中研究指出为了提高多媒体、编码/解码、加密/解密等计算密集型应用的性能,越来越多的现代微处理器中集成了SIMD(Single Instruction Multiple Data)功能单元,并向原有的指令集中增加了SIMD扩展指令,以充分挖掘这些应用中蕴含的丰富数据级并行。在理想情况下,SIMD指令能够带来很高的性能加速比,但是目前编译器对SIMD指令的利用并没有达到足够令人满意的程度,其主要原因有两个:一是SIMD指令都是寄存器-寄存器型的,操作数的宽度必须与向量寄存器的宽度一致;二是绝大多数SIMD访存单元仅支持地址连续、对齐(aligned)的存储访问。如果实际应用无法满足这两个条件,就必须插入数据置换(permutation)指令,对参与运算的数据进行重新组织,以得到符合SIMD指令要求的操作数。然而,数据置换指令的加入会带来不小的性能损失,降低程序的执行效率。本文研究并提出了减少这种性能损失的方法,并将其集成到SIMD指令的自动生成编译框架中。通过分析现有的数据置换指令自动生成和优化方法,不难发现现有的编译策略都将置换指令的生成和优化分为两个阶段,第一个阶段生成置换指令,但其中有不少是冗余的,第二阶段再尽可能地将这些冗余的置换指令优化掉,但优化效果往往无法令人满意。为了解决这些问题,本文首先提出了一种新的中间表示URSS(Unified Representation for Scalar and SIMD),它能够将标量指令和SIMD指令的表示统一起来。基于这种中间表示,本文设计并实现了一种自动向量化算法,在向量化的过程中仅生成非冗余的置换指令,而将其他置换指令表示为数据流图中的冲突边。最后本文提出了冲突边的识别和消除算法。上述工作已经在基于SUIF2的编译框架上实现。面向核心程序和MiBench基准程序包的测试结果表明,我们提出的方法大大减少了数据置换指令带来的性能损失。(本文来源于《国防科学技术大学》期刊2010-11-01)

秦兴,刘纯悦[5](2008)在《二维寻址与数据置换嵌入的多媒体存储体系》一文中研究指出针对多媒体处理算法存储访问的特点,提出了一种新的多媒体扩展存储体系。该体系采用二维字节寻址,支持行访问和列访问;将数据置换操作与存储器访问操作相融合,通过数据置换来实现复杂的地址变换。基于此体系设计了指令系统和硬件原型。通过H.264算法测试表明,所述体系可以减少平均约32.0%的存储器访问率以及25.4%的时钟周期数。(本文来源于《计算机工程与应用》期刊2008年07期)

秦兴[6](2007)在《零数据置换时间开销的多媒体扩展体系》一文中研究指出为了减少传统SIMD多媒体扩展体系存在的数据置换时间开销,该文提出了一种新的多媒体扩展体系。该体系在指令定义中,包含显性的数据置换信息;在实现体系中,融合了计算和数据置换操作。采用H.264的解码程序测试,与基本型的双发射SIMD处理器体系比较表明:整体上可以获得1.4到1.5的加速,而程序代码大小却减少了17.8%。本体系的硬件实现基于TSMC 0.18μm工艺综合显示,增加的数据置换网络只占用了0.66%的芯片面积和0.71ns的延时。(本文来源于《浙江省电子学会第七次会员代表大会暨2007学术年会论文集》期刊2007-11-01)

秦兴[7](2007)在《零数据置换时间开销的多媒体扩展体系》一文中研究指出为了减少传统SIMD多媒体扩展体系存在的数据置换时间开销,该文提出了一种新的多媒体扩展体系。该体系在指令定义中,包含显性的数据置换信息;在实现体系中,融合了计算和数据置换操作。采用H.264的解码程序测试,与基本型的双发射SIMD处理器体系比较表明:整体上可以获得1.4到1.5的加速,而程序代码大小却减少了17.8%。本体系的硬件实现基于TSMC 0.18μm工艺综合显示,增加的数据置换网络只占用了0.66%的芯片面积和0.71ns的延时。(本文来源于《杭州电子科技大学学报》期刊2007年05期)

数据置换论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在现有的SIMD程序设计中,编译器或程序员都需要借助置换指令对参与运算的向量操作数进行重新组织,才能符合SIMD指令的要求。这些置换指令带来了较大的性能损失。本文提出了一种新的中间表示,它能够完整地记录标量和向量操作数的存储地址信息,使得置换指令的产生尽可能地推后,减少了冗余置换指令的产生。利用这种中间表示实现了一种数据置换操作的优化算法,它能够有效地减少置换指令带来的性能损失。面向一组典型的多媒体程序进行测试的结果表明,本文提出的方法可以平均获得7%的性能加速。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

数据置换论文参考文献

[1].张婷.128位向量ALU数据置换指令子集的RTL设计[D].西安电子科技大学.2015

[2].陈向,沈立.一种面向自动向量化和数据置换操作的中间表示[J].计算机工程与科学.2012

[3].陈向,沈立,李家文.SIMD数据置换操作的自动生成和优化[J].计算机科学.2011

[4].陈向.SIMD数据置换指令的自动生成与优化[D].国防科学技术大学.2010

[5].秦兴,刘纯悦.二维寻址与数据置换嵌入的多媒体存储体系[J].计算机工程与应用.2008

[6].秦兴.零数据置换时间开销的多媒体扩展体系[C].浙江省电子学会第七次会员代表大会暨2007学术年会论文集.2007

[7].秦兴.零数据置换时间开销的多媒体扩展体系[J].杭州电子科技大学学报.2007

标签:;  ;  ;  

数据置换论文-张婷
下载Doc文档

猜你喜欢