导读:本文包含了嵌入式图形处理器论文开题报告文献综述及选题提纲参考文献,主要关键词:Alpha混合,流水线,定点数,浮点数
嵌入式图形处理器论文文献综述
杜慧敏,黄世远,郝武[1](2019)在《嵌入式图形处理器Alpha混合单元设计与实现》一文中研究指出针对嵌入式GPU对Alpha混合功能的设计需求,设计并实现一种支持6种混合方式的Alpha混合单元。通过分析OpenGL ES/OpenGL支持的各种混合方式以及混合所需要的各类运算,确定数据格式;采用七级流水线结构,将多种混合操作均衡的分布到各流水级中。在ZC706开发板进行测试,采用vivado工具,在Zynq-7000系列FPGA芯片上对电路进行综合,结果表明,Alpha混合单元工作频率达到178 MHz,七级流水线时间均衡。以复杂场景平均需进行3次混合为标准,Alpha混合单元的半精度浮点数像素吞吐率需达到356M(pixel)/s,定点像素数据吞吐率达到712M(pixel)/s,可以满足显示分辨率最高达到1 600×1 200×60Hz的显示要求。(本文来源于《西安邮电大学学报》期刊2019年01期)
王晓青,王向军[2](2019)在《应用于嵌入式图形处理器的实时目标检测方法》一文中研究指出提出了一种应用于嵌入式图形处理器(GPU)的实时目标检测算法。针对嵌入式平台计算单元较少、处理速度较慢的现状,提出了一种基于YOLO-V3(You Only Look Once-Version 3)架构的改进的轻量目标检测模型,对汽车目标进行了离线训练,在嵌入式平台上部署训练好的模型,实现了在线检测。实验结果表明,在嵌入式平台上,所提方法对分辨率为640 pixel×480 pixel的视频图像的检测速度大于23 frame/s。(本文来源于《光学学报》期刊2019年03期)
王利祥[3](2018)在《嵌入式图形处理器的研究与设计》一文中研究指出针对当前嵌入式设备日益普及,而用户对设备的效率和性能的要求也日益提高,面对当前的问题,本文在深入研究当前嵌入式系统的发展现状及研究意义的基础上,提出了一种适合嵌入式系统实现的图形加速器。经过研究,本设计具有代码效率高、性能稳定、可移植性强等特点。(本文来源于《电子制作》期刊2018年14期)
张少锋,田泽,杨峰,王绮卉,赵彬[4](2016)在《机载显示系统对嵌入式图形处理器的应用需求》一文中研究指出图形处理器是机载显示系统的核心部件之一,高性能的图形处理器能够保证飞机实时地显示清晰可靠的画面。目前,国内高性能的图形处理器主要依赖于发达国家,研发具有自主知识产权的机载图形处理器具有重要的意义。本文通过对当前流行的机载显示系统的图形处理功能和机载显示场景进行分析,为国产化机载图形处理器的设计及优化提供了依据。(本文来源于《第二十届计算机工程与工艺年会暨第六届微处理器技术论坛论文集》期刊2016-08-11)
王佳[5](2014)在《Tile-based嵌入式图形处理器的研究与设计》一文中研究指出21世纪以来,嵌入式设备和技术取得了长足的发展,各类嵌入式设备对于嵌入式系统的图形处理能力,尤其在处理速度、绘制效果、资源消耗等方面,提出了更高的要求,这极大地推动了嵌入式图形处理器(Graphic Processing Unit, GPU)的发展。嵌入式系统带宽资源有限,低功耗、低成本、高性能、高质量的处理需求使得嵌入式GPU的设计有别于桌面GPU,需要在组成架构、绘制流程、图形算法、硬件设计、带宽能耗等方面针对嵌入式系统要求进行优化。其中,Tile-based绘制技术是应用于嵌入式GPU的有效设计优化方法,也是本文的研究主要内容。与桌面GPU的绘制流水线相比,Tile-based绘制技术可以大幅降低图形处理器对深度缓存的访问带宽。其最主要特征是将绘制屏幕划分为多个小块区域分别进行场景绘制。足够小的分块使得其深度判定数据可以缓存于片上存储单元,大大减少了深度判定算法中频繁读取片外存储单元的次数,从而减小了嵌入式系统的带宽、功耗,提高了系统性能。本文通过对Tile-based绘制技术的研究,设计了一款Tile-based嵌入式GPU。首先深入研究各类图形学算法,对算法优缺点进行分析比较,选择适合Tile-based嵌入式GPU的叁角形覆盖测试、深度测试、光栅化等算法并进行优化设计;其次通过比较立即绘制模式和Tile-based渲染模式的异同,确定Tile-based绘制技术的组成架构及绘制流程;随后完成Tile-based嵌入式GPU各硬件模块设计;最后搭建仿真平台,完成设计的模块级、系统级验证。本文研究的基于Tile绘制的嵌入式GPU设计能够应用于高端嵌入式系统芯片中,加速嵌入式系统的图形处理能力,减少系统带宽和能耗,提高性能,具有较为重要的研究意义与应用前景。(本文来源于《山东大学》期刊2014-04-20)
许强,陈杰,刘建,王云,胡哲琨[6](2013)在《一种适用于嵌入式图形处理器的多端口纹理Cache的设计》一文中研究指出为了提高嵌入式图形处理器的纹理单元效率,提出了一种多端口纹理高速缓存(Texture Cache)结构.该结构采用了基于块的光栅化和块交错的纹理内存组织,能够充分发掘数据间相关性,提高了Cache命中率;此外该结构采用Cache预取技术,有效隐藏了访存延迟;为了进一步提高数据吞吐率,设计了4个读端口,可支持并行读取4个纹素.仿真结果表明,设计的Cache可达到92%左右命中率,访存性能可达到零延迟内存系统的90%,数据吞吐率是单端口Cache的3~4倍.(本文来源于《微电子学与计算机》期刊2013年11期)
田兵,吴宁,谭显强[7](2011)在《嵌入式图形处理器裁剪引擎的设计》一文中研究指出以计算机图形学为基础,文章设计了一种具有较好通用性的嵌入式图形处理器裁剪引擎。重点剖析了裁剪算法和裁剪引擎RTL级模型的设计,该模型采用Verilog HDL实现引擎的IP软核,并在QuartusⅡ环境中完成IP核的功能仿真与时序验证。综合后,IP核占用FPGA资源为9489逻辑单元,实现了对图形进行裁剪的任务,达到了预期的设计要求。(本文来源于《计算机与数字工程》期刊2011年10期)
杨国东[8](2010)在《嵌入式图形处理器的研究与实现》一文中研究指出随着嵌入式终端设备的发展,以及人们对于嵌入式终端设备3D图形高品质的要求,仅仅依靠嵌入式的CPU如(ARM, MIPS等)绘制复杂的叁维图形很难达到图形的实时交互以及高分辨率的图形图像显示。因此,对于在嵌入式系统中加入专门的嵌入式图形处理器芯片或是利用具备图形加速引擎的SoC芯片来提高图形的绘制速度,将嵌入式CPU从繁重的渲染算法中解脱出来的需求越来越迫切。同时,嵌入式领域发展使得对于嵌入式GPU (Graphic Process Unit)芯片的需求量越来越多,具备了广阔的市场前景,在这种趋势下,研究和设计适合嵌入式系统的图形处理器具有十分重要的意义以及价值。当前来说嵌入式GPU有两种,一种是支持OpenGL ES 1.x固定渲染管线的嵌入式GPU,另一种是支持OpenGL ES 2.x的可编程的渲染管线的嵌入式GPU。本课题的目的是设计出一款完全支持OpenGL ES 1.0标准的嵌入式GPU的IP核,通过对GPU渲染流水线RTL (Register Transfer Logic)级代码编写,以及GPU驱动程序的编写,在FPGA进行验证,开发出一款适用于嵌入式系统的低功耗高性能的嵌入式图形处理器。在开发芯片开发整个流程中,通常是首先建立该芯片的软件模型,用以进行芯片功能的验证以及模拟,为后面的RTL (Register Transfer Logic)级代码提供一个功能性的软件模型,用以验证相应的算法。本论文的主要工作就是嵌入式GPU芯片开发流程中软件模型的设计以及实现。本工作实现了图形芯片中处理3D图形处理的过程,为后续的芯片开发提供了一个很好的参考。文章着重于嵌入式GPU图形管线算法的提取以及相应的C/C++的软件实现,为了能够更好的在嵌入式系统中模拟出嵌入式图形芯片,嵌入式软件GPU以库的形式运行在嵌入式的CPU上,用以图形处理器的功能的模拟。本论文中采用ARM处理器作为嵌入式的CPU,采用的操作系统是LINUX操作系统,因此论文中软件GPU模型的建立以及开发调试工作是运行在ARM-LINUX-GCC的开发环境中。从另一个角度上来说,嵌入式GPU是OpenGL ES 1.0的实现,因此设计开发相应的图形库是OpenGLES 1.0在ARM+LINUX平台的软件实现。论文首先回顾了PC机上图形处理器的发展历史以及现状,简单介绍了嵌入式处理器当前的国内外现状以及研究意义,同时详细介绍了本课题的目标。其次简单介绍了图形系统的构成,详细讨论了嵌入式GPU的关键技术,着重研究了OpenGL ES 1.0的标准并提出了在本论文中实现图形显示系统的解决方案。嵌入式GPU的关键技术是图形管线技术,也就是图形管线相关的算法,因此论文在正文部分对这些图形管线算法的原理进行了详细的探讨并提出了相应的设计实现。最后论文对生成的GPU的软件库进行了功能的验证,如平移、旋转变换,以及光照运算,剔除与裁剪,投影以及光栅化等功能进行验证,实现了图形芯片功能的模拟。(本文来源于《山东大学》期刊2010-04-30)
刘静,吴宁,夏小为[9](2010)在《嵌入式图形处理器中几何变换引擎的设计》一文中研究指出针对嵌入式系统处理叁维图形时需要良好的实时性要求,提出使用专用嵌入式图形处理器负责图形处理,用以缓解CPU负担,提高处理速度的解决方法。几何变换引擎位于图形处理器内部图形流水线的第一级,负责处理叁维图形在空间坐标系中的位置变换。设计了几何变换引擎的架构模型,采用Verilog HDL实现引擎的IP软核,并在Modelsim和QuartusII环境中完成IP核的功能仿真与时序验证。综合后,IP核占用FPGA资源为9715逻辑单元,单顶点的处理时间为160ns,实现处理图形几何变换的任务,达到预期设计要求。(本文来源于《计算机仿真》期刊2010年01期)
阙恒[10](2007)在《嵌入式图形处理器设计》一文中研究指出随着嵌入式系统对计算机绘图能力要求的不断提高,完全依靠单一CPU绘制复杂的叁维图形很难达到交互性的实时要求。因此,在嵌入式系统中加入一块专用的图形处理器GPU芯片来提高图形的绘制速度,将CPU从繁重的图形计算任务中解放出来的需求变得越来越迫切。在这种趋势下,研究和设计适合嵌入式系统使用的图形处理器具有重要意义。论文首先回顾了图形处理器的发展历史,分析了图形系统的构成。典型的图形系统由图形API、GPU的驱动程序以及硬件叁部分组成。论文采用OpenGL作为系统的图形API,从中选取23条常用命令,设计了它们的渲染列表,以此作为嵌入式GPU的设计规约。在此基础上,定义并实现了与所选命令对应的GPU驱动程序,从而将图形API翻译为GPU能够执行的渲染列表。论文重点研究了GPU的核心内容——图形管线的组成和关键算法,根据图形管线的组成设计了GPU的体系结构,并使用SystemC在事务级实现了GPU的概念模型,该模型完成了图形处理任务里的几何阶段和光栅阶段。通过对GPU概念模型的细化,可以得到寄存器传输级的GPU IP软核。GPU概念模型的建立和调试工作在Visual C++6.0集成开发环境下完成,经验证,该模型能够执行所实现的OpenGL API,正确完成叁维空间中物体的平移和旋转变换、光照计算、剔除与剪切、投影以及光栅化等工作。(本文来源于《南京航空航天大学》期刊2007-01-01)
嵌入式图形处理器论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
提出了一种应用于嵌入式图形处理器(GPU)的实时目标检测算法。针对嵌入式平台计算单元较少、处理速度较慢的现状,提出了一种基于YOLO-V3(You Only Look Once-Version 3)架构的改进的轻量目标检测模型,对汽车目标进行了离线训练,在嵌入式平台上部署训练好的模型,实现了在线检测。实验结果表明,在嵌入式平台上,所提方法对分辨率为640 pixel×480 pixel的视频图像的检测速度大于23 frame/s。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
嵌入式图形处理器论文参考文献
[1].杜慧敏,黄世远,郝武.嵌入式图形处理器Alpha混合单元设计与实现[J].西安邮电大学学报.2019
[2].王晓青,王向军.应用于嵌入式图形处理器的实时目标检测方法[J].光学学报.2019
[3].王利祥.嵌入式图形处理器的研究与设计[J].电子制作.2018
[4].张少锋,田泽,杨峰,王绮卉,赵彬.机载显示系统对嵌入式图形处理器的应用需求[C].第二十届计算机工程与工艺年会暨第六届微处理器技术论坛论文集.2016
[5].王佳.Tile-based嵌入式图形处理器的研究与设计[D].山东大学.2014
[6].许强,陈杰,刘建,王云,胡哲琨.一种适用于嵌入式图形处理器的多端口纹理Cache的设计[J].微电子学与计算机.2013
[7].田兵,吴宁,谭显强.嵌入式图形处理器裁剪引擎的设计[J].计算机与数字工程.2011
[8].杨国东.嵌入式图形处理器的研究与实现[D].山东大学.2010
[9].刘静,吴宁,夏小为.嵌入式图形处理器中几何变换引擎的设计[J].计算机仿真.2010
[10].阙恒.嵌入式图形处理器设计[D].南京航空航天大学.2007