同构多核处理器论文-许雍祯,陈香兰,李曦,周学海

同构多核处理器论文-许雍祯,陈香兰,李曦,周学海

导读:本文包含了同构多核处理器论文开题报告文献综述及选题提纲参考文献,主要关键词:同构多核处理器,任务调度,分簇混合调度,查找算法

同构多核处理器论文文献综述

许雍祯,陈香兰,李曦,周学海[1](2014)在《基于同构多核处理器的任务调度》一文中研究指出随着现代应用对计算机性能要求的提高,计算机主频不断提升.由于功耗和半导体工艺的限制,仅靠提高单核主频难以继续维持"摩尔定律",同构多核处理器(Homogeneous Multi-core)应运而生.在同构多核处理器的支持下,一个芯片汇集多个地位对等、结构相同的通用处理器核,以最小的代价满足了提高系统性能、负载均衡、处理器容错的需要.并行体系结构需要结合与之适应的软件实现性能效益的倍增.本文从操作系统层面,针对处理器结构的变化,研究并实现多核任务调度.系统采用混合调度策略,簇间独立调度,簇内统一调度.从调度模式、调度算法、分配算法、调度时机等方面详细分析了多核调度的原理和实现机制.最后通过模拟实验证明功能正确性及算法可调度性.(本文来源于《计算机系统应用》期刊2014年11期)

王宇[2](2013)在《基于同构多核处理器平台的高质量H.264并行解码器设计实现》一文中研究指出H.264是由ITU-T和MPEG组织联合开发的数字视频标准,该标准较以前的标准能够大幅提高图像压缩率,能够通过较低的码率提供较高的图像质量。随着近年来高清视频应用的广泛普及,H.264标准也得到广泛的应用。为了满足H.264标准复杂度较高的运算需求,使用多核处理器进行高清视频编解码处理成为一种在高清视频应用领域中的最新潮流。本文针对H.264高清图像视频的实时解码需求,研究了一种基于同构多核处理器平台的高质量并行解码算法。该算法首先针对图像序列中的不同图像帧实现了基于帧序列结构的帧级并行熵解码设计,利用不同帧之间熵解码过程的可并行性,来实现多帧图像并行熵解码,有效的提高了解码图像序列的解码效率,减小解码时延。其次针对一帧图像的所有宏块行实现基于功能模块的并行重建算法,这种基于任务划分的行级并行重建设计有效的提高了解码流程的并行度和解码效率,有效避免了流水线中核间数据的访问冲突。另外,针对解码流程中时耗较大的环路滤波环节,通过对宏块滤波时的依赖关系,实现多个宏块的并行滤波处理,对行级并行算法进行更深层次上的再优化设计。并通过在宏块层面上对边缘滤波顺序的调整,进一步提高宏块滤波的并行度,有效解决了解码过程的性能瓶颈,有效提高了整体的解码效率。实验结果表明,在同构多核处理器平台TILEPro64上,利用16个处理器核实现本并行解码算法,并利用平台所带的优化工具对解码程序进行优化后,可以实现1080P全高清码流的实时解码,并行加速比最高达到8.15。(本文来源于《浙江大学》期刊2013-02-01)

袁龙,杨频,梁刚,李驰云[3](2013)在《一种基于同构多核处理器的动态节能调度算法》一文中研究指出在节能计算系统中节能调度是一个重要的研究方向。目前针对节能调度的研究中,多从动态电压频率调节(DVFS)的角度进行。但是随着芯片制造工艺的改进,处理器核心电压越来越低,所能调节的电压范围越来越小,通过DVFS技术实现节能遇到了理论上的瓶颈。提出了一种基于同构多核处理器的动态节能调度算法。在系统负载较轻的情况下,通过将系统任务分配到较少的处理核心上而使其他处理核心处于休眠状态来达到动态节能的效果。实验表明该算法具有较好的节能效果。(本文来源于《计算机工程与应用》期刊2013年02期)

王艳[4](2012)在《同构多核处理器的实时混合调度算法研究》一文中研究指出近年来,多核处理器因其高性能、低功耗的特点在实时系统中得到了广泛应用。处理器架构的转变,给实时操作系统中任务调度的研究带来了新的挑战。本文对多核混合调度算法进行了深入研究。纯局部调度不能充分利用核的剩余处理能力,同时全局调度因为频繁迁移造成开销过大,针对上述的问题,提出了一种改进的混合调度算法,并对其利用率进行了分析。另一方面,考虑到共享高速缓存对调度的影响,在软实时应用的背景下,提出了一种面向共享缓存改进的多核混合调度算法。本文的具体研究如下:首先,本文在典型全局调度算法EDF-US[1/2]的基础上提出了采用分簇策略的混合调度算法。该算法对同构多核处理器中的多个核平均分组,令同一个分组中的处理器核为一个处理器簇集。将待调度的任务按利用率从大到小排列,基于最差适应算法将任务分配到各个处理器簇集,并保证每个簇集内利用率大于1/2的任务不超过簇集内的核数。任务分配后在各个簇集内使用全局EDF-US[1/2]调度算法,调度过程中,任务不允许在各个簇集间迁移。本文给出了采用分簇策略的混合调度算法的利用率下界,并分析比较了该混合调度算法与全局调度算法和局部调度算法的性能。其次,为了减小调度过程中共享高速缓存的抖动次数,提出了一种改进的混合调度算法。通过建立有任务依赖的任务模型,采用启发式算法将存在依赖的任务分配到同一个共享二级缓存的处理器簇集;并在处理器簇集内鼓励这些任务共同调度。仿真研究表明改进算法相比于原算法可以使共享二级缓存的命中率得到提高,从而提高调度的效率。(本文来源于《湖南大学》期刊2012-05-10)

闵银皮[5](2012)在《同构通用流多核处理器存储部件关键技术研究》一文中研究指出人们对处理器不断增长的应用需求促进处理器体系结构的不断发展,也促使新型处理器体系结构的诞生。多核流处理器是针对流式数据处理和流应用的新型多核处理器,以数量众多的简单核构成。其对于计算密集型应用,数据吞吐率大,资源利用率高,但是对于访存密集型和稀疏类应用性能较差。传统多核结构适用于访存密集型和稀疏类应用,然而对于流应用,其Cache结构不能高效捕获流应用的数据局部性。为了满足流应用与传统多核应用的综合需求,为了实现多核流处理器与传统多核处理器的融合,我们提出了同构通用流多核处理器体系结构:片内集成多个同构的流多核,流多核可根据具体应用配置为传统多核或流多核的一部分。传统多核与流多核主要的区别在于访存部件,前者是以Cache结构为主的片上缓存结构,后者则是由寄存器文件和片上便签存储器构成。通过配置流多核内部的共享的片上存储资源,调节便签存储器和Cache结构所占的比例,实现同构通用流多核处理器对多种应用需求的适用性。其中Cache结构针对传统多核的应用,解决其数据上的时间和空间局部性,便签存储器主要捕捉流应用中数据的生产者-消费者局部性。本课题对流多核体系结构访存部件关键技术进行了深入研究,主要工作和创新点包括:1、提出了一种可配置的片上共享SPM/L2Cache结构。同构通用流处理器的应用范围包括传统应用和流应用,其基本组成单元流多核面向不同应用时可分别按片上SMP执行模式和SIMT执行模式运行。在不同的运行模式下对片上共享存储结构进行合理配置,以满足处理器对存储部件的需求。2、设计了针对流多核片上缓存结构特点的数据一致性维护协议。流多核一级私有Cache是写穿透策略,二级共享Cache的写策略是写回,在此基础上,通过作废被修改的Cacheline的拷贝来维护两级缓存之间数据一致性。3、设计了流核心私有的一级数据缓存。在Microblaze软核Cache模块的基础上,通过数据宽度64位扩展和增加支持一致性维护的逻辑电路,完成了流多核架构中的最内层缓存结构的设计。4、基于Xilinx公司的软件开发平台下,对流多核存储部件的关键逻辑设计进行了行为仿真,并进行了一定的性能分析。验证结果显示所有设计均实现了预定的功能,同时性能分析显示了本文设计的有效性。(本文来源于《国防科学技术大学》期刊2012-03-01)

王颖锋,刘志镜[6](2011)在《面向同构多核处理器的节能任务调度方法》一文中研究指出对于运行在同构多核处理器上的周期性硬实时任务,设计了一个基于动态电压调节的节能调度方法。该方法首先将计算任务按照周期数降序排序并基于计算任务调度长度最短的原则安排任务映射。然后将各个处理核上具有最小通讯时间的计算任务设置为最后执行的计算任务而其它计算任务顺序保持不变。在初始映射中所有计算任务都被分配最高频率的情况下,每个处理核上的计算任务在执行时间扩展过程中确定最佳的计算任务顺序。基于IntelPXA270的功耗模型,以几个随机任务集作实验。结果表明提出的方法能够有效地降低多核处理器的能量。(本文来源于《计算机科学》期刊2011年09期)

管辉[7](2009)在《基于同构多核处理器的H.264并行解码算法研究》一文中研究指出视频压缩是多媒体通信领域关键支撑技术之一,对多媒体技术的应用与发展起到至关重要的作用。由于广泛应用于高清领域,H.264/AVC在高分辨率下的实时解码实现对处理器计算能力提出了很大的挑战。不过随着处理器多核架构的发展,在多核环境下并行解码就成为了一种有效的方式。但是由于H.264较高的算法复杂度,以及多核环境下复杂的核间通信与任务调度,使得并行化解码算法极具挑战性,在学术研究和实际应用中都成为研究的焦点。目前已有的H.264并行解码算法中,大部分只是关注于并行加速比,而对算法的实时性、负载均衡以及可扩展性等问题却没有进行综合性研究。本文的研究重点就是如何综合考虑各方面因素,完成并行解码方案的设计。本文根据H.264视频压缩标准的特点,分析了解码算法的并行性,提出了基于功能并行与数据并行的混合型并行策略;使用自适应宏块组机制解决了高分辨率下频繁调度引起性能损耗的问题;设计了基于条件矩阵和调度队列的动态任务调度机制,有效地控制了负载均衡,并且完成了算法理论加速比的分析与公式推导,针对一级流水线造成的性能瓶颈进行了串行扩展的分析。本文在TILE64同构多核处理器平台上完成了对并行解码算法的移植实现,并对其关键函数进行了代码级优化。实验的结果表明,本文提出的多核并行解码方案高效可行,能取得比较理想的加速比,且负载均衡控制良好,同时具有非常好的实时性和可扩展性。(本文来源于《哈尔滨工业大学》期刊2009-12-01)

于俊清,李江,魏海涛[8](2009)在《基于同构多核处理器的H.264多粒度并行编码器》一文中研究指出H.264码率低和视频质量高的优越性能以增加编码计算的复杂度为代价,如何开发适用于多核处理器平台的并行编码算法是提高其编码速度的重要研究内容,对于满足高清视频实时传输和大规模共享具有十分重要的意义.利用H.264开源编码器项目X264,在片级和数据级并行编码算法的基础上,通过分析图像帧之间的参考关系,提出并实现了B帧个数可变的帧级并行算法;根据宏块之间的参考关系,设计了一种类似流水线的宏块级并行方法;基于Intel同构多核平台,提出融合帧级、片级、宏块级和数据级4种不同粒度的并行编码方案,开发了H.264多粒度并行编码器.实验结果表明,在码率增加不大的情况下,H.264多粒度并行编码器可以很好地提升编码加速比,视频编码质量符合高质量的要求.(本文来源于《计算机学报》期刊2009年06期)

庞宏亮[9](2007)在《基于NiosⅡ的同构多核处理器设计与FPGA实现》一文中研究指出将多个处理器核集成到一块芯片上以提高系统芯片的整体性能已经成为下一代SoC (System On Chip)设计的发展趋势,而各处理器核之间通信效率的提高又成为多处理器芯片设计的关键。目前的嵌入式多核处理器芯片设计多采用单总线结构,各处理器核之间相互独立,而随着系统中模块数目的增加,各模块之间的通信效率随之降低,进而影响系统的整体性能。针对这一问题,本文采用二级片上总线架构,设计了一款同构多核处理器芯片,并提出了一种新的处理器核间通信机制,通过这一机制实现了各处理器核之间的高效通信,提高了嵌入式多核处理器芯片的整体性能。本设计基于IP复用技术,具有两级总线架构:局部总线负责处理器核与局部存储器之间的通信;全局总线实现处理器核对共享模块的访问,两层总线通过总线桥连接。本设计由四个局部处理器子系统和共享模块(共享存储器、通信控制器、资源管理器)组成,每个处理器子系统具有相同结构,包括处理器核与局部存储器。处理器核通过访问通信控制器对其他处理器核发起通信请求,本文采用固定优先级法设置通信优先级。各处理器核之间采用主从方式进行任务调度。系统通过资源管理器对共享模块进行管理,从而解决了各处理器核对共享模块访问的冲突问题。本设计使用VHDL语言在Altera公司Stratix-Ⅱ系列的EP2S130型号的FPGA中实现,并对两级总线和各模块进行了功能仿真。与同类芯片相比,由于该款处理器的层级结构和独特的运行机制使其在具有多任务和并行性的同时,具有较高的通信效率,并且对外部事件响应的实时性也显着增强。(本文来源于《东北大学》期刊2007-12-10)

同构多核处理器论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

H.264是由ITU-T和MPEG组织联合开发的数字视频标准,该标准较以前的标准能够大幅提高图像压缩率,能够通过较低的码率提供较高的图像质量。随着近年来高清视频应用的广泛普及,H.264标准也得到广泛的应用。为了满足H.264标准复杂度较高的运算需求,使用多核处理器进行高清视频编解码处理成为一种在高清视频应用领域中的最新潮流。本文针对H.264高清图像视频的实时解码需求,研究了一种基于同构多核处理器平台的高质量并行解码算法。该算法首先针对图像序列中的不同图像帧实现了基于帧序列结构的帧级并行熵解码设计,利用不同帧之间熵解码过程的可并行性,来实现多帧图像并行熵解码,有效的提高了解码图像序列的解码效率,减小解码时延。其次针对一帧图像的所有宏块行实现基于功能模块的并行重建算法,这种基于任务划分的行级并行重建设计有效的提高了解码流程的并行度和解码效率,有效避免了流水线中核间数据的访问冲突。另外,针对解码流程中时耗较大的环路滤波环节,通过对宏块滤波时的依赖关系,实现多个宏块的并行滤波处理,对行级并行算法进行更深层次上的再优化设计。并通过在宏块层面上对边缘滤波顺序的调整,进一步提高宏块滤波的并行度,有效解决了解码过程的性能瓶颈,有效提高了整体的解码效率。实验结果表明,在同构多核处理器平台TILEPro64上,利用16个处理器核实现本并行解码算法,并利用平台所带的优化工具对解码程序进行优化后,可以实现1080P全高清码流的实时解码,并行加速比最高达到8.15。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

同构多核处理器论文参考文献

[1].许雍祯,陈香兰,李曦,周学海.基于同构多核处理器的任务调度[J].计算机系统应用.2014

[2].王宇.基于同构多核处理器平台的高质量H.264并行解码器设计实现[D].浙江大学.2013

[3].袁龙,杨频,梁刚,李驰云.一种基于同构多核处理器的动态节能调度算法[J].计算机工程与应用.2013

[4].王艳.同构多核处理器的实时混合调度算法研究[D].湖南大学.2012

[5].闵银皮.同构通用流多核处理器存储部件关键技术研究[D].国防科学技术大学.2012

[6].王颖锋,刘志镜.面向同构多核处理器的节能任务调度方法[J].计算机科学.2011

[7].管辉.基于同构多核处理器的H.264并行解码算法研究[D].哈尔滨工业大学.2009

[8].于俊清,李江,魏海涛.基于同构多核处理器的H.264多粒度并行编码器[J].计算机学报.2009

[9].庞宏亮.基于NiosⅡ的同构多核处理器设计与FPGA实现[D].东北大学.2007

标签:;  ;  ;  ;  

同构多核处理器论文-许雍祯,陈香兰,李曦,周学海
下载Doc文档

猜你喜欢