异构并行论文-肖汉,李彩林,李琦,周清雷

异构并行论文-肖汉,李彩林,李琦,周清雷

导读:本文包含了异构并行论文开题报告文献综述及选题提纲参考文献,主要关键词:矩阵转置,图形处理器,开放式计算语言,并行算法

异构并行论文文献综述

肖汉,李彩林,李琦,周清雷[1](2019)在《CPU+GPU异构并行的矩阵转置算法研究》一文中研究指出针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获得了12.26,2.23和1.50的加速比.该算法不仅性能高,而且实现了在不同计算平台间的性能移植.(本文来源于《东北师大学报(自然科学版)》期刊2019年04期)

邓超,钱斌,胡蓉,王凌[2](2019)在《混合EDA求解叁阶段异构并行机装配集成调度问题》一文中研究指出本文提出一种混合分布估计算法(hybrid estimation of distribution algorithm, HEDA)用于求解带载重约束的叁阶段异构并行机集成调度问题(three-stage heterogeneous parallel machine integrated scheduling problem with capacitated constraint, THPMISP_CC),第一阶段为加工阶段,即带释放时间的多工序异构并行机调度问题;第二阶段为带载重约束的运输阶段,即多维背包优化调度问题;第叁阶段为装配阶段.本文研究工件从加工、运输到装配叁阶段的集成调度优化问题.首先,本文构建了THPMISP_CC的数学模型,其优化目标为叁阶段整体最大完工时间(Makespan);然后,提出的HEDA用于优化THPMISP_CC;最后,对算法运用于THPMISP_CC模型的结果进行分析和比较,验证模型的可行性及算法的有效性.(本文来源于《信息与控制》期刊2019年05期)

宋佩涛,张志俭,梁亮,张乾,赵强[3](2019)在《基于CPU-GPU异构并行的MOC中子输运计算并行效率优化研究》一文中研究指出CPU-GPU异构系统为加速全堆芯特征线方法(MOC)精细计算提供了方法和思路。在实现基于CPU-GPU异构系统的二维MOC异构并行算法基础上,提出了性能分析模型,识别了影响异构并行算法并行效率的主要因素;针对识别到的性能影响因素,实现了输运计算与数据传递相互掩盖,提升了异构并行算法的整体并行效率。数值结果表明:程序具备良好的计算精度;数据传递(MPI通信和CPU与GPU之间的数据拷贝)是影响异构并行算法并行效率的主要因素;实现输运计算与数据传递相互掩盖后,程序性能和强并行效率均有所提升;5异构节点(包含20块GPU)并行时,程序整体效率提升达8%,强并行效率从87%提升到95%;相比CPU节点并行计算,4个CPU-GPU异构节点整体性能优于20个CPU节点。(本文来源于《原子能科学技术》期刊2019年11期)

黄兴贵,隆波,皮红梅,睢永平,高畅[4](2019)在《波动方程的差分算法在高性能异构并行计算的实现方法分析》一文中研究指出二维、叁维波动方程的差分算法是一种计算密集型算法,需要采用高性能计算的方法实现,但一般采用单一的同构体系实现并行(如:单核CPU集群多节点并行、CPU多核/多线程并行、GPU加速并行、GPU集群多节点并行等)计算,这些并行模型对于单台工作站/节点机的计算平台来说,浪费了另一类计算资源。作者在近年来的开发实践中,探索出了高性能异构并行计算的开发模型,开发了CPUs+GPUs真正异构并行计算的叁维声波正演模拟软件。通过采用异构并行计算架构OpenCL,统一了不同设备的编程模型和代码,从而降低了代码的维护和调试成本。实践表明计算性能均有不同程度的提高,相对于纯CPUs并行计算性能提高约60%,相对于纯GPU并行计算性能提升约30%。(本文来源于《中国石油学会2019年物探技术研讨会论文集》期刊2019-09-09)

陈富州,程晨,罗洪刚[5](2019)在《密度矩阵重正化群的异构并行优化》一文中研究指出密度矩阵重正化群方法(DMRG)在求解一维强关联格点模型的基态时可以获得较高的精度,在应用于二维或准二维问题时,要达到类似的精度通常需要较大的计算量与存储空间.本文提出一种新的DMRG异构并行策略,可以同时发挥计算机中央处理器(CPU)和图形处理器(GPU)的计算性能.针对最耗时的哈密顿量对角化部分,实现了数据的分布式存储,并且给出了CPU和GPU之间的负载平衡策略.以费米Hubbard模型为例,测试了异构并行程序在不同DMRG保留状态数下的运行表现,并给出了相应的性能基准.应用于4腿梯子时,观测到了高温超导中常见的电荷密度条纹,此时保留状态数达到104,使用的GPU显存小于12 GB.(本文来源于《物理学报》期刊2019年12期)

刘垚[6](2019)在《基于申威众核架构的启发式算法的异构并行研究》一文中研究指出启发式算法广泛地应用于解决各类优化问题,但面对大规模问题时,运行效率受到挑战。“神威·太湖之光”是首台峰值运算性能超过100PFlops的超级计算机,采用了申威众核处理器,能够为启发式算法提供强大的运行平台。申威众核处理器具有独特的异构架构和软件环境,针对这些特点,研究启发式算法的异构并行方法,充分发挥硬件性能,具有重要现实意义。遗传算法和自组织神经网络是两类典型的启发式算法,且具有不同的计算特点。对这两类算法的异构并行化,不仅能显着减少求解时间,而且其研究成果可以互补,算法的模型设计、性能优化方法等对其他启发式算法的异构并行研究具有参考价值。本文的主要工作如下:第一、研究与设计了基于申威众核架构的异构并行遗传算法(swGA),提出了基于动态迁移策略和错峰更新机制的迁移池、基于池的分岛模型、基于分岛模型的叁种二级并行模型,以及蜂窝间基于寄存器通信的数据共享策略。迁移池保留了精英个体,保障了种群多样性;动态迁移策略以种群内差异度为指标判断是否迁入;错峰更新机制降低了池更新的通信开销;蜂窝间数据共享策略,解决了从核间个体难以交叉的问题;还通过双缓冲、向量化等方法进行了优化。与串行算法、定向迁移的分岛模型相比,swGA具有更强的搜索能力和更快的收敛速度;二级模型在单核组内取得了超线性的加速(约76倍),在64主核、4096从核的规模下,与串行算法相比取得高达3500倍的加速。第二、研究与设计了基于申威众核架构的异构并行非支配排序遗传算法II(swNSGAII),提出了基于池的分岛-增强式蜂窝模型、基于寄存器通信的从核间数据共享策略,以及基于该策略的并行非支配排序和拥挤度计算。模型为从核分配了最耗时的非支配排序和拥挤度计算等任务,有效地利用了从核的计算能力;通过该数据共享策略,并行算法克服了算法性能受限于内存带宽的问题,避免了通信方向与流量的不确定性带来的额外开销;还使用了存储优化、向量化等方法进行优化。与串行算法相比,swNSGA-II的解集更具多样性;在一级并行时就取得了超线性加速;二级并行时,单核组内取得超过17倍的加速,在64个主核、4096个从核的规模下,与串行算法相比,取得超过46000的超高加速。第叁、研究与设计了基于申威众核架构的异构并行自组织神经网络(swSOM),提出了基于数据并行的二级并行模型、距离计算与模型更新的矩阵化计算方法、神经元坐标的软件Cache方法。模型为从核分配了最耗时的计算任务,有效地利用了从核的计算能力;距离计算与模型更新被重构为矩阵计算,加速效果显着,提升超过27倍;软件Cache方法,弥补了存储层次缺乏所造成的性能下降;还使用了向量化、双缓冲等方法进行了优化。在聚类问题上,与Matlab和Somoclu相比,swSOM具有更好的训练质量;单核组内取得了超高的超线性加速(923倍),在1个主核、64个从核的规模下,与Somoclu(1个主核)相比,取得了577倍的加速,在128主核、8192从核的规模下,与串行SOM相比,取得了29439倍的超高加速。综上,本文研究了以遗传算法、自组织神经网络为代表的启发式算法在申威众核架构上的异构并行。这些算法取得了理想的加速效果,已加入或正计划加入“神威·太湖之光”工具库,并已纳入下一代E级超算的建库计划。(本文来源于《华东师范大学》期刊2019-05-06)

李显宁[7](2019)在《异构机群系统中序列比对并行算法进展》一文中研究指出简要介绍生物序列比对问题,生物序列比对分为双序列比对和多序列比对两大类,介绍了双序列比对并行算法和多序列比对并行算法的研究现状,并分析它们的主要设计思想及其性能。最后,对异构机群计算环境下序列比对近似并行算法的研究进行简要讨论。(本文来源于《福建电脑》期刊2019年04期)

李雁冰,赵荣彩,韩林,赵捷,徐金龙[8](2019)在《一种面向异构众核处理器的并行编译框架》一文中研究指出异构众核处理器是面向高性能计算领域处理器发展的重要趋势,但其更为复杂的体系结构使得编程难的问题更加突出.针对这一问题,基于开源编译器Open64,提出了一种面向异构众核处理器的并行编译框架,将程序自动转换为异构并行程序.该框架主要包括4个模块:任务划分模块用来识别适合进行加速计算的程序段,实现了嵌套循环的多维并行识别方法;数据布局模块完成数据在主存和SPM之间的布局,实现了数组边界分析和指针范围分析;传输优化模块实现了数据传输合并、传输外提、打包传输、数组转置等多种数据传输优化方法;收益评估模块在构建代价模型的基础上实现了一种动静结合的收益评估方法.并且,基于SW26010处理器,对该编译框架进行了实现,测试结果表明,该编译框架能够实现一些程序以面向异构众核结构的并行变换,且获得较好的加速效果.(本文来源于《软件学报》期刊2019年04期)

李斌[9](2019)在《集装箱码头作业系统层次化、并行、异构与可重构计算模型》一文中研究指出基于计算思维和计算透镜,分析了集装箱码头的装卸作业与调度决策,基于"并行计算"、"异构计算"和"可重构计算"提出了计算物流视角下的集装箱码头作业层次化、并行、异构与可重构计算模型;将计算机科学领域中多种典型计算体系结构的设计思想和运作机制,泛化、迁移、修正、融合和定制到集装箱码头作业系统中,设计了面向此计算模型的混合调度策略,提出了集装箱码头调度新的抽象计算模型与工程解决路径;以某大型集装箱码头为实例,基于集装箱码头作业层次化、并行、异构与可重构计算模型,进行了物流广义计算自动化的设计与性能评估。研究结果表明:采用计算模型能确定码头的集装箱吞吐量上限,实例中约为码头年设计能力的2.75倍;在满负荷情况下,基于等待作业集装箱队列的负载均衡调度策略和基于等待作业船型的负载均衡调度策略均能将大型集装箱干线船舶物流广义计算任务延迟缩短约17 h;在明显作业过载时,前者能将物流广义计算任务延迟减少100~110 h,后者能减少约120 h;在满负荷和作业过载情况下,2种策略均能缩短大型集装箱干线船舶物流广义计算访问存储时间1~2 h,后者在作业过载情况下表现更佳;2种策略都能很好地优先服务重点班轮集合,且有各自对应的适用状况和调度重点,码头管理者可根据具体情况选择适用。(本文来源于《交通运输工程学报》期刊2019年02期)

李安民,计卫星,廖心怡,高建花,谈兆年[10](2019)在《一种面向异构计算的结构化并行编程框架》一文中研究指出随着人工智能时代的到来,异构计算在深度学习、科学计算等领域发挥着越来越重要的作用。目前异构计算系统在应用上的瓶颈之一在于缺少高效的软件开发框架,已有的OpenCL、CUDA等支持GPU、DSP及FPGA的编程框架基于C/C++语言和传统的并行编程方法,导致软件开发效率较低,软件推理和调试困难,难以灵活处理计算设备之间的协作和调度。提出一种面向异构计算平台的基于脚本语言的结构化并行编程框架,提供结构化的并行编程接口,支持计算任务到异构计算设备的映射,便于并行程序的推理和验证。设计并实现了基于遗传算法的结构化调度算法,充分利用异构计算系统的计算能力,提高了异构计算系统的软件开发效率。实验结果表明,提出的编程框架在CPU+GPU平台上实现了相对于单处理器1.5到2.5倍的加速比。(本文来源于《计算机工程与科学》期刊2019年03期)

异构并行论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

本文提出一种混合分布估计算法(hybrid estimation of distribution algorithm, HEDA)用于求解带载重约束的叁阶段异构并行机集成调度问题(three-stage heterogeneous parallel machine integrated scheduling problem with capacitated constraint, THPMISP_CC),第一阶段为加工阶段,即带释放时间的多工序异构并行机调度问题;第二阶段为带载重约束的运输阶段,即多维背包优化调度问题;第叁阶段为装配阶段.本文研究工件从加工、运输到装配叁阶段的集成调度优化问题.首先,本文构建了THPMISP_CC的数学模型,其优化目标为叁阶段整体最大完工时间(Makespan);然后,提出的HEDA用于优化THPMISP_CC;最后,对算法运用于THPMISP_CC模型的结果进行分析和比较,验证模型的可行性及算法的有效性.

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

异构并行论文参考文献

[1].肖汉,李彩林,李琦,周清雷.CPU+GPU异构并行的矩阵转置算法研究[J].东北师大学报(自然科学版).2019

[2].邓超,钱斌,胡蓉,王凌.混合EDA求解叁阶段异构并行机装配集成调度问题[J].信息与控制.2019

[3].宋佩涛,张志俭,梁亮,张乾,赵强.基于CPU-GPU异构并行的MOC中子输运计算并行效率优化研究[J].原子能科学技术.2019

[4].黄兴贵,隆波,皮红梅,睢永平,高畅.波动方程的差分算法在高性能异构并行计算的实现方法分析[C].中国石油学会2019年物探技术研讨会论文集.2019

[5].陈富州,程晨,罗洪刚.密度矩阵重正化群的异构并行优化[J].物理学报.2019

[6].刘垚.基于申威众核架构的启发式算法的异构并行研究[D].华东师范大学.2019

[7].李显宁.异构机群系统中序列比对并行算法进展[J].福建电脑.2019

[8].李雁冰,赵荣彩,韩林,赵捷,徐金龙.一种面向异构众核处理器的并行编译框架[J].软件学报.2019

[9].李斌.集装箱码头作业系统层次化、并行、异构与可重构计算模型[J].交通运输工程学报.2019

[10].李安民,计卫星,廖心怡,高建花,谈兆年.一种面向异构计算的结构化并行编程框架[J].计算机工程与科学.2019

标签:;  ;  ;  ;  

异构并行论文-肖汉,李彩林,李琦,周清雷
下载Doc文档

猜你喜欢