导读:本文包含了高性能并行论文开题报告文献综述及选题提纲参考文献,主要关键词:异构并行计算,OpenCL,加速设备GPU
高性能并行论文文献综述
黄兴贵,隆波,皮红梅,睢永平,高畅[1](2019)在《波动方程的差分算法在高性能异构并行计算的实现方法分析》一文中研究指出二维、叁维波动方程的差分算法是一种计算密集型算法,需要采用高性能计算的方法实现,但一般采用单一的同构体系实现并行(如:单核CPU集群多节点并行、CPU多核/多线程并行、GPU加速并行、GPU集群多节点并行等)计算,这些并行模型对于单台工作站/节点机的计算平台来说,浪费了另一类计算资源。作者在近年来的开发实践中,探索出了高性能异构并行计算的开发模型,开发了CPUs+GPUs真正异构并行计算的叁维声波正演模拟软件。通过采用异构并行计算架构OpenCL,统一了不同设备的编程模型和代码,从而降低了代码的维护和调试成本。实践表明计算性能均有不同程度的提高,相对于纯CPUs并行计算性能提高约60%,相对于纯GPU并行计算性能提升约30%。(本文来源于《中国石油学会2019年物探技术研讨会论文集》期刊2019-09-09)
钟瑜,吴明钦[2](2019)在《一种高性能并行计算架构的FPGA实现》一文中研究指出针对传统的现场可编程门阵列(Field Programmable Gate Array,FPGA)开发方法效率低、不能充分利用芯片逻辑资源等问题,提出了一种高性能并行计算架构。设计了统一的软件、硬件编程模型,并提供FPGA操作系统层级的支持,将部分可重构技术应用于硬件线程的开发,使该架构具备资源管理和复用的能力。同时还设计了软件、硬件协同开发的流程。在开发板ZC702上进行了设计验证,评估了架构的额外资源消耗情况,并以排序算法为例展示了该架构多线程设计的灵活性。(本文来源于《电讯技术》期刊2019年07期)
庞阿源,刘亚洲[3](2019)在《基于高性能并行计算的武器装备混合调度控制方法研究》一文中研究指出传统的武器装备混合调度控制方法抗干扰能力差,控制的武器装备数量很少;为了解决上述问题,基于高性能并行计算研究了一种新的武器装备混合调度控制方法,通过高性能并行计算求出混合调度周期,与基本调度周期进行对比,判断武器装备是否适合混合调度,设置实时调度集和优先调度集,确定实时调度命令,根据得到的调度命令,多次传递武器信息,实现调度工作;通过研究的调度方法在武器装备上标记电子标签,引入计算机技术提取控制指令,在多次审核武器装备信息后,完成武器装备的控制工作;为验证研究的调度控制方法操作效果,与传统调度控制方法进行对比实验,结果表明,基于高性能并行计算的武器装备混合调度控制方法具有很强的抗干扰能力,控制的武器装备数量也远远大于传统控制方法,对于现代武器装备管理有着积极的促进意义。(本文来源于《计算机测量与控制》期刊2019年07期)
闵瑞高[4](2019)在《基于分布式并行计算的高性能演化算法研究》一文中研究指出随着互联网和计算机的普及,人类社会已经进入了信息化时代。伴随着社会的发展,问题规模也逐渐增大,许多实际问题也随之成为大规模优化问题。然而随着问题规模的增大、决策变量的增多,“维度灾难”使很多传统问题的解决方法难以奏效。演化算法作为经典的启发式算法,有着易理解、收敛速度快、搜索能力强的特性,在解决低维小规模问题上表现优异,然而随着问题规模扩大之后,演化算法也同样出现了搜索性能会急剧下降的问题。面对这种情况,当前一种较为流行的解决方案是将合作协同进化框架与演化算法相结合,将大规模优化问题分解为多个规模较小的子问题,取得了非常不错的优化结果。其算法求解过程可以分为问题分解、子问题优化、整合优化结果叁个阶段。大规模优化问题由于其问题的复杂性,其整体求解过程是一个非常耗时的漫长过程。目前,关于如何改进算法以提高问题优化结果的研究有很多,而对于如何降低各个阶段的求解时间、提升大规模优化问题求解效率的研究则非常有限。本文以大规模优化问题为研究对象,采用改进的差分分组算法(Differential Grouping 2,DG2)作为问题的分解方法,合作协同量子行为粒子群优化算法(Cooperative Coevolution Quantun-behaved Particle Swarm Optimization,CCQPSO)作为问题求解阶段的优化算法,通过分析DG2算法的并行化可行性,借助协同进化算法和量子行为粒子群优化算法的天然并行性,实现了大规模优化问题在分解阶段、子问题优化阶段的并行化。本文的主要工作有:1)研究了在共享内存模型中基于OpenMP实现的并行DG2分组算法(Parallel Differential Grouping 2,P-DG2),该算法借助OpenMP框架,将传统的串行DG2分组算法进行并行化改进,使之更加符合并行化程序理念,实现了任意多核的并行加速计算。在IEEE CEC’2013 LSGO测试函数上的实验结果表明,P-DG2算法在不影响分组结果和精度的情况下,有效减少了算法在分组阶段的运行时间,取得了良好的加速比和效率性能。2)研究了在消息通信模型中基于MPI的并行协同进化量子行为粒子群优化算法(Parallel-Cooperative Coevolution Quantun-behaved Particle Swarm Optimization,PCCQPSO)及其相关的改进策略。算法从建立拓扑模型结构切入,采用粗粒度的策略,将协同进化与MPI的进程并行相结合,保证算法的收敛效果。同时,对算法进行进一步改进,引入二次分组策略和邻域通信策略,提升算法的整体性能。实验表明,并行化改进之后的算法在大规模优化问题上具有更好的优化结果。3)研究了演化算法在国产超级计算机神威·太湖之光的并行化,国产CPU采用主从核的构造,计算采用核间并行MPI+核内并行OpenACC(进程并行+线程并行)的方式。在这种混合并行计算模型的框架下,研究了传统演化算法和CCQPSO算法在解决高维度问题情况下的表现,实验表明CCQPSO的性能通过大规模并行得到了进一步的提升,且具有非常好的并行可扩展性。本论文通过结合演化算法和并行计算的一些特性,借助合作协同进化框架,对利用演化算法求解大规模优化问题的分组、求解、计算阶段进行了并行化处理,同时分析了其并行化之后的效率和加速比表现。实验结果表明,并行化之后的结果在保证正确性的同时,极大减少了算法执行的时间,在1000维的大规模优化问题上表现出了良好的性能。同时,在部分问题上,基于分解策略的并行化会提高算法的优化性能,可以同时促进加速和结果的优化。此外,通过在超级计算机神威太湖之光的大规模并行来看,演化算法的分布式并行仍然具有非常好的性能表现,在求解大规模优化问题上仍然有许多非常值得研究的工作。(本文来源于《江南大学》期刊2019-06-01)
张良凯[5](2019)在《基于高性能计算机的大规模场景镜头并行绘制方法》一文中研究指出数字创意产业是以现代信息技术为基础,将文化创意和设计服务融入其中的新兴产业,其主要的应用体现在虚拟现实、产品可视化、动漫和电影特效等方面。目前,数字创意产业的发展主要是向着更具真实感的方向发展,因此叁维场景在规模上增长迅速,光照模型上更加贴近自然,由此造成场景的复杂度越来越大,场景数据的规模可能达到TB级别。这样的渲染对大规模场景数据的存储和视觉特效提出了新的要求。衡量高真实感渲染的两个重要指标分别是渲染质量和渲染速度,国际上对高真实感渲染研究也主要集中在这两个方面。在渲染质量上的研究主要集中在对物理光学的仿真模拟,由于全局光照模型精确地模拟场景中所有可能情况的光照,所以全局光照算法可以生成相片级别的真实感图像,是实现真实感绘制的核心。光路追踪是实现全局光照绘制的基本方法之一,可以计算大部分的全局光照效果,但是由于绘制算法计算量大,进行并行加速是必要的研究工作之一。同时,为了提升渲染质量和营造特效,对场景建模的细腻程度和场景规模也在不断扩大,而一般基于物理的高度真实感渲染中的全局光照计算需要使用整体场景数据,因此大规模场景的绘制会存在内存瓶颈问题。在渲染速度上,并行绘制是对高度真实感渲染的加速主要手段。目前,国内外的研究主要集中在基于GPU或英特尔集成众核架构上的并行绘制,缺乏对异构众核架构的普适处理,同时可扩展性比较低,能处理的场景规模比较受限,因此研究高效、可扩展的高度真实感并行渲染加速对于数字创意产业有重大意义。针对大规模场景镜头渲染存在的数据密集和计算密集两大难题,本文主要提出了多层级任务划分以及相应的多级任务调度,并根据连续帧渲染间任务的数据相关性作出优化,将场景镜头进行动静态划分,加速镜头渲染。本文采用分布式存储场景数据,将渲染计算任务多层级划分进行多级任务调度。同时为了充分利用神威·太湖之光的计算资源,采用平台特有的加速线程库进行计算加速。对于渲染镜头的连续帧之间,有静态场景数据每帧之间一致,因此根据这个特性对节点划分与加载场景数据进行优化。随着场景镜头规模的扩大,绘制的节点数增多,节点的稳定性随着时间开始下降,因此大规模场景镜头的并行渲染必然需要进行容错处理,需要对渲染结果正确性提供进一步保障。本文研究了相关容错处理,以期望在节点出错时发现错误,重启任务后能继续上一次任务进度。(本文来源于《山东大学》期刊2019-05-20)
胡铁伦[6](2019)在《HIE-FDTD高性能并行计算方法在多通带频率选择结构设计中的应用》一文中研究指出频率选择表面(Frequency Selective Surface:FSS)作为空间滤波器,是一种对电磁波有滤波特性的平面周期结构。由于其在军事领域和民事领域的广泛应用,FSS研究已经覆盖了微波、毫米波、红外线等波段。论文的主要工作内容总结如下:(1)介绍了经典电磁数值计算方法即时域有限差分算法(Finite Difference Time Domain:FDTD),继而针对它的劣势,介绍了混合半隐式-半显式(Hybrid-Implcit-Explcit)HIE-FDTD 算法。(2)引入了 Floquet定理及周期边界,通过仿真一个FSS单元,可以得到整个周期阵列的传输特性;针对FSS的栅瓣效应,研究了如何抑制栅瓣的出现;进一步研究了 FSS单元结构和尺寸、单元阵列的周期和排布方式、介质材料的厚度和介电常数、FSS层数,入射波的角度和极化状态等参数对FSS性能的影响;分别设计了单通带和双通带FSS结构,通带对入射角变化时比较稳定,并且完成了了加工测试验证,通带特性与仿真结果吻合较好;进一步地,设计了具有多通带特性的FSS,能实现较大的通带比值。(3)基于高性能并行计算框架JASMIN,开发了基于HIE-FDTD的大规模并行算法,实现的程序具有较高的可扩展性,能在成千上万核数的高性能计算机上进行运算,用于分析有限大规模FSS阵列和周期FSS阵列选频特性之间的区别;并且基于石墨烯材料,实现了太赫兹波段多通带石墨烯FSS的大规模并行仿真设计。(本文来源于《浙江大学》期刊2019-01-18)
黄科佳,李少杰,左尧,蔡文文,李绍俊[7](2018)在《基于并行下载算法和动态缓存池的高性能WebGIS数据存取与显示关键技术研究》一文中研究指出随着互联网的普及和信息技术的不断发展,各种各样的信息数据呈现出海量增长的趋势。数据是GIS系统的血液,同样呈现出纷繁复杂的特点,高效的数据存取、显示模式将大大加速GIS系统的效率,提升用户友好度。目前的Web GIS服务中,由于多用户同时访问、网络带宽资源等因素限制,往往造成Web GIS数据传输、可视化的效率低下。为此,本文提出一种基于并行下载算法和动态缓存池技术的高性能GIS数据并行处理方法。通过对传统单线程串行软件的并行化进行改造,实现了软件对系统资源的最优化利用,从而提升硬件资源利用率、软件的计算效率和整体性能。本模型研究设计了5个模块以流程化的方式实现算法、模型管理,包括数据预处理模块,消息队列准备模块,数据下载控制模块,循环控制模块和地图渲染模块5个流程模块。然后,利用客户端动态内存池LOD加载技术,通过预定义内存块个数和内存块大小,实现内存个数和内存块内容的自适应配置。通过任务消息队列依次出/入队列请求的方法实现高性能的Web GIS数据下载传输和加载,以解决现有技术不支持同步下载Web GIS数据和数据复用的问题。最后,为了进一步说明本模型算法的先进性,还对比分析了本研究算法与传统数据下载模型的效率,发现本研究算法对性能的提升可达到5倍以上,表现出了更加高效的GIS数据存取性能和渲染效果。(本文来源于《地理信息世界》期刊2018年06期)
赵一明,徐瑞娇,罗荣海[8](2018)在《面向国产高性能多核DSP的并行编译器设计》一文中研究指出本文以高性能导弹平台和高分辨对地观测卫星对海量数据、复杂任务的迫切需求为牵引,面向国产高性能DSP的自研体系结构和自主指令集,围绕国产海量信息处理器并行编程工具国产化目标,开展面向国产高性能多核DSP的并行编译技术和支撑工具技术研究。突破多核编译框架设计技术、数据并行编译和运行时设计、计算单元阵列向量化等关键技术,设计并实现了支持多任务多数据运算的基于国产高性能多核DSP的并行编译器。(本文来源于《第十五届中国航天电子技术研究院学术交流会优秀论文集》期刊2018-12-13)
令狐龙翔[9](2018)在《时变多尺度电大区域海面电磁散射高性能并行计算》一文中研究指出关于时变多尺度电大区域海面电磁散射计算及海杂波电磁散射特性研究问题一直是雷达探测领域的热点与难点。主要表现在以下两个方面:第一,不同海情海况、雷达波段、入射角及雷达波束参数使得海杂波具有随机性、多变性及复杂性特点。第二,当高分辨雷达以小擦地角照射到电大区域海面上时,根据电磁散射理论,电大区域海面上方将会产生数百万乃至数千万的散射单元,再加上其实时性使得海杂波时间序列的建模非常耗时且效率低下。本论文基于GPU-CPU异构平台,利用CUDA高性能编程技术,建立时变多尺度电大区域海面电磁散射高性能并行计算模型,系统性研究不同海洋环境参数、雷达参数对海杂波电磁散射特性的影响,为复杂海洋环境下雷达系统的研制、雷达遥感及目标探测提供理论支持。论文主要从以下几个方面展开:1.针对不同雷达波段及入射角,基于GPU-CPU异构平台,利用CUDA高性能编程技术结合迭加法建立时变多尺度电大区域海面叁维几何精细结构。实现不同雷达照射波参数下时变多尺度电大区域海面高性能并行建模。2.基于斜率调制的复合电磁散射理论,提出电大区域海面局部海面分区模型,解决电大区域多尺度海面电磁散射问题。针对高海情,结合白冠覆盖率建立含泡沫覆盖的时变多尺度电大区域海面叁维几何精细结构模型,利用基于斜率调制的复合电磁散射理论及矢量辐射传输理论,建立含白冠覆盖电大区域多尺度海面体-面复合电磁散射模型。最后基于GPU-CPU异构平台结合CUDA建立含白冠覆盖电大区域多尺度海面电磁散射高性能并行计算模型,实现不同雷达参数及海情下电大区域海面电磁散射高性能并行计算与研究。3.当雷达高斯波束照射下不同尺度粗糙面电磁散射,通过波束平面角谱展开、坐标变换及场的矢量迭加理论,结合基尔霍夫近似及小扰动近似,建立高斯波束照射下不同尺度粗糙面电磁散射模型。实现雷达高斯波束照射下不同尺度粗糙面电磁散射计算和分析。与平面波计算结果相比,增加了表示高斯波束的影响的波束因子,与束腰半径,束腰到粗糙面距离,粗糙面参数及入射或散射角有关。4.采用基于面元的复合电磁散射理论,考虑大尺度重力波海浪的调制效应,综合考虑不同雷达参数及入射角下不同尺度海浪对应的散射机制,建立时变多尺度电大区域海杂波时间序列。基于GPU-CPU异构平台,利用CUDA及五种优化策略,建立时变多尺度点区域海杂波高性能并行计算模型。实现高分辨雷达以小擦地角照射下时变多尺度电大区域海杂波时间序列的高性能建模与分析。5.基于以上章节建立的时变多尺度电大区域海面电磁散射模型及海杂波时间序列,系统性研究不同雷达参数及海情海况下时变多尺度电大区域海杂波电磁散射特性,分析海水温度,盐度,海情海况,雷达频率,入射角及方位角等参数对海杂波特性影响。建立时变多尺度电大区域海杂波电磁散射特性评价体系。(本文来源于《西安电子科技大学》期刊2018-12-01)
张海龙,张萌,王杰,冶鑫晨,王万琼[10](2019)在《基于MPI和Taurus高性能计算系统的Jacobi并行迭代算法》一文中研究指出针对Jacobi迭代的海量计算问题,设计了大规模并行计算算法。通过非阻塞通信函数替代阻塞通信函数、采用虚拟进程拓扑方式改进数据的区块划分,并利用高性能集群系统多计算节点协同处理对Jacobi并行迭代进行了尝试。实现了基于MPI的C语言串行与并行算法,利用Taurus HPC分别对串行、并行,单节点、多节点并行算法进行了系统测试。测试结果表明,进程间数据通信效率是影响并行程序性能的重要因素;跨多节点执行对于海量计算任务可显着提高计算速度;合理的数据区块划分有利于处理器的任务调度,可有效提高Jacobi并行迭代算法的执行效率。(本文来源于《吉林大学学报(工学版)》期刊2019年02期)
高性能并行论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
针对传统的现场可编程门阵列(Field Programmable Gate Array,FPGA)开发方法效率低、不能充分利用芯片逻辑资源等问题,提出了一种高性能并行计算架构。设计了统一的软件、硬件编程模型,并提供FPGA操作系统层级的支持,将部分可重构技术应用于硬件线程的开发,使该架构具备资源管理和复用的能力。同时还设计了软件、硬件协同开发的流程。在开发板ZC702上进行了设计验证,评估了架构的额外资源消耗情况,并以排序算法为例展示了该架构多线程设计的灵活性。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
高性能并行论文参考文献
[1].黄兴贵,隆波,皮红梅,睢永平,高畅.波动方程的差分算法在高性能异构并行计算的实现方法分析[C].中国石油学会2019年物探技术研讨会论文集.2019
[2].钟瑜,吴明钦.一种高性能并行计算架构的FPGA实现[J].电讯技术.2019
[3].庞阿源,刘亚洲.基于高性能并行计算的武器装备混合调度控制方法研究[J].计算机测量与控制.2019
[4].闵瑞高.基于分布式并行计算的高性能演化算法研究[D].江南大学.2019
[5].张良凯.基于高性能计算机的大规模场景镜头并行绘制方法[D].山东大学.2019
[6].胡铁伦.HIE-FDTD高性能并行计算方法在多通带频率选择结构设计中的应用[D].浙江大学.2019
[7].黄科佳,李少杰,左尧,蔡文文,李绍俊.基于并行下载算法和动态缓存池的高性能WebGIS数据存取与显示关键技术研究[J].地理信息世界.2018
[8].赵一明,徐瑞娇,罗荣海.面向国产高性能多核DSP的并行编译器设计[C].第十五届中国航天电子技术研究院学术交流会优秀论文集.2018
[9].令狐龙翔.时变多尺度电大区域海面电磁散射高性能并行计算[D].西安电子科技大学.2018
[10].张海龙,张萌,王杰,冶鑫晨,王万琼.基于MPI和Taurus高性能计算系统的Jacobi并行迭代算法[J].吉林大学学报(工学版).2019