多核并行计算论文-万筱钟,廖春梅,匡洪辉,郭少青

多核并行计算论文-万筱钟,廖春梅,匡洪辉,郭少青

导读:本文包含了多核并行计算论文开题报告文献综述及选题提纲参考文献,主要关键词:梯级水电联合优化,多核集群并行计算,中长期,实施流程

多核并行计算论文文献综述

万筱钟,廖春梅,匡洪辉,郭少青[1](2019)在《基于多核集群并行计算框架的中长期梯级水电联合优化方法》一文中研究指出流域梯级水电站联合优化是提升水电站综合效益的重要方法。然而由于梯级水电复杂的运行特性,梯级水电联合运行成为电力系统调度优化中的一大难题。尤其是在中长期时间尺度下的梯级水电优化运行通常由于问题规模大、变量多等因素限制,求解效率低、求解时间长,不能满足实际工程需要。为此,以梯级水电效益最大化为目标,构建了中长期时间尺度下的梯级水电联合优化模型;通过分析该模型优化求解中存在的并行特征,利用MATLAB软件中内嵌的多核集群并行计算模块设计了中长期梯级水电联合优化的实施框架。最后基于某流域梯级水电实际数据构造算例,验证了所提出的求解算法在优化分析上的高效性。(本文来源于《自动化与仪器仪表》期刊2019年11期)

黄炎,王庆宾,冯进凯,谭勖立[2](2019)在《基于OpenMP多核并行算法的垂线偏差快速计算》一文中研究指出针对利用超高阶地球重力场模型计算大范围、高分辨率区域垂线偏差效率低的问题,提出基于OpenMP多核并行技术的数组升维和分区计算方法。实验表明,该方法计算垂线偏差的加速比最高达到5.6倍,显着提高了超高阶垂线偏差的计算效率,也为解决重力场数据处理过程中类似的快速计算问题提供了思路。(本文来源于《大地测量与地球动力学》期刊2019年10期)

张学磊[3](2019)在《基于异构多核架构的动力学蒙特卡洛并行计算研究及应用》一文中研究指出当下,随着计算机体系不断向多核异构结构发展,其计算能力也不断得到提升和突破,计算物理中大规模和高计算量的问题也有了研究的契机。蒙特卡洛法作为非常重要的一种模拟方法,对其并行算法的研究和实现具有重要意义。在此背景下,本论文依托实验室搭建的计算平台,主要研究动力学蒙特卡洛的相关并行计算算法。基于较简单的薄膜生长仿真过程,实现了算法的并行计算仿真,而后又基于更复杂的纳米基底下的嵌段共聚物自组装过程,实现了动力学蒙特卡洛并行计算方法的并行应用。详细来说,本论文的研究工作及成果包括:(1)总结了动力学蒙特卡洛算法目前存在的问题和挑战,其中传统算法单一执行性的特征是实现并行化的主要难点,进而介绍了以时间推进是否同步为区别的两种典型的并行算法思想:混合式异步算法和空事件同步算法。在结合相关文献的总结和对两种算法的伪并行实现及比较后,认为空事件同步并行算法更适合于并行计算,并展开后续研究。(2)基于薄膜生长过程,通过OpenMP指导性编译,引入周期性边界条件等方法实现了算法的并行仿真,将并行计算得到的结果与基础KMC仿真得到的结果进行了对比,验证了算法维持了过程的正确性和动态性。在对并行加速效果进行分析时,注意到了区块划分会增加蒙特卡洛时间推进步长,提出了该优化算法的加速比计算公式。在最高线程60线程的并行计算下,实际加速比能达到37左右。(3)在半导体制造陷入瓶颈,嵌段共聚物自组装技术具有替代前景的背景下,将动力学蒙特卡洛并行算法应用其仿真中,并提出通过统计均值作为不同类别状态的速率近似值的思想,来解决计算全局事件速率总和的难点。(4)同样对嵌段共聚物自组装技术实现了并行仿真,在最高线程64个线程的并行计算下,实际加速比能接近40,并提出了加权图像信息熵的概念验证了算法具有良好的动态性。最后在并行计算加速仿真的条件下,研究了不同仿真条件的改变对纳米基底诱导嵌段共聚物自组装形成的图案的影响和规律。(本文来源于《浙江大学》期刊2019-01-01)

刘哲,李永明,周悦,邹岸新,徐禄文[4](2018)在《基于OpenMP的多核并行技术在电力系统工频电场计算中的应用》一文中研究指出电力输变电系统中的工频电场数值计算对于输变电系统的设计建设至关重要,而传统的方法在Matlab环境下求解叁维电场耗时过多,本文以500 k V特高压输电走廊下电场计算为模型,基于Open MP多核并行环境,采用Matlab和C语言混合编写模拟电荷法的并行算法,既利用了Matlab生成矩阵的便捷性和对数据图像处理的强大功能,又利用了C语言的对于计算的快速编译性以及对于并行计算的可塑性,实现并行加速的效果,为解决数值算法求解叁维工频电场的耗时问题提供计算平台。(本文来源于《软件》期刊2018年03期)

赵辉,孙红艳[5](2017)在《多核并行计算在避雷器试验管理系统中的应用研究》一文中研究指出本文分析了避雷器试验管理系统的设计与实现过程,并应用Open MP技术对系统进行了多核并行计算处理,提高了系统的执行效率,满足了用户在多核环境下的计算需求。(本文来源于《福建电脑》期刊2017年12期)

耿晓中,毛应爽,鲍杰[6](2017)在《多核技术与并行计算在数据结构课程中的引入与实施》一文中研究指出为了确保计算机教育的与时俱进,使学生具备多核技术前沿知识,本文提出将多核技术与并行计算内容引入到《数据结构》教学中。对《数据结构》理论教学大纲进行修改,按章节逐步导入多核与并行编程思想;教学实践证明,新内容的引入激发了学生学习新技术的兴趣,促进了对《数据结构》课程的深入理解和掌握。(本文来源于《时代教育》期刊2017年19期)

李大力[7](2017)在《结构网格高精度CFD高效隐式求解及众核并行计算》一文中研究指出高阶精度格式相比低阶精度格式拥有高分辨率、低色散、低耗散等良好的性质,能够获得更精细的流场结构,对于气动声学、转捩、湍流等复杂流动问题的数值模拟具有重要意义。大规模多尺度复杂几何外形流动问题的高精度CFD模拟计算开销大、求解耗时长,迫切需要发展与之适应的高效隐式求解方法和并行计算技术。传统隐式求解方法多是从低精度CFD中发展而来,时间项Jacobian矩阵的离散和线性化精度通常低于二阶,应用到高精度CFD中时,与高阶空间离散格式不匹配,容易出现收敛缓慢、鲁棒性变差等问题。无矩阵(Jacobian-Free)Newton-Krylov(JFNK)方法巧妙结合了具有超线性收敛性质的Newton类非线性求解方法以及求解大规模稀疏线性方程组的Krylov子空间方法,并可利用传统隐式求解方法作预条件子以提高收敛速度。JFNK方法采用有限差商近似Jacobian矩阵和向量乘积,避免了Jacobian矩阵的直接计算和存储,这对高精度CFD应用尤其具有吸引力。相比传统隐式求解方法,预条件JFNK方法更复杂,在CFD中的高效应用依赖于具体算法实现以及针对特定问题的预条件子选择和算法参数优化等,限制了其在高精度CFD模拟中的应用。当前,高性能众核处理器的兴起以及宽向量处理部件的使用大幅提升了浮点计算性能,但丰富的并行性也对高精度CFD应用的并行性能优化提出了严峻挑战。在拥有数百并行线程的众核处理器上,传统LU-SGS等具有内在强数据依赖特点的隐式线性求解器(预条件子)的共享存储并行可扩展性严重下降,且难以利用宽向量处理部件,迫切需要在研究新型高效CFD求解算法的同时,发展与众核体系结构适应的并行算法。本文基于“天河二号”众核超级计算机以及自主发展的高精度加权紧致非线性格式(WCNS),开展结构网格高精度CFD应用高效隐式求解算法及其并行计算研究,并应用于实际的可压缩气动数值模拟中。主要工作如下:针对结构网格高精度CFD应用,推导出了有限差分形式Naver-Stokes方程的JFNK数值模型,并提出了面向高精度CFD的预条件JFNK求解算法。该算法结合非精确Newton法和重启的广义最小残差(R-GMRES)法,并采用传统求解方法作预条件子。针对自主开发的高精度CFD软件给出了预条件JFNK算法的实现流程,最大程度地重用了原有的求解器和右端项等关键计算模块。采用可压粘性定常流动模拟验证了预条件JFNK算法的正确性验证并做了初步的收敛性评估,基准参数配置下,其求解效率为传统LU-SGS的约2.0到4.3倍。针对高精度CFD中预条件JFNK求解器的高效求解,系统全面地分析了多种预条件(LU-SGS、PR-SGS、Jacobi迭代)及多个关键算法参数(CFL数、最大重启步数、残差迭代收敛相对阈值和绝对阈值)对求解效率和鲁棒性的影响,得出了系列参数优化配置准则,以指导在实际高精度CFD中的高效应用。提出了等效时间步(ETs)这一新的收敛性能度量指标,将JFNK时间步中的非线性函数计算和预处理进行累加,转化为等效的线性求解时间步,从而更客观公正地评估JFNK算法的收敛效率。通过调优,预条件JFNK求解器的收敛速度比传统线性LU-SGS求解器提升了约一个量级。LU-SGS是应用广泛的传统线性隐式求解算法,同时可作为JFNK算法的预条件子,其内在强数据依赖特点导致流水线并行(P_LU-SGS)算法在新型众核平台上的并行扩展性严重下降。本文建立了统一的LU-SGS并行性能模型,并提出了改进的两层流水线并行(TLP_LU-SGS)算法,以充分开发叁维网格LU-SGS计算的并行性。理论分析和测试结果表明,TLP_LU-SGS可有效改善流水线性能,在Xeon CPUs和Xeon Phi上相对P_LU-SGS分别取得了最高约1.3×和3.7×的加速比。结合结构网格CFD的多块特点,进一步提出了块并行的BTLP_LU-SGS算法,在Xeon CPUs和Xeon Phi上的多块算例中相对TLP_LU-SGS又可分别取得最高约2.0×和3.0×的加速比。针对多核、众核的宽向量并行特点,研究了高精度CFD计算热点的深度向量优化。对WCNS-E-5非线性插值计算,通过采用Intrinsics原语的深度向量编程方法结合循环融合、数据布局等优化,在Xeon CPUs上和Xeon Phi上分别获得了约2.0×和4.5×的性能加速。对LU-SGS计算,在P_LU-SGS算法基础上,借鉴超平面并行LU-SGS算法的细粒度数据并行思想,提出了多线程和向量化混合并行的PSIMD_LU-SGS算法。PSIMD_LU-SGS算法能够一定程度上利用宽向量部件实现SIMD加速,并在Xeon CPUs上取得了相比P_LU-SGS算法约2.3×的向量加速比。(本文来源于《国防科学技术大学》期刊2017-06-16)

张纪伟[8](2017)在《水声阵列宽带自适应波束形成的GPU众核并行计算》一文中研究指出针对阵列水声信号处理中典型自适应波束形成方法—MVDR和MUSIC算法的高效GPU并行加速问题,结合波束形成算法设计、GPU体系架构和CUDA(统一设备计算框架-Compute Unified Device Architecture)并行程序实现,研究GPU并行加速算法。在分析两类波束形成算法复杂度及数值算法特征的基础上,结合GPU架构特征开展线程任务划分、存储映射策略制定、CPU/GPU协同计算规划等并行算法设计和实现。具体工作主要包括:1)详细介绍了GPU计算架构与编程环境,总结了CUDA程序性能优化的要点;给出了阵列信号波束形成的概念,对自适应波束形成算法MVDR和MUSIC的相关研究进行阐述,总结了自适应波束形成算法研究现状和波束形成的并行计算研究现状。2)根据MVDR算法原理,设计实现了MVDR算法的C++的串行程序和基于OpenMP的CPU并行程序,根据GPU和CUDA的计算特点,从频点和阵元两个维度,设计并实现了GPU并行算法(CUDA-MVDR),将MVDR算法的串行程序,OpenMP MVDR并行程序,CUDA-MVDR并行程序进行对比实验。在512基元、1000个频点的算例中,MVDR算法的GPU并行计算相对于CPU单线程的并行加速比达到38.37,相对于单CPU结点(16核)OpenMP多线程并行的加速比达到3.08。3)根据MUSIC算法原理设计实现了MUSIC串行程序、基于OpenMP的CPU多核并行程序;针对频点和阵元两个维度,对算法中方位谱计算部分进行并行化,通过线程任务划分、存储映射分配、GPU与CPU协同计算流程设计等,实现了GPU并行算法(CUDA-MUSIC)。将MUSIC算法的串行程序,OpenMP MUSIC并行程序,CUDA-MUSIC并行程序进行对比实验,实验表明MUSIC算法的GPU并行计算相对于CPU单线程加速比为7.25,相对于单CPU结点(16核)OpenMP多线程并行加速比为1.5。(本文来源于《国防科学技术大学》期刊2017-06-01)

陈正生,崔阳,孙大双,李雪瑞,张清华[9](2017)在《GNSS数据多核并行计算的性能分析》一文中研究指出随着在轨运行导航卫星数量的增多,特别是大量连续运行基准站的建设与投入运行,全球导航卫星系统(GNSS)的观测数据的得到了前所未有的剧增,大量的观测数据为GNSS快速计算带来了挑战。近十多年来,计算机中央处理器(CPU)的核心工作频率并未取得显着提升,传统的串行GNSS处理程序无法发挥多核处理器的效能,单纯靠增加处理器核心工作频率来加快数据处理速度的方法,既不经济,效果也十分有限。近年来,为了应对大数据的快速处理问题,先后出现了网格计算、云计算等新型海量数据处理技术,这些技术采用并行处理策略,最大程度的利用已有计算机的效能,来解决单机难以处理的问题,但是传统的GNSS串行程序计算并不能直接使用这些并行的计算资源。本文采用并行处理技术,对GNSS数据处理流程进行并行化设计,在自编的GNSS数据处理软件GNSSer上,对典型的GNSS数据处理应用进行并行编程实现,采用常用的单机多核处理器对并行GNSS处理性能进行了大量的实验分析。实践证明:并行GNSS计算可以更好发挥多核处理器的效能,显着的加快数据处理速度,大大的节约GNSS数据处理时间,且处理器核心数越多,并行计算的加速比就越大。本文试验中,并行计算的加速比最小为1.6,最大为3.3,精密单点定位日解时间提高到3.1秒/个。(本文来源于《第八届中国卫星导航学术年会论文集——S01卫星导航应用技术》期刊2017-05-23)

王铮[10](2017)在《基于Epiphany多核处理器的人脸检测技术并行化计算的研究》一文中研究指出图像目标的监测和辨识一直都是计算机视觉范畴里非常关键的问题。人脸可以作为一个人身份验证的依据,它是人类的主要辨识特征之一。同时,人脸检测也是人机交互领域的重要技术,应用于监控系统、相关图像检索等各个方面。现在,使用最多的人脸检测算法是基于AdaBoost的检测算法。这种检测算法保证了检测的效率和准确率。人脸检测的研究,一直专注于设计新的算法或提高现有方法的准确性。而嵌入式设备资源有限,导致现有的人脸检测方法在嵌入式设备上处理效率低下。因此,人脸检测的效率逐渐成为了人脸检测的关键问题。针对此问题,本文对人脸检测实现了并行化计算,在Parallella平台上,利用集群和Epiphany多核处理器对基于AdaBoost的人脸检测算法进行了并行计算处理,并且设计了并行处理的人脸检测系统。本文从以下几个方面进行研究。首先,指出了人脸检测过程中扫描窗口部分占用极大的系统资源这一弊端,提出了多核并行人脸检测的解决方案。其次,在此基础之上,鉴于视频中每帧图像的分辨率相同,导致每帧图像的检测工作任务相似,本文对并行人脸检测系统进行了优化,对单帧图像检测过程中的相同部分只做一次处理,不再重复计算,从而提高了系统的性能。然后,本文采用MPI技术把单板的并行人脸检测拓展到集群,利用集群进一步提高计算速度。其中集群内每一块开发板都使用多核处理器并行计算。最终,采用Parallella平台实现并行人脸检测系统,Parallella平台包含ZYNQ和多核处理器,其中ZYNQ中的ARM A9处理器运行人脸检测系统,多核处理器协助ARM处理复杂计算。此外,本文对基于Parallella平台的人脸检测的并行计算系统的性能进行了验证。(本文来源于《北京工业大学》期刊2017-05-01)

多核并行计算论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对利用超高阶地球重力场模型计算大范围、高分辨率区域垂线偏差效率低的问题,提出基于OpenMP多核并行技术的数组升维和分区计算方法。实验表明,该方法计算垂线偏差的加速比最高达到5.6倍,显着提高了超高阶垂线偏差的计算效率,也为解决重力场数据处理过程中类似的快速计算问题提供了思路。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

多核并行计算论文参考文献

[1].万筱钟,廖春梅,匡洪辉,郭少青.基于多核集群并行计算框架的中长期梯级水电联合优化方法[J].自动化与仪器仪表.2019

[2].黄炎,王庆宾,冯进凯,谭勖立.基于OpenMP多核并行算法的垂线偏差快速计算[J].大地测量与地球动力学.2019

[3].张学磊.基于异构多核架构的动力学蒙特卡洛并行计算研究及应用[D].浙江大学.2019

[4].刘哲,李永明,周悦,邹岸新,徐禄文.基于OpenMP的多核并行技术在电力系统工频电场计算中的应用[J].软件.2018

[5].赵辉,孙红艳.多核并行计算在避雷器试验管理系统中的应用研究[J].福建电脑.2017

[6].耿晓中,毛应爽,鲍杰.多核技术与并行计算在数据结构课程中的引入与实施[J].时代教育.2017

[7].李大力.结构网格高精度CFD高效隐式求解及众核并行计算[D].国防科学技术大学.2017

[8].张纪伟.水声阵列宽带自适应波束形成的GPU众核并行计算[D].国防科学技术大学.2017

[9].陈正生,崔阳,孙大双,李雪瑞,张清华.GNSS数据多核并行计算的性能分析[C].第八届中国卫星导航学术年会论文集——S01卫星导航应用技术.2017

[10].王铮.基于Epiphany多核处理器的人脸检测技术并行化计算的研究[D].北京工业大学.2017

标签:;  ;  ;  ;  

多核并行计算论文-万筱钟,廖春梅,匡洪辉,郭少青
下载Doc文档

猜你喜欢