大规模并行系统论文-周围,张维,唐俊,王强

大规模并行系统论文-周围,张维,唐俊,王强

导读:本文包含了大规模并行系统论文开题报告文献综述及选题提纲参考文献,主要关键词:大规模多输入多输出,信号检测,并行共轭梯度,比特对数似然比

大规模并行系统论文文献综述

周围,张维,唐俊,王强[1](2019)在《大规模MIMO系统中的并行共轭梯度软输出信号检测算法》一文中研究指出在大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统中,当接收天线数远远大于发送天线数时,通信信道渐近正交,传统的最小均方误差(Minimum Mean Square Error,MMSE)检测算法能够获得线性近似最优性能,但随着收发天线数增加,MMSE检测算法涉及到高维的矩阵求逆运算,难以应用在实际生活中。因此,文中提出了一种低复杂度的并行共轭梯度软输出检测算法,该算法对传统的共轭梯度(Conjugate Gradient,CG)法进行改进,并行求解共轭方向和优化步长,在提高算法检测性能的同时还加快了算法的收敛速度;然后利用信道编译码中的比特对数似然比近似算法求解出软信息,进一步提升检测算法的性能。通过理论定量地分析了算法的复杂度,并通过仿真实验对不同检测算法在不同判决方式下的误码率性能和收敛速度进行了研究,结果表明:所提出的并行CG软输出检测算法在复杂度降低的情况下,仅需要少量次数的迭代,便能以较快的收敛速度达到近似最佳的MMSE线性检测性能。(本文来源于《南京邮电大学学报(自然科学版)》期刊2019年05期)

宋丽翠[2](2019)在《大规模稀疏线性系统的并行求解方法研究》一文中研究指出目前,大规模稀疏线性系统的求解是许多科学计算和工程技术的重要组成部分。在一些以直接法为基础的稀疏线性系统求解任务中,稀疏线性叁角系统的计算是求解大规模稀疏线性系统的核心环节。因此,快速求解稀疏线性叁角系统成为了解决整个科学计算问题的关键。近几年,随着科学计算任务的规模和复杂度不断提高,稀疏线性叁角系统的规模和复杂度也越来越大,导致所需处理的数据量骤增。然而,已有的求解方法均受限于稀疏线性叁角系统求解的传统观点,即某一个变量的求解必须等到其所有前驱变量求解完成之后才能开始。这种方式不仅限制了求解时能够达到的任务并行度,无法充分利用众核处理器丰富的并行硬件资源。而且,线程间频繁的数据传递使同步开销较大,甚至抵消了并行计算技术带来的优势。针对现有方法存在的问题,本文提出一种基于部分值相加的并行求解算法。该方法首先并行计算变量的部分值,然后把变量的所有部分值相加得到变量的最终值。由于变量计算时无需等待所有前驱变量完成计算,大大提高了求解并行度和计算速度。在本文工作中,基于CUDA计算平台实现了并行求解算法。该算法把表示变量求解顺序的关联图分解成多个子图,每个线程计算子图的一层,充分利用了GPU丰富的并行计算资源。其次,为了减少存储器访问对算法性能的影响,充分利用了全局内存容量大及共享内存访存延迟低的特点,对本文提出的并行求解算法进行了优化。实验结果表明,与调用cuSPARSE库的求解算法以及无同步并行求解算法的计算时间比较,本文并行算法的计算速度平均提高80%,最大提高99%。在保证计算精度的前提下,大大提高了稀疏线性叁角系统的求解速度。(本文来源于《华北电力大学》期刊2019-03-01)

闫华,汪贻生,王锐淇,刘波,郭立卿[3](2019)在《基于GPU的大规模多阶段任务系统可靠性并行计算方法》一文中研究指出针对大规模多阶段任务系统(phased-mission system,PMS)的可靠性求解,引入并行计算思想,通过分析传统的一致化方法(uniformization method,UM),基于Nvidia提出的CUDA(compute unified device architecture)架构,实现了基于图形处理器(graphics processing unit,GPU)的UM并行算法(GPU-UM),并采用合并访问和共享内存技术,提高了GPU中数据负载的利用率;PMS中不同阶段参与任务的设备及其数量通常会发生变化,导致阶段间依赖性处理困难。通过对新设备加入、已有设备暂时退出任务或完全退出任务等3种基本情况的分析,提出了阶段间状态映射机制,实际中的阶段变化情况更加复杂,可综合上述3种基本情况进行处理。通过算例对比了GPU-UM、CUDA-UM、传统UM和Krylov子空间等4种算法的计算时间和可靠性结果,分析表明GPU-UM算法的计算耗时优于其他方法,且结果精度也能满足可靠性计算需求;同时,通过对比分析UM算法和Krylov子空间算法与仿真方法的结果误差,表明提出的阶段间映射机制能够正确处理PMS中阶段间的复杂依赖关系。(本文来源于《系统工程与电子技术》期刊2019年01期)

邢翔[4](2016)在《大规模应用软件系统编译过程的并行算法设计与优化》一文中研究指出大规模应用软件系统由于其规模大、程序文件多,导致软件系统的编译过程特别耗时。特别是在软件系统开发和升级过程中,由于需要频繁进行软件系统集成,从而使得系统的编译耗时严重影响软件研发效率。目前,国内外在设计软件系统的编译方法方面很少考虑到编译过程的并行实现。本文通过分析软件系统程序文件的设计构造,提出了根据程序文件间依赖关系实现系统编译过程并行化的方法:(1)对软件系统的程序文件结构进行分析,设计出软件系统程序文件间依赖关系的分析算法,构造软件系统的依赖关系有向图;(2)通过有向图的存储方式实现图的层次构造,生成系统程序文件可以并行编译的分层结果;(3)生成系统程序文件的分层编译脚本,并对编译脚本进行参数配置,实现系统编译过程的并行化;(4)根据程序文件在层间分配和层内动态调度上对并行效率的影响,对并行化方案进行优化调整。文中以WRF模式和YHGSM模式为例进行并行化编译实验,这两个模式系统都自带一定程度的简单并行化编译方式。通过并行化编译实验表明,在不同进程数下,WRF模式和YHGSM模式的编译时间相对于其原先编译方式所耗时间大幅度减少,编译效率得到明显提高,两模式的优化方案也取得了较好的改善效果。基于有向图理论,依据程序文件依赖关系对程序文件进行分层,实现软件系统编译过程并行化的研究还处于初级阶段。国内外还没有比较成熟的设计方案,在实际应用上更是少见,因此对该领域的研究具有重要的前瞻性,对软件系统编译方法的设计有重要意义。(本文来源于《国防科学技术大学》期刊2016-11-01)

杨海涛,张传斌,阮镇江,徐飞[5](2017)在《大规模云同步归集数据系统的异步并行优化》一文中研究指出国民经济非垂直管理行业或领域建立大数据中心,需要配备能大规模云同步归集行业数据的软件系统,"行业数据云通用的同步枢纽与大数据联合体平台"(GSMS)就是为此而研制的。GSMS主要用于通过互联网大规模同步采集各地异构自治系统(或设备)的业务或事实数据并加以开发应用。在实际应用中,当众多GSMS客户线程各自并发地向GSMS数据中心同步数据时,所产生的大规模数据同步会话将汇聚在GSMS服务端,从而形成处理瓶颈。此外,同步会话全程串行的锁步机制也会制约大规模数据同步归集的性能。为此,提出并实现了一种异步并行化改进GSMS系统方案:将服务端高时耗计算环节从数据同步串行锁步过程中分离出来,为其引入基于多道消息队列中间件的异步并行处理机制,并提供相应的松弛同步事务保障措施。实践表明,正确地实现这种异步并行处理能有效提升服务端处理速度并满足同步系统的可靠性和一致性要求。(本文来源于《计算机工程与应用》期刊2017年02期)

徐政,李宁璨,肖晃庆,董桓锋,陆韶琦[6](2016)在《大规模交直流电力系统并行计算数字仿真综述》一文中研究指出论述了大规模交直流电力系统并行计算数字仿真方法。首先,介绍了4种可并行计算的电力系统数字仿真工具,对各自特点和适用性进行了分析。其次,对比研究了基于频率响应的等值方法、Ward等值方法以及基于物理等效的动态等值方法等3种电力系统等值方法,并分析了各自的优缺点。然后,从模型转换与对应、元件布局与连接以及子系统划分与分核3个方面,详细研究了基于PSCAD/EMTDC仿真工具的交直流大系统并行计算方法。同时,全面分析了基于RT-LAB的大规模交直流电力系统并行计算方法,并对系统的初始化进行了详细分析。(本文来源于《电力建设》期刊2016年02期)

徐得超,赵敏,江涵,李亚楼[7](2016)在《用于大规模电力系统机电暂态实时仿真的并行网络拓扑算法》一文中研究指出为在大规模电力系统机电暂态实时仿真中模拟厂站任意开关操作,提出了一种并行网络拓扑算法。算法首先定义一种电网主拓扑结构,并在此结构上应用基于优化边界表的网络分割算法,使得大量含有开关/刀闸的厂站主接线能完整地分配在子网中;然后在此基础上实现了一种基于消息传递接口(MPI)的电网并行拓扑算法,并定义了拓扑开关变位和断线故障之间的转换逻辑,以实现与机电暂态并行仿真程序集成。此算法没有增加已有机电暂态并行算法联络系统的复杂性,而是使厂站拓扑分析并行分布在子网中;同时为了加快拓扑分析与电网求解效率,使用了局部变化拓扑、导纳矩阵局部修改、部分因子分解技术。对被划分为14个子网的17984母线大电网案例测试表明:在Intel至强处理器E5450计算机上,并行拓扑算法能够获得超过19倍的超线性加速效果,实时模拟变电站运行而无需修改电网模型,总体效率能够满足实时仿真要求。(本文来源于《高电压技术》期刊2016年01期)

宋炎侃,陈颖,黄少伟,张节潭,杨立滨[8](2015)在《大规模电力系统电磁暂态并行仿真算法和实现》一文中研究指出随着电力系统的发展,传统电力系统逐步演化为大规模交直流混联的复杂电力系统。设计高效、快速的大规模电力系统电磁暂态并行仿真器,成为大规模电力系统电磁暂态仿真的研究重点。首先讨论了传统粗粒度并行方法面对大规模电力系统电磁暂态仿真加速的局限;进而通过"平均化"的变流器建模方法改进了传统电磁暂态EMTP算法,通过"向量化"的细粒度并行计算方法,在新型计算设备GPU上实现了大规模电力系统电磁暂态仿真的加速;最后讨论了大规模复杂电力系统仿真的发展方向,并提出了用于大规模电力系统实时仿真的异构并行计算平台。(本文来源于《电力建设》期刊2015年12期)

周红珊[9](2015)在《基于GPU的大规模电力系统电磁暂态仿真矩阵指数并行算法研究》一文中研究指出电磁暂态仿真主要用于捕捉系统中的快动态过程,它需要采用详细的元件模型和较小的仿真步长才能准确刻画,具有较大的仿真规模和计算量。与此同时,跨区域互联电网的规模不断扩大,分布式发电能源的广泛接入,以及不同时间尺度特性的新型电力设备的大规模接入,使得电磁暂态仿真面临新的问题与挑战,计算速度受到更大限制。为了快速准确估测系统运行状态,对仿真程序的计算效率提出了更高的要求,提高电磁暂态仿真程序计算速度成为当务之急。GPU是一种众核并行处理器,拥有巨大的计算能力和高存储带宽,基于GPU的电磁暂态仿真并行算法研究具有很大的潜力。本文提出了一种基于GPU的大规模电力系统电磁暂态仿真的矩阵指数并行算法。本文的主要工作如下:1)介绍了矩阵指数积分算法的基本原理,并将其与几种传统的数值积分算法进行了比较分析,说明了矩阵指数算法具有良好数值精度和数值稳定性,同时展现了矩阵指数算法模型的数据高度并行性,以便进行并行算法设计;2)重点分析了并行算法设计中最为重要的内核函数的定义、优化等问题,并针对矩阵指数算法中仅涉及矩阵向量间运算特性,介绍了各种高性能BLAS函数库以及CUDA提供的面向稠密矩阵CUBLAS库以及面向稀疏矩阵CUSPARSE函数库;3)提出了基于GPU的大规模电力系统电磁暂态仿真矩阵指数并行算法。以测试风电场系统为算例进行了算法研究。设计了完全在CPU上计算的CPU版本程序、在CPU和GPU上异构并行计算的CPU+GPU版本程序以及商业仿真软件MATLAB/SimPowerSystems仿真的MATLAB版本程序。分析比较了各版本程序消耗的时间,GPU版本程序消耗时间最小,验证了所提算法的准确性与高效性。(本文来源于《天津大学》期刊2015-12-01)

罗彬,李刚,苗树敏,程春田,吴琛[10](2015)在《大规模电力系统潮流转移比多核并行批处理方法》一文中研究指出实现各类预想故障下潮流转移比快速仿真分析是电网安全稳定运行的重要保证。针对现有实际运行方式中潮流转移分析困难问题,提出大规模电力系统潮流转移比多核并行批处理方法。该方法基于广泛使用的商业大系统分析工具,在参数解析分类、故障自动设置及结果解析的基础上,引入深度优先搜索(depth first search,DFS)算法进行孤立节点和孤岛区域检测以保证网络完整性,结合潮流计算合理性的自动判别以实现潮流转移比的批处理分析;同时在多核环境下,构建基于Fork/Join的并行框架,采用"分治模式"递归分解计算任务,从而实现分析方法的多核并行。算例仿真和在云南电网的实际应用验证了所提方法的有效性和快速性。(本文来源于《中国电机工程学报》期刊2015年21期)

大规模并行系统论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

目前,大规模稀疏线性系统的求解是许多科学计算和工程技术的重要组成部分。在一些以直接法为基础的稀疏线性系统求解任务中,稀疏线性叁角系统的计算是求解大规模稀疏线性系统的核心环节。因此,快速求解稀疏线性叁角系统成为了解决整个科学计算问题的关键。近几年,随着科学计算任务的规模和复杂度不断提高,稀疏线性叁角系统的规模和复杂度也越来越大,导致所需处理的数据量骤增。然而,已有的求解方法均受限于稀疏线性叁角系统求解的传统观点,即某一个变量的求解必须等到其所有前驱变量求解完成之后才能开始。这种方式不仅限制了求解时能够达到的任务并行度,无法充分利用众核处理器丰富的并行硬件资源。而且,线程间频繁的数据传递使同步开销较大,甚至抵消了并行计算技术带来的优势。针对现有方法存在的问题,本文提出一种基于部分值相加的并行求解算法。该方法首先并行计算变量的部分值,然后把变量的所有部分值相加得到变量的最终值。由于变量计算时无需等待所有前驱变量完成计算,大大提高了求解并行度和计算速度。在本文工作中,基于CUDA计算平台实现了并行求解算法。该算法把表示变量求解顺序的关联图分解成多个子图,每个线程计算子图的一层,充分利用了GPU丰富的并行计算资源。其次,为了减少存储器访问对算法性能的影响,充分利用了全局内存容量大及共享内存访存延迟低的特点,对本文提出的并行求解算法进行了优化。实验结果表明,与调用cuSPARSE库的求解算法以及无同步并行求解算法的计算时间比较,本文并行算法的计算速度平均提高80%,最大提高99%。在保证计算精度的前提下,大大提高了稀疏线性叁角系统的求解速度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

大规模并行系统论文参考文献

[1].周围,张维,唐俊,王强.大规模MIMO系统中的并行共轭梯度软输出信号检测算法[J].南京邮电大学学报(自然科学版).2019

[2].宋丽翠.大规模稀疏线性系统的并行求解方法研究[D].华北电力大学.2019

[3].闫华,汪贻生,王锐淇,刘波,郭立卿.基于GPU的大规模多阶段任务系统可靠性并行计算方法[J].系统工程与电子技术.2019

[4].邢翔.大规模应用软件系统编译过程的并行算法设计与优化[D].国防科学技术大学.2016

[5].杨海涛,张传斌,阮镇江,徐飞.大规模云同步归集数据系统的异步并行优化[J].计算机工程与应用.2017

[6].徐政,李宁璨,肖晃庆,董桓锋,陆韶琦.大规模交直流电力系统并行计算数字仿真综述[J].电力建设.2016

[7].徐得超,赵敏,江涵,李亚楼.用于大规模电力系统机电暂态实时仿真的并行网络拓扑算法[J].高电压技术.2016

[8].宋炎侃,陈颖,黄少伟,张节潭,杨立滨.大规模电力系统电磁暂态并行仿真算法和实现[J].电力建设.2015

[9].周红珊.基于GPU的大规模电力系统电磁暂态仿真矩阵指数并行算法研究[D].天津大学.2015

[10].罗彬,李刚,苗树敏,程春田,吴琛.大规模电力系统潮流转移比多核并行批处理方法[J].中国电机工程学报.2015

标签:;  ;  ;  ;  

大规模并行系统论文-周围,张维,唐俊,王强
下载Doc文档

猜你喜欢