容错并行算法论文-章子凯,武继刚,姜文超,刘竹松

容错并行算法论文-章子凯,武继刚,姜文超,刘竹松

导读:本文包含了容错并行算法论文开题报告文献综述及选题提纲参考文献,主要关键词:处理器阵列,重构,容错,并行算法

容错并行算法论文文献综述

章子凯,武继刚,姜文超,刘竹松[1](2018)在《容错处理器阵列的多逻辑列并行重构算法》一文中研究指出处理器阵列的容错重构技术是片上网络多核、众核高性能体系结构的可靠性技术之一。现有的最大逻辑阵列并行重构技术仅对单条逻辑列的构造实现了并行化,而对多条逻辑列的同步并行仍未见可行算法。依据处理器阵列的潜在并行性,在分治策略的基础上,提出了一种阵列分块的并行重构算法。算法对处理器阵列实施横向分块划分,对每个阵列块进行并行重构,并对所得逻辑子阵列进行归并,实现了多条逻辑列的同步并行重构。与现有的并行算法相比,新算法同样能够生成最大逻辑列,并且减少了通信开销与计算中的数据冗余,有效提高了运行速度。实验结果表明,在物理阵列大小为64×64的处理器阵列上,运行速度比现有并行算法提高39.55%,并且具有良好的可扩展性。(本文来源于《计算机工程与科学》期刊2018年01期)

彭诗辉[2](2015)在《PCM磨损均衡算法容错性及模拟的并行性研究》一文中研究指出由于动态随机存取存储器(Dynamic Random Access Memory,DRAM)的可扩展性变得越来越差,逐渐接近极限,其已经不能满足高性能计算机主存的大容量需求。相变存储器(Phase Change Memory,PCM)以其非易失性、低静态能耗、高集成度、字节寻址等特性得到了研究者的广泛关注和研究。与其它非易失性存储材料相比,PCM正成为当前DRAM与与非闪存(Not AND Flash,NAND Flash)替代品中强有力的竞争者。然而PCM依然存在写寿命过低、写能耗及写延迟高的问题。另一方面,当前的PCM模拟器在进行对PCM有关研究的模拟时,普遍存在模拟时间过长的问题。LPCMsim是一个专为磨损均衡与纠错研究而设计的轻量级PCM模拟器,模拟速度相比其它模拟器有较大改善,但仍然较慢。本文将主要针对PCM写寿命过低及LPCMsim模拟速度问题展开以下两方面研究:磨损均衡是一种能有效延长PCM写寿命的方法,但本文通过分析发现,磨损均衡存在数据污染问题:当PCM空间有数据块出错时,磨损均衡会将这个错误逐渐放大,直致整个地址空间的数据都成为无效的数据,降低PCM寿命及可靠性。本文提出了一种在PCM磨损均衡算法上增加坏块管理机制的方法(Wear-Leveling with Wear-Out,WLWO),从而有效地防止磨损均衡算法的数据污染问题。WLWO首先在PCM中预留部分空间,每当有新的坏块出现,WLWO从预留空间中找到一个空闲的数据块将其替换,以防止磨损均衡算法将未出错的数据迁入坏块中造成数据污染,大大延长PCM的寿命。WLWO通过设置少量的BMT专用缓存,将频繁访问到的数据块标记项交换到专门缓存中,减少地址转换延时。WLWO还采用了替换指针链压缩的方法,显着减少地址转换时读取替换指针的次数,从而减少PCM的访问延迟。实验表明,WLWO只需设置少量的预留空间,便可以显着地提高PCM的写寿命,且所需的时间开销较小。针对LPCMsim的模拟时间仍然太长的问题,本文提出了一种基于多线程技术的LPCMsim并行化方法。该方法根据磨损均衡算法的分组特性,通过把不同的分组分配到不同的处理核心上完成对应模拟,以此充分利用当前流行的多核处理器的处理性能,达到提高LPCMsim模拟器的模拟速度的目的。LPCMsim在实际模拟前将trace预处理:根据给定的分组方案,通过请求分发器将对应到不同分组的访问请求分发到各自的缓冲区。而实际模拟时各分组并行执行,重放各自的trace。实验证明,并行LPCMsim的模拟速度相比原LPCMsim得到大幅提升,其速度基本与模拟器的并行度成正比。(本文来源于《湖南大学》期刊2015-05-05)

郭建奇[3](2014)在《单容错网络存储编码并行算法研究》一文中研究指出在海量存储系统中,利用冗余数据编码技术是提高存储系统可靠性的较好方法。文中对网络存储编码的相关算法进行了研究,针对单容错网络磁盘阵列的编码操作,重点研究了RAID5编码的并行算法。针对集中式奇偶校验编码算法在运行时间上的缺陷,提出了将编码计算过程与组通信操作相融合的思想,设计了更为高效的基于多对一归约操作的并行编码算法。实验结果表明,基于组通信的算法相对于集中式算法性能优势明显。(本文来源于《电子科技》期刊2014年07期)

杨坤[4](2014)在《可视域分析算法的并行化与容错研究》一文中研究指出地形数据规模的增加,数据分辨率的提高和数据复杂度的上升对数字地形分析算法形成了越来越严峻的挑战。可视域分析作为数字地形分析算法集的重要组成部分,其对计算系统的性能要求也越来越高。传统的以单位时间内处理指令数为衡量标准的串行计算系统已经不能完全满足目前的分析计算需求了,必须要使用并行计算的手段对其进行改造和处理。但是传统的并行计算方法在提高地形分析的效率多集中在通用的粗粒度级别上,而细粒度级别上针对数字地形分析算法特点的将并行体系架构与具体地学意义相结合的并行方法的研究还需要进一步发展和完善。首先,本文基于数字地形分析和并行计算技术,对可视域分析算法进行并行特征和数据依赖特征分析,提出可视域分析算法中数据的全局和局部数据依赖关系的概念,并对数据并行的一般策略进行探讨,进而为数据划分提供理论依据。其次,在等角划分和等面积划分的基础上,本文提出一种基于计算窗口边界的数据划分的方法。该方法针对等角划分中可能出现的视点随机性影响并行效率的问题,采用使用栅格扩展、填充的方法以及任务调度负载平衡的方法予以处理。再次,针对并行数字地形分析的数据密集型特点,本文提出一种面向并行可视域分析的检错方法,利用集群的计算加速能力对可视域分析计算过程进行冗余,并通过对计算结果的错误率统计实现了对错误的检测,从而实现对由于诸如进程失效等原因所导致的计算结果错误的检测。在此基础之上,本文以并行检错为基础,使用多副本技术实现了一种在并行结构体系下的地形分析容错方法,为并行数字地形分析下常见的容错问题提供了一种易于实现的解决方法。最后,本文在并行可视域分析算法的基础之上,将地形分析中的数据依赖处理方法推广到地形分析算法集中的其他算法之中,同时也为地形分析中的具有全局数据依赖问题的分析算法提供一种比较通用的解决思路。(本文来源于《南京师范大学》期刊2014-04-01)

宋效东,刘学军,汤国安,窦万峰,江岭[5](2013)在《并行数字地形分析的容错算法研究》一文中研究指出在高性能地学计算系统中,任务计算失败将会导致严重的后果,因此高性能地学计算必须具有可靠性保障。软件容错模型是提高并行计算容错能力的一种有效方法。针对传统基于检查点/回滚的容错策略存在资源浪费的不足,以并行地形分析为研究对象,基于软件容错模型提出一种基于邻域型算法的容错策略——N-ABFT(Neigh-boring-Algorithm Based Fault-Tolerant)。针对邻域型地形因子,该容错策略为并行程序划分出的各数据块增加冗余的校验行或校验列。最后,结合N-ABFT算法,提出一种容错调度算法,有效地提高了系统容错能力,降低了错误检测开销。(本文来源于《地理与地理信息科学》期刊2013年02期)

田凯,卢宇彤,所光[6](2012)在《容错的并行多重网格算法》一文中研究指出高性能计算机上并行程序用到的结点越来越多,而在程序运行期间中发生结点失效的概率也随之增大.对于计算时间很长的程序,容忍结点失效的容错能力显得尤为重要.并行多重网格算法(MG)被广泛用于求解大型工程和物理问题中的偏微分方程组的数值解.为了实现MG算法的容错能力,提出了一种基于容错MPI的容错并行多重网格算法FT-MG.实验结果表明:FT-MG算法在引入少许开销的条件下实现了MG算法的容错能力.(本文来源于《微电子学与计算机》期刊2012年09期)

王媛,王意洁,邓瑞鹏,裴晓强[7](2011)在《云计算环境下的容错并行Skyline查询算法研究》一文中研究指出云计算为分布并行Skyline查询提供强大存储能力和计算能力的同时,其大规模数据中心固有的故障频发特性给可靠Skyline查询处理带来极大挑战。现有研究致力于提高Skyline算法的响应时间、渐进性、负载均衡等各项性能,不能保证故障情况下查询继续正确执行。为此,提出一种容错并行Skyline查询算法(fault-tolerant parallel Skyline,FTPS)。该算法通过故障监测和任务迁移,使得能够在查询过程中及时发现故障,并将故障节点的计算任务迁移到副本节点,保证查询的正确执行。理论分析和实验证明,FTPS算法能够在不影响正常Skyline查询处理性能的情况下获取较好的容错处理性能。(本文来源于《计算机科学与探索》期刊2011年09期)

杜云飞,唐玉华[8](2011)在《容错并行算法的分类和设计》一文中研究指出鉴于容错并行算法的设计是影响其容错性能的关键因素,首先,根据容错并行算法的设计方法,给出了容错并行算法的分类,并对各类算法的特点进行了分析;然后,根据分类方法选择了并行矩阵叁角分解和快速傅里叶变换2种典型的并行算法,设计出2类并行算法应用所对应的容错并行算法;最后,在一个256结点的机群系统上对设计的容错并行算法的性能进行了测试,结果表明容错并行算法可以实现很低的容错开销.(本文来源于《华中科技大学学报(自然科学版)》期刊2011年04期)

米国伟,周海芳,杜云飞[9](2010)在《面向星载计算机的容错并行算法设计与实现》一文中研究指出星载计算机是卫星进行星务管理和有效载荷计算的核心设备,由于要高速处理大量数据所以采用多处理器并行处理。但在空间运行期间,星载计算机设备一直处于宇宙空间带电粒子构成的辐射环境中,强辐射会造成星载计算机出现瞬时故障而影响卫星业务的正常运行。本文通过应用级软件容错的手段提高系统的可靠性,基于并行复算的思想,提出容错并行算法。通过对(NPB)基准测试程序修改,使其在VxWorks提供的Socket通信接口下实现相应的容错并行算法,并在VxWorks Simulator以及星载平台上进了正确性测试。(本文来源于《航空兵器》期刊2010年04期)

米国伟[10](2010)在《面向星载计算机的容错并行算法研究与实现》一文中研究指出星载计算机是卫星进行星务管理和有效载荷计算的核心设备。空间应用需求的增长使多CPU并行成为星载计算机的未来发展方向。在空间运行期间,由于星载计算机设备将一直处于宇宙空间带电粒子构成的辐射环境中,周围的高温、高真空以及强辐射等会造成星载计算机出现瞬时故障或是永久故障而影响卫星业务的正常运行,因此容错技术一直是星载计算机研制领域的研究热点。作为容错技术的重要分支,软件容错为提高系统的可靠性提供了灵活有效的方法。本文在分析研究现有容错技术的基础上,运用应用级软件容错的手段来容忍硬件的故障,能有效提高星载系统的可靠性。本文主要完成的工作描述如下:1、面向星载并行计算机易出现的单节点故障,基于并行复算的思想提出了容错并行算法的概念,并且给出了容错并行算法的设计流程:首先进行程序段的划分,其次设计故障检测段和数据保存段,最后设计复算程序段。通过分析星载并行计算机的结构特点和应用模式,有针对性地提出了两种容错并行算法的实现方式:分配任务型和启动替换进程型。2、根据容错并行算法的设计流程和两种不同的容错实现方式,选取NPB(NAS parallel Benchmark)基准测试程序集基于MPI(Message Passing Interface)通信接口进行了相应的容错设计,并在四核微机平台上进行了测试,实验结果验证了容错并行算法的可行性。3、面向星载计算机的容错并行算法是一种在应用级的利用软件容错来解决硬件故障的方法,其设计思路和实现方式能否得到实际应用还需要进一步进行工程化实验,并在真实的硬件环境下进行验证性的测试。在深入研究嵌入式操作系统VxWorks的通信原理和通信方式的基础上,对基于MPI消息传递接口实现的容错并行算法进行工程化改造,并在VxWroks模拟器和实际的4节点并行原理样机上进行了功能和性能测试,实验结果表明容错并行算法在提高应用程序性能的同时可有效提高系统的可用性和可靠性。(本文来源于《国防科学技术大学》期刊2010-06-01)

容错并行算法论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

由于动态随机存取存储器(Dynamic Random Access Memory,DRAM)的可扩展性变得越来越差,逐渐接近极限,其已经不能满足高性能计算机主存的大容量需求。相变存储器(Phase Change Memory,PCM)以其非易失性、低静态能耗、高集成度、字节寻址等特性得到了研究者的广泛关注和研究。与其它非易失性存储材料相比,PCM正成为当前DRAM与与非闪存(Not AND Flash,NAND Flash)替代品中强有力的竞争者。然而PCM依然存在写寿命过低、写能耗及写延迟高的问题。另一方面,当前的PCM模拟器在进行对PCM有关研究的模拟时,普遍存在模拟时间过长的问题。LPCMsim是一个专为磨损均衡与纠错研究而设计的轻量级PCM模拟器,模拟速度相比其它模拟器有较大改善,但仍然较慢。本文将主要针对PCM写寿命过低及LPCMsim模拟速度问题展开以下两方面研究:磨损均衡是一种能有效延长PCM写寿命的方法,但本文通过分析发现,磨损均衡存在数据污染问题:当PCM空间有数据块出错时,磨损均衡会将这个错误逐渐放大,直致整个地址空间的数据都成为无效的数据,降低PCM寿命及可靠性。本文提出了一种在PCM磨损均衡算法上增加坏块管理机制的方法(Wear-Leveling with Wear-Out,WLWO),从而有效地防止磨损均衡算法的数据污染问题。WLWO首先在PCM中预留部分空间,每当有新的坏块出现,WLWO从预留空间中找到一个空闲的数据块将其替换,以防止磨损均衡算法将未出错的数据迁入坏块中造成数据污染,大大延长PCM的寿命。WLWO通过设置少量的BMT专用缓存,将频繁访问到的数据块标记项交换到专门缓存中,减少地址转换延时。WLWO还采用了替换指针链压缩的方法,显着减少地址转换时读取替换指针的次数,从而减少PCM的访问延迟。实验表明,WLWO只需设置少量的预留空间,便可以显着地提高PCM的写寿命,且所需的时间开销较小。针对LPCMsim的模拟时间仍然太长的问题,本文提出了一种基于多线程技术的LPCMsim并行化方法。该方法根据磨损均衡算法的分组特性,通过把不同的分组分配到不同的处理核心上完成对应模拟,以此充分利用当前流行的多核处理器的处理性能,达到提高LPCMsim模拟器的模拟速度的目的。LPCMsim在实际模拟前将trace预处理:根据给定的分组方案,通过请求分发器将对应到不同分组的访问请求分发到各自的缓冲区。而实际模拟时各分组并行执行,重放各自的trace。实验证明,并行LPCMsim的模拟速度相比原LPCMsim得到大幅提升,其速度基本与模拟器的并行度成正比。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

容错并行算法论文参考文献

[1].章子凯,武继刚,姜文超,刘竹松.容错处理器阵列的多逻辑列并行重构算法[J].计算机工程与科学.2018

[2].彭诗辉.PCM磨损均衡算法容错性及模拟的并行性研究[D].湖南大学.2015

[3].郭建奇.单容错网络存储编码并行算法研究[J].电子科技.2014

[4].杨坤.可视域分析算法的并行化与容错研究[D].南京师范大学.2014

[5].宋效东,刘学军,汤国安,窦万峰,江岭.并行数字地形分析的容错算法研究[J].地理与地理信息科学.2013

[6].田凯,卢宇彤,所光.容错的并行多重网格算法[J].微电子学与计算机.2012

[7].王媛,王意洁,邓瑞鹏,裴晓强.云计算环境下的容错并行Skyline查询算法研究[J].计算机科学与探索.2011

[8].杜云飞,唐玉华.容错并行算法的分类和设计[J].华中科技大学学报(自然科学版).2011

[9].米国伟,周海芳,杜云飞.面向星载计算机的容错并行算法设计与实现[J].航空兵器.2010

[10].米国伟.面向星载计算机的容错并行算法研究与实现[D].国防科学技术大学.2010

标签:;  ;  ;  ;  

容错并行算法论文-章子凯,武继刚,姜文超,刘竹松
下载Doc文档

猜你喜欢