进程检查点论文-安丰姣

进程检查点论文-安丰姣

导读:本文包含了进程检查点论文开题报告文献综述及选题提纲参考文献,主要关键词:进程迁移,增量检查点,内存压缩,Linux内核

进程检查点论文文献综述

安丰姣[1](2015)在《基于增量检查点进程迁移机制研究》一文中研究指出随着高性能计算环境规模与复杂性的不断增加,不可避免导致了系统的可靠性急剧下降,各节点利用率不均衡。造成长期运行的应用程序经常被系统故障中断,因此增加系统可靠性是十分必要的。检查点是一种常见的容错机制,进程迁移是检查点机制的一种应用,是一种主动容错机制。基于检查点的进程迁移是在源节点保存进程所有状态信息,并将状态信息传输到性能高的目的节点,重新创建进程从保存的状态的地方恢复的过程。进程迁移克服检查点因节点故障而导致检查点数据丢失的缺点,扩充了检查点功能,包括增强系统动态负载平衡,节点资源共享,移动计算等。本文基于检查点机制设计并实现一个内核级进程迁移系统。采用检查点机制实现进程状态保存,基于增量检查点技术保存脏页,通过迭代传输的方式实现实时迁移。但是进程迁移需要通过网络传输大量进程状态,给应用程序增加了较长的冻结时间,导致应用程序的完成时间增长,同时也影响系统性能。由于传统增量检查点是基于页面级保存进程状态,缺陷是即使页面只修改一个字节也需要保存完整页面。针对上述迁移冻结时间长的问题,通过分析脏页中变化的数据分布规律,提出了差值压缩与基于Hash内存块排除两种方式识别脏页中变化字节。进一步降低进程迁移冗余数据传输,缩短进程冻结时间,提高进程迁移效率。实验表明,本系统基于检查点机制实现了进程迁移的基本功能,可以完成进程实时迁移。采用差值压缩与基于Hash内存块排除两种方式优化进程实时迁移,可以明显降低数据传输量与冻结时间。在进程实时迁移过程中,数据传输量平均分别减少89.29%和85.71%,进程冻结时间分别减少81.99%和79.66%。(本文来源于《哈尔滨工程大学》期刊2015-01-01)

王时兴[2](2014)在《基于检查点优化的进程级容错系统设计与实现》一文中研究指出在大型计算环境中,故障的发生不可避免,而由此造成的损失也是巨大的。容错技术的应用在一定程度上能够减少故障的发生带来的影响,提高系统可靠性。进程级的容错则是直接针对运行任务本身容错机制,能够保证任务运行的连续性和故障发生后的快速恢复,其中检查点设置与回卷恢复技术是一种常用方法。本文所设计的进程级容错系统即是基于检查点实现的。为了满足系统需求,需要解决两个主要问题,一是检查点设置时间问题,一是保证检查点状态一致性问题。传统的静态等间距检查点间隔模型能够初步完成检查点的设置,但由于它不能适时的根据故障概率分布的变化而动态的对检查点间隔时间做出调整,所以在实际的应用中会导致较大的开销。为此,本文提出了动态非等间距检查点间隔模型,此模型能动态的调整检查点间隔时间,较之静态方法降低了开销。传统的全局阻塞协议能够简单保证检查点状态一致性,但是在进程数较多时,由阻塞等待引起的时延却较大。考虑到进程间的通信在规模、范围、时间方面具有随机性和不确定性,本文提出对进程采用分组机制,做到组内通信,组间无通信,在做检查点时,组间使用无阻塞协议,组内使用阻塞协议,从而形成一个局部阻塞的过程,即局部阻塞一致性协议。通过以上两方面优化,本文所设计的容错系统较之传统方法能够更好的适应动态复杂的大型计算环境容错需求。为验证本文提出方法的正确性和有效性,设计和实现了一个基于检查点优化的进程级容错系统,实验结果表明,本系统能够在解决多米诺效应,一致性问题的前提下,进一步降低开销,减少任务实际执行时间,提高性能。(本文来源于《西安电子科技大学》期刊2014-12-01)

王福友,杨斌[3](2014)在《设置进程检查点的嵌入式容错系统设计》一文中研究指出针对嵌入式Linux系统的特点,通过设置检查点(checkpoint)实现ARM平台进程级容错。在检查点工作时,通过/proc文件系统与内核进行交互,实时地获取与进程有关的PID、CPU状态以及内存信息,并保存在存储介质中。当进程出现故障后,将上述与进程有关的状态信息进行恢复,从而实现进程级容错。实验表明,该进程级容错系统有较好的容错能力,极大地缩短了进程恢复的时间。(本文来源于《单片机与嵌入式系统应用》期刊2014年08期)

王芳[4](2013)在《关于检查点机制实现核外进程恢复的研究》一文中研究指出本文从分析国内外进程迁移研究现状入手,介绍了UNIX系统中普遍使用的程序的存储格式ELF文件格式,并对进程上下文做了简单介绍。(本文来源于《计算机光盘软件与应用》期刊2013年07期)

殷源,胡术,宋万忠,骆健,喻德军[5](2012)在《ATC中FDP集群进程检查点的研究与实现》一文中研究指出针对空中交通管制系统(ATC)中对飞行数据集群处理的可靠性要求,提出了一种基于Linux的用户级进程检查点设置与恢复方案。对基于该Linux用户级的进程检查点的飞行数据集群处理的各个主要模块进行了介绍,在此基础上给出了系统设计框架。从进程的初始化数据段、堆、栈和打开的文件的保存与恢复,给出了该方案的详细实现方法。该进程检查点设置与恢复方案不但可以在主机崩溃重启后恢复进程在重启前的运行状态,更重要的是可以在分布式系统通过进程迁移将保存的进程检查点迁移到其它主机运行,从而有效的提高系统的可靠性,减少运算损失。(本文来源于《计算机工程与设计》期刊2012年09期)

孟祥坤[6](2012)在《基于Linux用户级进程检查点系统的设计与实现》一文中研究指出进程检查点机制是在进程正常运行的适当时刻设置检查点,将进程状态通过检查点文件保存到稳定存储器中。如果进程在随后的运行过程中发生故障,则从存储器中读出保存的进程状态,将进程卷回恢复,继续运行,从而避免从头开始执行,减少计算损失。在计算机技术广泛应用的背景下,如何保证系统具有一定的可靠性以避免灾难性后果的发生,是当前研究的一个十分重要的领域。目前随着系统规模不断增长,应用程序的日益复杂,使得现有系统中缺陷不断增多,出错概率大大增加。为保证系统的高可靠性,检查点技术被广泛应用并成为目前计算机研究领域的一个热点。另外,随着Linux系统不断普及,基于此操作系统的应用也越来越广泛,因此将进程检查点机制应用于本系统,以提高系统软件的容错性也越来越受到重视。本文首先对课题来源、背景、意义以及目前国内外研究现状进行相关介绍。通过对现有典型检查点系统进行分析对比,总结了各自检查点系统的优缺点。然后介绍了检查点技术和其他相关关键技术及其原理。本文接着重点介绍了进程检查点系统的设计与实现。该系统主要分为四大模块:故障检测模块、状态保存模块、写文件模块、进程恢复模块。故障检测模块能够实现对目标进程的实时保护,使进程正常运行;状态保存模块是将正常运行的目标进程状态,如进程内存映像、CPU寄存器、信号、打开文件等进行提取并保存;写文件模块负责将进程状态提取保存的状态写入到检查点文件中;恢复模块主要是在进程出现故障时,将保存的状态恢复到之前正常运行时刻使进程继续往下执行。其次,编写目标程序对系统各个模块的运行进行相关验证,保证各个模块顺利执行。包括故障检测模块可以实时的检测目标进程的运行状态,状态保存模块可以在目标进程正常运行时保存进程状态信息,写文件模块可以将保存的进程状态信息写入到文件中,恢复模块可以在进程发生错误时将其恢复到正常状态。最后,对本论文的主要工作进行总结,并针对现有的问题提出下一步的改进和完善措施。(本文来源于《山东大学》期刊2012-04-15)

韦中伟,陈海涛,王强,沈志宇[7](2011)在《支持数据库访问的进程检查点技术研究与实现》一文中研究指出现有的检查点技术不支持socket连接的恢复,也没有将进程恢复和数据恢复结合起来,因此不能支持含有数据库访问的应用程序。本文提出一种支持含有数据库访问的进程检查点技术。对于含有数据库访问的应用程序,在设置进程检查点之前,先设置数据库检查点,获取当前数据库的系统改变号SCN,然后生成进程检查点。当程序从进程检查点处恢复运行时,将未关闭的数据库重新建立连接,并利用数据库的回退技术,将用户所操作的数据库表回退到数据库检查点,保证数据和应用的一致性。实验表明该方案是可行的,且性能开销率较低。(本文来源于《计算机工程与科学》期刊2011年08期)

廖剑伟,李莉,陈善雄,余建桥[8](2011)在《实时交互进程的并发检查点技术》一文中研究指出提出了一种并发检查点技术,允许进程在设置检查点的同时尽可能保持继续执行。在拷贝进程地址空间(设置检查点的步骤之一)的同时,阻塞页面写操作并拷贝该原始页面到指定缓冲区,达到不需要在拷贝进程空间的同时停止该被设置检查点进程,最后结合缓冲区中拷贝页面,得到具有一致性的进程状态的映像文件。实验结果表明,可以减少20%~70%被检查进程的停止时间,使得检查点的设置与进程的执行具有一定的并发性。减少被检查进程在设置检查点时的停止时间,适合实时性和交互性要求较高的进程设置检查点。(本文来源于《电子科技大学学报》期刊2011年04期)

梁晓,周英[9](2010)在《基于进程检查点设置的软件执行恢复系统》一文中研究指出在Windows操作系统环境中,软件的容错性越来越受到重视。本文涉及并实现一种基于进程检查点设置的软件执行恢复系统,它将结合对用户地址空间、系统内核资源的保存和恢复来实现对二进制程序进程状态的任意恢复和重放,具有较高的执行效率和良好的实用性。(本文来源于《技术与市场》期刊2010年09期)

门朝光,焦亮,李香,徐振朋[10](2009)在《基于Linux内核的进程检查点系统设计与实现》一文中研究指出作为一种流行的软件容错机制,检查点与恢复技术的实现模式有两种:用户级和系统级。首先阐述了两者的区别,然后根据Linux可加载内核模块机制提出了一种基于Linux内核的进程检查点与恢复实现方法。利用Linux内核线程实现了检查点与恢复内核模块,并基于此内核模块在用户层构造了一检查点函数库,为用户提供了相应接口。用户通过组合使用这些接口可以高效地实现具体检查点与恢复算法。(本文来源于《计算机科学》期刊2009年04期)

进程检查点论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

在大型计算环境中,故障的发生不可避免,而由此造成的损失也是巨大的。容错技术的应用在一定程度上能够减少故障的发生带来的影响,提高系统可靠性。进程级的容错则是直接针对运行任务本身容错机制,能够保证任务运行的连续性和故障发生后的快速恢复,其中检查点设置与回卷恢复技术是一种常用方法。本文所设计的进程级容错系统即是基于检查点实现的。为了满足系统需求,需要解决两个主要问题,一是检查点设置时间问题,一是保证检查点状态一致性问题。传统的静态等间距检查点间隔模型能够初步完成检查点的设置,但由于它不能适时的根据故障概率分布的变化而动态的对检查点间隔时间做出调整,所以在实际的应用中会导致较大的开销。为此,本文提出了动态非等间距检查点间隔模型,此模型能动态的调整检查点间隔时间,较之静态方法降低了开销。传统的全局阻塞协议能够简单保证检查点状态一致性,但是在进程数较多时,由阻塞等待引起的时延却较大。考虑到进程间的通信在规模、范围、时间方面具有随机性和不确定性,本文提出对进程采用分组机制,做到组内通信,组间无通信,在做检查点时,组间使用无阻塞协议,组内使用阻塞协议,从而形成一个局部阻塞的过程,即局部阻塞一致性协议。通过以上两方面优化,本文所设计的容错系统较之传统方法能够更好的适应动态复杂的大型计算环境容错需求。为验证本文提出方法的正确性和有效性,设计和实现了一个基于检查点优化的进程级容错系统,实验结果表明,本系统能够在解决多米诺效应,一致性问题的前提下,进一步降低开销,减少任务实际执行时间,提高性能。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

进程检查点论文参考文献

[1].安丰姣.基于增量检查点进程迁移机制研究[D].哈尔滨工程大学.2015

[2].王时兴.基于检查点优化的进程级容错系统设计与实现[D].西安电子科技大学.2014

[3].王福友,杨斌.设置进程检查点的嵌入式容错系统设计[J].单片机与嵌入式系统应用.2014

[4].王芳.关于检查点机制实现核外进程恢复的研究[J].计算机光盘软件与应用.2013

[5].殷源,胡术,宋万忠,骆健,喻德军.ATC中FDP集群进程检查点的研究与实现[J].计算机工程与设计.2012

[6].孟祥坤.基于Linux用户级进程检查点系统的设计与实现[D].山东大学.2012

[7].韦中伟,陈海涛,王强,沈志宇.支持数据库访问的进程检查点技术研究与实现[J].计算机工程与科学.2011

[8].廖剑伟,李莉,陈善雄,余建桥.实时交互进程的并发检查点技术[J].电子科技大学学报.2011

[9].梁晓,周英.基于进程检查点设置的软件执行恢复系统[J].技术与市场.2010

[10].门朝光,焦亮,李香,徐振朋.基于Linux内核的进程检查点系统设计与实现[J].计算机科学.2009

标签:;  ;  ;  ;  

进程检查点论文-安丰姣
下载Doc文档

猜你喜欢