文件预取论文-夏苑,何映思

导读:本文包含了文件预取论文开题报告文献综述及选题提纲参考文献，主要关键词:分布式系统,数据预取,云计算,大数据

文件预取论文文献综述

夏苑,何映思^[1]（2018）在《一种分布式文件系统的推送式数据预取机制》一文中研究指出为了克服传统的数据预取机制的不足,提出了一种在分布式文件系统中存储服务器端的推送式数据预取机制.在达到减少网络通信的数据量和通信时延目的的同时,可以让运行客户端文件系统的计算节点从跟踪I/O操作和预测I/O操作的工作中脱离出来,减轻了客户端的工作负担,提高了存储系统的性能.(本文来源于《西南师范大学学报(自然科学版)》期刊2018年05期）

师明,刘轶,唐歌实^[2]（2014）在《一种面向分布式文件系统的文件预取模型的设计与实现》一文中研究指出如何为上层应用和计算提供稳定高效的文件I/O性能,是分布式文件系统性能研究的热点。文中分析分布式文件系统在设计机理上的共同特征,基于此提出一种通用型的启发式文件预取模型,并选取HDFS平台进行系统实现。启发式文件预取对上层应用透明,采用在文件系统内部建立预取线程池的方法,以组成文件块的数据存储文件为预取单位,在分布式文件系统内部实现。这种设计思路具有一定的普适性,适合推广应用于多种分布式文件系统。实验结果表明,所述的启发式文件预取,能够有效提升分布式文件系统的I/O性能。(本文来源于《计算机科学》期刊2014年07期）

唐燕群^[3]（2014）在《基于数据挖掘的文件元数据预取探究》一文中研究指出在文件存储系统中,文件系统整体性能的提升对于保证文件的安全性和可靠性具有重要意义,而在此过程中,元数据访问性能与文件系统性能有密切关系,要想进一步满足大规模文件存储系统需要,就必须建立相应的文件元数据预取模型。本文通过对基于数据挖掘的文件元数据预取进行分析,以期满足文件数据的大量存取访问需求。(本文来源于《信息安全与技术》期刊2014年03期）

王涛,姚世红,徐正全,熊炼^[4]（2013）在《云存储中面向访问任务的小文件合并与预取策略》一文中研究指出针对云存储中通用分布式文件系统的小文件问题,改进概率潜语义分析(PLSA)模型,提出了一种面向用户访问任务的小文件合并与预取策略。该策略分析用户的访问任务、系统应用和访问文件之间的关系,根据任务合并小文件,并基于任务的转移概率预取文件。对建立的效率模型的分析和基于HDFS的数字城市原型系统实验结果都表明,此策略有较高的预取命中率,可以有效减少元数据服务器的负载和用户请求响应时延。(本文来源于《武汉大学学报(信息科学版)》期刊2013年12期）

王垒^[5]（2013）在《全球剖分编码海量瓦片文件的有序存储和预取技术研究》一文中研究指出地理信息服务具有数据量大、文件数多、大量用户并发访问等特点,传统文件系统和以Hadoop分布式文件系统HDFS(Hadoop Distributed File System)为代表的分布式文件系统无法满足海量地理空间数据的存储与访问要求。为了满足千亿规模海量小文件的存储和访问需求,本人所在项目组基于HDFS实现了海量小文件支持分布文件系统(SMDFS)。测绘信息系统的地图瓦片数据通常以金字塔组织,数据访问具有空间局部性的特点,因此如果能够实现文件预取将有效改善文件访问性能。然而SMDFS文件系统将成千上万小文件聚合成一个聚合文件进行存储,很难将地理相邻的若干文件通过一次I/O就反馈给用户。针对测绘数据访问的空间局部性特点和单个瓦片文件访问效率低的问题,本文提出基于地理位置的周边图片预取技术,目的是减少SMDFS的I/O访问次数,提高文件系统的访问性能。实现预取的一个前提条件是金字塔内瓦片文件存储是有序的。本文提出递归四分排序方法的全球剖分编码海量瓦片文件顺序存储技术,使得二维瓦片聚合文件依据地理位置信息进行排序,使地理相邻的图片存储时相邻。在顺序存储技术基础上,本文提出并实现了基于有序金字塔的预取技术,成功解决海量瓦片读取效率低、并发访问支持能力不足等问题。(本文来源于《国防科学技术大学》期刊2013-10-01）

田田,罗军舟,宋爱波,东方^[6]（2013）在《副本协作预取中文件相关性查询机制》一文中研究指出副本协作预取是一种网格副本复制策略,旨在通过获取隐性高价值文件进一步降低数据访问延迟.副本协作预取的关键在于隐性高价值文件的确定和获取,因此,提高隐性高价值文件获取的速度能够大幅度提升副本协作预取的性能.利用DHT(distributed hash table)组织网格节点,以快速定位隐性高价值文件查询所必需的文件相关性信息.针对隐性高价值文件的特殊查询模式,提出基于预取规则树的文件相关性信息存储结构及其查询机制,以提高查询效率.基于真实网格作业运行记录的实验,验证了所提出方法的有效性和高效性.(本文来源于《软件学报》期刊2013年09期）

刘金,胡创,胡明,龚奕利^[7]（2012）在《多线程环境下基于多预取点的文件预取》一文中研究指出为解决当前Linux内核的预取算法在多线程情况下出现预取误判的问题,依据多线程环境下进程对磁盘文件的访问特点,提出一种基于多预取点的预取算法。在Linux内核原有的预取算法的基础上,结合多线程环境下应用程序对数据的访问模式,在Linux内核的页面缓存层进行了实现。实验和分析表明,在IOzone单线程测试中,该算法和Linux内核原预取算法性能相当;在多线程测试中,读取相同大小的文件,耗时比Linux内核原预取算法至少少1/3。新算法对于提高I/O并行度,从而提高整个计算机系统并行化很有帮助。(本文来源于《计算机应用》期刊2012年06期）

吴峰光,奚宏生,徐陈锋^[8]（2010）在《一种支持并发访问流的文件预取算法》一文中研究指出设计并实现了一种按需预取算法,采用更为宽松的顺序性判决条件,并以页面和页面缓存的状态作为可靠的决策依据.它可以发现淹没在随机读中的顺序访问并进行有效的预读,支持对单个文件实例的并发访问而产生的交织访问模式.实验结果表明:相对于原Linux预读算法,该算法在随机干扰下的顺序读性能可提高29%;交织读的性能是传统算法的4~27倍;同时,应用程序可见延迟改善可达35倍.该算法已被Linux2.6.24内核采用.(本文来源于《软件学报》期刊2010年08期）

唐相桢^[9]（2008）在《基于数据挖掘的文件元数据预取研究与实现》一文中研究指出在大规模的文件存储系统中,元数据访问性能的优化对文件系统的整体性能提高有着非常重要的影响。为了使元数据服务的性能达到最优,建立一种基于元数据预取有效的、正确的模型显得尤其重要。然而,目前存在的缓存预取算法大多是设计来应用在文件数据的存取访问中,没有考虑到元数据访问的特征与元数据本身尺寸较小的特点。若将适用于文件数据的缓存预取算法应用于元数据的预取操作中显然不具有针对性,反而可能导致访问效率低下。针对这种情况,本文提出一种利用存储系统中的元数据操作日志文件对用户未来可能要操作的元数据进行成组预取的模型,并设计了充分体现元数据特点的缓存和预取的新算法。通过对n-gram预测模型的分析,考虑到元数据之间的长距离信息的重要性,引入数据挖掘技术来辅助n-gram模型来实现元数据成组预取。通过评估不同参数值n对模型的影响,本文选用3-gram模型作为预测模型;并综合运用3-gram预测模型和数据挖掘相结合的方法来实现元数据的成组预取,提高元数据访问的缓存命中率,缩短元数据访问请求的平均响应时间,从而提高元数据的访问效率。模拟实验证明,对于不同用户的文件元数据操作日志序列,新元数据预取模型的Cache(缓存)命中率与NEXUS算法相比平均提高了3.9%,与LRU算法比较平均提高了16%。但是新元数据预取算法的空间复杂度较高,不利于其应用于真实的文件系统。为将元数据预取算法应用于文件系统中,文中实现了在线元数据预取改进算法。该在线改进算法支持增量的频繁闭项集挖掘,且不保留中间挖掘信息,很大程度上减少了挖掘的空间复杂度。模拟实验表明,该算法所占用的平均内存空间明显低于新元数据预取算法所占用的空间,仅为其的24%。综合来看,在线元数据预取算法所消耗的时间也有相应的缩短。故在线元数据预取算法是非常有效的,极大地改进了新元数据预取算法在内存空间上占用过多所造成的不足,同时加快了算法的执行速度,对于元数据预取算法成功的应用于真实的文件系统提供了极大可能性与可行性。(本文来源于《重庆大学》期刊2008-04-01）

卢凯,金士尧,卢锡城^[10]（1999）在《并行文件系统中适度贪婪的Cache预取一体化算法》一文中研究指出传统文件系统中的Ｃａｃｈｅ和预取技术是两种降低访问延迟的有效方法．在并行科学计算应用的Ｉ／Ｏ访问模式下，简单的Ｃａｃｈｅ和预取技术已无法提供较高的Ｃａｃｈｅ命中率．该文在分析该Ｉ／Ｏ模式的基础上提出了适度贪婪的Ｃａｃｈｅ和预取一体化算法（ＰＧＩ）．该算法充分利用了并行文件系统环境的特点，采用了适度贪婪的动态滑窗技术，可以有效地消除预取时的抖动，降低系统处理开销；并同时采用了Ｃａｃｈｅ和预取一体化的淘汰损失估计算法，使淘汰的损失降到最低点，在整体上提供了较短的Ｉ／Ｏ服务时间(本文来源于《计算机学报》期刊1999年11期）

文件预取论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

如何为上层应用和计算提供稳定高效的文件I/O性能,是分布式文件系统性能研究的热点。文中分析分布式文件系统在设计机理上的共同特征,基于此提出一种通用型的启发式文件预取模型,并选取HDFS平台进行系统实现。启发式文件预取对上层应用透明,采用在文件系统内部建立预取线程池的方法,以组成文件块的数据存储文件为预取单位,在分布式文件系统内部实现。这种设计思路具有一定的普适性,适合推广应用于多种分布式文件系统。实验结果表明,所述的启发式文件预取,能够有效提升分布式文件系统的I/O性能。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

文件预取论文参考文献

[1].夏苑,何映思.一种分布式文件系统的推送式数据预取机制[J].西南师范大学学报(自然科学版).2018

[2].师明,刘轶,唐歌实.一种面向分布式文件系统的文件预取模型的设计与实现[J].计算机科学.2014

[3].唐燕群.基于数据挖掘的文件元数据预取探究[J].信息安全与技术.2014

[4].王涛,姚世红,徐正全,熊炼.云存储中面向访问任务的小文件合并与预取策略[J].武汉大学学报(信息科学版).2013

[5].王垒.全球剖分编码海量瓦片文件的有序存储和预取技术研究[D].国防科学技术大学.2013

[6].田田,罗军舟,宋爱波,东方.副本协作预取中文件相关性查询机制[J].软件学报.2013

[7].刘金,胡创,胡明,龚奕利.多线程环境下基于多预取点的文件预取[J].计算机应用.2012

[8].吴峰光,奚宏生,徐陈锋.一种支持并发访问流的文件预取算法[J].软件学报.2010

[9].唐相桢.基于数据挖掘的文件元数据预取研究与实现[D].重庆大学.2008

[10].卢凯,金士尧,卢锡城.并行文件系统中适度贪婪的Cache预取一体化算法[J].计算机学报.1999

标签：分布式系统; 数据预取; 云计算; 大数据;

文件预取论文-夏苑,何映思

文件预取论文文献综述

文件预取论文开题报告

文件预取论文参考文献

猜你喜欢