可扩放性论文-祝永志

可扩放性论文-祝永志

导读:本文包含了可扩放性论文开题报告文献综述及选题提纲参考文献,主要关键词:Spark,协同过滤,Hadoop,可扩放性

可扩放性论文文献综述

祝永志[1](2018)在《基于Spark技术的协同过滤推荐算法的可扩放性研究》一文中研究指出传统的基于项目相似度的协同过滤算法在处理大数据集时会出现延迟过长及效率不高等问题。本文基于Hadoop分布式框架及Spark分布式并行编程模型,设计了一个高效的基于项目相似度的协同过滤算法。经实验验证,文章算法具有很好的可扩放性及很好的推荐精度。(本文来源于《电子技术》期刊2018年07期)

祝永志[2](2018)在《基于Spark技术的ALS推荐算法的可扩放性研究》一文中研究指出推荐系统因其能依据用户特征及行为特点,向用户提供个性化推荐服务,而成为目前研究的热点。文章基于Spark平台对ALS推荐算法进行优化研究。在Movielens数据集上的实验表明,基于分布式平台的ALS推荐算法较好地客服了因数据稀疏性带来的冷启动问题,提高了系统的可扩放性,提高了并行度。(本文来源于《电子技术》期刊2018年06期)

田青[3](2017)在《多核SMP集群并行计算的可扩放性研究》一文中研究指出随着高性能计算技术的飞速发展,并行计算已经成为提高计算机系统性能的主要方法,并行计算的可扩放性也成为评价并行计算性能的主要指标之一。但随着高性能计算机系统规模的不断增长,并行计算系统的结构日益复杂,编程困难、存储量大、效率下降等一系列的问题大量出现,以上问题都从不同方面降低了并行计算的性能,从而对并行系统的正常运行产生了一定的影响。由此可见并行计算的性能不能随着机器规模的增加而提升。现如今可扩放性已成为并行处理中一个重要的研究问题,被越来越广泛地用来描述并行算法(并行程序)能否有效利用可扩充的处理器数的能力。因此,深入和全面地研究并行算法和并行机相结合的可扩放性是对并行计算性能进行合理、精准评价的关键。针对以上情况,本文主要研究多核SMP集群系统并行计算的可扩放性,可扩放性评价准则是研究并行计算可扩放性的基础,建立合适的可扩放性评价方法,以实现并行计算性能提高的目标。论文主要研究内容如下:首先,论文介绍了并行计算机体系结构和模型以及多核SMP集群系统的体系架构特点,然后详细介绍了可扩放性的概念以及相关技术,论文在深入分析典型的可扩放性评价准则的基础之上,指出了它们的适用范围和优缺点。其次,根据多核SMP集群系统体系结构特点,改进了传统等效率可扩放性评价准则。分析了多核SMP集群中的处理器集合存在不完全等价的问题,为了解决不完全等价的问题,本文以最优处理器集合的概念为基础,并对处理器集合的计算能力进行定义,改进了传统等效率可扩放性评价准则以适用于多核SMP集群系统,并分析了改进等效率可扩放性评价准则,得出传统评价准则是改进评价准则在一定条件下的一种形式,以及改进评价准则与并行执行时间之间的关系等重要结论。此外,在改进等效率可扩放性评价准则的基础上进一步研究了如何调节集群系统的节点间可扩放性,为了并行算法尽可能地充分利用增加的处理器,选择合适的网络互联结构,增加网络通信带宽,可以有效地减少通信延迟和计算延迟,进而提高系统的性能。因此提出集群系统中基于带宽的节点间可扩放调节系数概念,进一步优化评价准则,从理论和实验方面分析了节点间可扩放调节系数对系统性能的提升起到重要作用。最后,论文将曙光TC5000作为并行计算的实验环境,并在集群平台上实际运行矩阵相乘算法进行扩放性实验,进一步验证改进等效率可扩放性评价准则的有效性,对得到实验数据进行详细的分析。实验结果表明,此可扩放性评价准则较好的分析了多核SMP集群系统的可扩放性,对于指导并行计算体系结构完善,以及并行算法设计和改进具有重要的意义。(本文来源于《曲阜师范大学》期刊2017-04-05)

何家华,陈国良,单久龙[4](2004)在《如何测量SMP机群可扩放性(英文)》一文中研究指出可扩放性是并行计算的一个重要性能标准,但是传统的可扩放性准则并不适用于SMP机群.如何测量SMP机群的可扩放性?试图提出该问题的一个解决方案.首先找出并验证问题的根源处理器集合不等价性.然后,采用处理器集合的观点来全面、正确地观察系统的行为,而并非像传统的做法那样仅仅使用处理器数来描述并行系统.通过引入性能参考因子的概念,扩展了传统的准则以适应SMP机群体系结构.实验结果显示,扩展后的度量准则适用于SMP机群,且具有较高的准确性.(本文来源于《软件学报》期刊2004年07期)

丁卫群,计永昶,陈国良[5](2001)在《基于工作站集群环境的可扩放性度量标准》一文中研究指出1.引言可扩放性是指并行算法有效利用可扩充的处理机数目的能力,目前已经提出了许多可扩放性度量方法,其中最典型的是:等效率方法、等平均速度方法和平均延迟方法。等效率的方法严格地说只是一种分析的方法,在实际应用中不够准确,而且该方法给出的是工作量与处理器数的关系函数,反映了工作量随处理器数变化的趋势,并没有一个量化的数据。等平均速度的方法将平均速度作为衡量可扩放性的主要指标,是一种将算法与机器相结合的基于测量的方法,但是在实际情况中很难精确地测量出程序运行的速度。平均延迟的方法使用平均计算延迟作为衡量可扩放性的主要指标,精确地考虑了算法与体系结构两者的特性,也是一种基于测量的方法,但该方法需要使用专用的硬件或者专门的系统级软件来测量并行程序运行时每个处理器上的延迟时间,因此难以广泛地应用于各种并行机上。(本文来源于《计算机科学》期刊2001年09期)

计永昶,卜添,陈国良[6](1997)在《网络计算环境下并行算法及其可扩放性分析》一文中研究指出并行算法的可扩放性是指其有效利用计算节点的能力,它可以预测算法在处理机数目变化时的性能.在网络环境下用PVM实现了并行矩阵乘法及PSRS算法,分析了在网络计算环境下这两个算法的可扩放性,并利用试验数据进行了验证.(本文来源于《计算机研究与发展》期刊1997年11期)

张群,陈国良,顾乃杰[7](1996)在《并行SCAN算法及其可扩放性分析》一文中研究指出SCAN算法是构成某些并行算法的一个简单而常用的基本模块.本文首先描述了SCAN操作及其串行和并行算法的设计;然后介绍了并行算法的可扩放性概念、度量及其分析方法;最后分析了不同互连结构上的并行SCAN算法的可扩放性,并用一组在Transputer陈列上的实验对分析所得的结论进行了验证.(本文来源于《计算机学报》期刊1996年05期)

陈国良[8](1995)在《并行算法的可扩放性分析》一文中研究指出本文讨论并行算法的可扩放性的定义,研究目的和各种评判标准,以期有助于了解并行算法和体系结构的匹配关系,最大化系统的加速和效率以及预计目前小规模并行机上的并行算法运行于巨量并行机MPC上时的性能。(本文来源于《小型微型计算机系统》期刊1995年02期)

可扩放性论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

推荐系统因其能依据用户特征及行为特点,向用户提供个性化推荐服务,而成为目前研究的热点。文章基于Spark平台对ALS推荐算法进行优化研究。在Movielens数据集上的实验表明,基于分布式平台的ALS推荐算法较好地客服了因数据稀疏性带来的冷启动问题,提高了系统的可扩放性,提高了并行度。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

可扩放性论文参考文献

[1].祝永志.基于Spark技术的协同过滤推荐算法的可扩放性研究[J].电子技术.2018

[2].祝永志.基于Spark技术的ALS推荐算法的可扩放性研究[J].电子技术.2018

[3].田青.多核SMP集群并行计算的可扩放性研究[D].曲阜师范大学.2017

[4].何家华,陈国良,单久龙.如何测量SMP机群可扩放性(英文)[J].软件学报.2004

[5].丁卫群,计永昶,陈国良.基于工作站集群环境的可扩放性度量标准[J].计算机科学.2001

[6].计永昶,卜添,陈国良.网络计算环境下并行算法及其可扩放性分析[J].计算机研究与发展.1997

[7].张群,陈国良,顾乃杰.并行SCAN算法及其可扩放性分析[J].计算机学报.1996

[8].陈国良.并行算法的可扩放性分析[J].小型微型计算机系统.1995

标签:;  ;  ;  ;  

可扩放性论文-祝永志
下载Doc文档

猜你喜欢