导读:本文包含了并行分解论文开题报告文献综述及选题提纲参考文献,主要关键词:协同过滤,非负矩阵分解,GPU,推荐算法
并行分解论文文献综述
康林瑶,唐兵,夏艳敏,张黎[1](2019)在《基于GPU加速和非负矩阵分解的并行协同过滤推荐算法》一文中研究指出协同过滤(CF)已经在推荐系统中得到了广泛的应用。但是随着用户和项目规模的增大,协同过滤算法的运行效率以及结果的正确性会大大降低。针对这一问题,文中提出了一种基于GPU的非负矩阵分解(NMF)的并行协同过滤方法,充分利用NMF数据降维和特征提取的优势以及CUDA的多核并行计算模式,进行维数简化和用户的相似性计算。该算法在提高精确性的同时降低了计算耗费,可以较好地解决协同过滤推荐系统所存在的稀疏性和扩展性等问题,快速产生精确的个性化推荐结果。基于NVIDIA CUDA设备和真实的MovieLens用户评分数据集,将所设计的并行NMF协同过滤算法与传统的基于用户的和基于物品的协同过滤算法进行了比较,实验结果表明,所设计的并行NMF协同过滤算法达到了较快的处理速度以及较高的推荐准确率。(本文来源于《计算机科学》期刊2019年08期)
许自阳[2](2019)在《基于多相分解技术的高速并行FIR滤波器设计》一文中研究指出在宽带信号采样的情况下,基带部分需要进行高速数据处理,此时单通道数据处理很难满足时序要求。而并行数据处理会占用大量的FPGA资源,这就需要对并行算法进行优化。在不同的场景下输出数据速率要求不同,这就要求进行数据速率变换。本文讨论了如何对并行FIR滤波器进行优化设计,同时也论述了如何利用多相分解技术进行数据速率变换,结果说明优化后的算法能大幅减少FPGA资源的消耗,并能适应多速率数据变换的应用场景。(本文来源于《价值工程》期刊2019年21期)
李庆年,胡玉平[3](2019)在《大数据环境下利用新型FTS的并行细节点指纹匹配通用分解方法》一文中研究指出随着指纹识别数据库规模的不断扩大,指纹识别系统的通用性、可靠性亟须提高。为了解决该问题,提出了利用新型指纹拓扑结构(FTS)的并行化细节点指纹匹配分解方法。该方法首先根据k近邻算法设计了叉点和端点新的结构,并提取出细节点特征。然后,将匹配分数的计算过程分解为几个小步骤来执行,在更精细的层次上分割2个指纹的最终匹配,以此定义局部结构子集之间的部分分数。最后,单独计算这些部分分数,将它们合并在一起,构成一个非常灵活的预测值,并允许丢弃部分分数。此外,提出了基于细节点置信度的指纹匹配算法,有助于全局范围上的指纹信息提取,从而确保局部相似细节点的有效匹配。在SFinGe数据库上的实验结果表明:所提出的分解框架可适用于Apache Hadoop、Apache Spark等大数据环境,具有良好的可靠性。将提出的分解方法应用于3种匹配算法中进行实验,结果表明提出的分解方法具有良好的通用性。(本文来源于《重庆理工大学学报(自然科学)》期刊2019年04期)
黄启文,陆文甜,刘明波[4](2019)在《随机动态经济调度问题的Dantzig-Wolfe分解及其并行算法》一文中研究指出随着电力系统规模增大和场景法抽样场景数量增加,在求解含风电接入电力系统的随机动态经济调度问题时,计算将遭遇"维数灾"问题而无法求解。因此提出Dantzig-Wolfe分解及其并行优化算法,基于Monte Carlo抽样方法建立了以最小化发电成本为目标的随机动态经济调度模型,将随机优化问题转化为大规模确定性优化问题。采用Dantzig-Wolfe分解对其实施场景解耦,将大规模问题分解为上层主问题和一系列低维度的下层子问题,通过迭代求解主、子问题得到原问题最优解。在迭代过程中,利用改进次梯度法改善了算法收敛性。运用GAMS平台的网格计算工具构建了快速求解误差场景子问题的并行计算框架。既降低了计算机内存需求,从而实现高维问题的求解,又提高了求解速度。以含风电场的IEEE 39节点系统和某省级实际电力系统为例,验证了文中所提方法的正确性与有效性。(本文来源于《电网技术》期刊2019年12期)
苏秦[5](2019)在《金属电大目标的并行多极子区域分解方法研究》一文中研究指出伴随着目标探测与识别技术的发展,雷达散射截面的分析与计算成为人们关注的热点。研究目标的雷达散射截面不光是获取它的散射特性,更重要的是可以预估和优化未来的信息化系统。尤其是近几年隐身与反隐身技术的日新月异,对雷达散射截面的精确计算提出了越来越高的要求。工程中计算频率的不断升高使得目标的电尺寸随之变大,除此之外探测目标还往往处于半空间环境中,如何在有限计算资源条件下准确高效计算电大目标的雷达散射截面成为当前人们所面临的挑战性课题。基于这一背景,本文以多层快速多极子方法为主要研究工具,结合超级计算机平台,研究了基于多层快速多极子方法的并行方法和区域分解算法来解决一系列工程问题,特别是区域分解方法能够在保证精度的前提下有效地解决半空间环境中电大尺寸目标散射问题。本论文主要研究了以下几个方面的内容并取得了若干研究成果。为了改善多层快速多极子方法在大规模计算机集群上的负载均衡程度,针对其八叉树结构在高层非空组数较少平面波数较多而在低层呈现相反态势的特点给出了一种平面波自适应划分策略。该并行策略根据非空组所在进程数的不同对平面波实行不同份数的划分,提高了并行效率。为了突破八叉树在最高层中非空组数少于进程数而产生的瓶颈,给出了一种基于远场近似原理的截断树策略。该策略将八叉树的最高层从第二层下移,并在新的最高层采用快速多极子与远场近似混合算法。通过数值算例对比分析了两种并行策略各自的优势。另外,基于现代计算机的微架构,针对多层快速多极子程序中最为耗时的转移过程,给出了一种充分利用现代计算机中高速缓存以及向量化单元的优化方案,优化后的多层快速多极子算法在CPU平台和新一代众核平台分别获得2.5倍和4.6倍加速比。为了进一步扩大并行多层快速多极子方法的计算规模,本论文给出了一种采用并行多层快速多极子加速且以平面波自适应划分方法作为其并行策略的非重迭型区域分解方法。对于该非重迭型区域分解方法提出了一种针对PEC问题的显式边界条件,该边界条件能够自动满足子区域之间电流的连续性以及PEC内部电荷、电场、电势均为零的条件。子区域之间繁琐的奇异性积分被消除,并且改善了高斯赛德尔外迭代求解时的收敛性。同时各个子区域的网格可以独立剖分为非共形网格,大幅提升了模型处理的灵活性。子区域之间的耦合采用场迭代的方式来计算,避免了存储互阻抗矩阵,降低了内存需求。本文还给出了一种MPI混合OpenMP策略加速子区域内部以及子区域间耦合量的计算,高效解决了实际工程中电尺寸为2000波长的电大尺寸散射问题。考虑到地面与海面等环境带来的影响,本论文将并行非重迭型区域分解方法扩展到半空间中,重点研究了半空间环境中用多层快速多极子加速计算的实现方案及其并行策略。对于半空间中的近相互作用,与半空间中MoM类似地采用DCIT进行精确计算;对于子区域内部以及子区域之间远场作用经过半空间分界面的反射场计算,采用了实镜像的方法。该方法只引入一个实镜像,与引入多个复镜像的离散复镜像方法相比大大降低了内存消耗,具有良好的稳定性。数值算例证明,将实镜像方法引入非重迭型区域分解方法中可以精确快速分析半空间中上千波长的电大尺寸目标散射特性。为了解决工程应用中的大型编队问题,将截断树并行策略应用于半空间并行非重迭型区域分解算法中,在满足工程精度需求的条件下成功分析了地面上装甲车编队和海面上舰船编队等散射问题。根据多层快速多极子算法自身分层分组的特点,提出了一种新颖的基于八叉树结构的区域分解方法。论文中利用多层快速多极子算法的八叉树结构自适应地对模型表面进行区域划分,每个子区域即是原八叉树的一个子树并且子区域之间无需创建任何额外的人工交界面,大大提升了模型处理时的便捷性。对于子区域之间锯齿状重合部分采用阻抗的方式计算耦合,消除了高阶奇异性;其余部分用场的方式计算,降低了内存需求。所有计算机资源集中计算各个子区域,提高了求解规模。通过数值仿真结果的分析表明了该方法对于实际工程具有很高的应用价值。(本文来源于《西安电子科技大学》期刊2019-04-01)
刘佳[6](2019)在《基于PowerGraph的并行Tucker分解及应用》一文中研究指出张量分解是一种经典而基础的数据分析方法,被应用于各个热门的研究领域,业界积累了丰富的研究理论和经验。随着信息时代的不断发展,由于数据规模的急剧增加,传统的单机环境下的张量分解算法已经无法适应大数据时代的要求。因此,对张量分解的并行化研究有其非常重要的现实意义。张量分解的两种主要的分解方式是CP分解和Tucker分解,两者应用都很广泛,各有侧重,并且CP分解从某种角度可以视为Tucker分解的一种特殊形式。针对Tucker分解算法的并行化研究很多,但各有优势,不一而足。目前,许多现实的数据集表现出网状式图结构特征,业内对于图结构数据的研究愈演愈烈。由于图结构数据和张量数据可以相互转换,两者之间存在密切的联系,所以许多研究人员考虑将张量和张量分解引入到图结构数据的研究领域中,旨在挖掘图结构数据的潜在知识。通过分析多种并行计算框架,本文采用并行图处理框架PowerGraph作为实验的物理环境,同时基于PowerGraph框架对Tucker分解及其应用做了些许尝试,主要工作分为以下几个部分:1.设计并实现了截断SVD(TRSVD)的并行算法。矩阵的奇异值分解(SVD)在机器学习、数据挖掘等领域有着很重要的研究价值和实际意义,并且经常作为交替最小二乘法(ALS)的更新方法。而TRSVD是SVD的一种改进策略。本文通过分析TRSVD的基本原理,采用行向量的拆分方式将TRSVD算法的核心步骤进行拆分,并设计与之相适应的图数据结构,从而在PowerGraph框架上实现TRSVD算法的并行化。经实验结果验证,并行后的TRSVD算法可以处理更大规模的矩阵,且计算时间较小。同时将其应用到后续的Tucker分解算法的并行化中,提高了整体算法的计算效率。2.设计并实现了Tucker分解的并行算法。通过仔细分析Tucker分解算法的基本原理以及算法的可行性,采用TRSVD的并行算法的拆分方式,重新设计了与之相适应的图数据结构,在PowerGraph框架上实现Tucker分解算法的并行化,并从不同角度对该算法进行了多次的对比实验和分析。经实验结果验证,并行后的Tucker分解算法可以处理更大规模的张量,且计算效率较高。3.设计并实现了基于Tucker分解的两个应用算法。第一,引用RESCAL分解模型和隐因子矩阵等概念,并将Tucker分解并行算法应用到多关系网络数据,在PowerGraph框架上实现了多关系网络的社团发现算法;第二,将彩色图片表示成张量形式,并将Tucker分解并行算法应用到彩色图片数据,在PowerGraph框架上实现了彩色图片的数据压缩算法。通过上述两个应用实验验证了Tucker分解并行算法的正确性和实际意义。(本文来源于《河北师范大学》期刊2019-03-20)
王卫杰,陈晓洁,周海京[7](2019)在《基于区域分解的大规模并行有限元快速算法》一文中研究指出区域分解方法是近来发展迅速的有限元求解方法之一.基于有限元区域分解方法以及多重网格的思想,我们研究了自适应求解以及离散扫频快速算法,并采用自主研发的高性能计算并行框架,将基于区域分解的大规模并行有限元快速算法进行了实现,并行规模能够扩展到数万CPU核.我们在文中将展示程序的核心架构,以及如何采用多重网格算法的思想实现有效的粗网格校正技术,从而实现有限元线性系统的多次快速求解,加速自适应求解和离散扫频.最后,对算法进行了准确性验证以及大规模并行测试.(本文来源于《电子学报》期刊2019年03期)
姜玉曦,周海兵,熊俊[8](2019)在《基于静态双重区域分解的两种接触并行算法》一文中研究指出CHAP3D是北京应用物理与计算数学研究所自主研发的Lagrange通用弹塑性流体力学分析程序.文章介绍了在CHAP3D程序中使用的、针对多处理器集群的、基于静态双重区域分解的两种接触并行算法.第一种是分配单个完整接触面的接触并行算法,此算法将一对完整的接触面分配到一个处理器上,并建立计算域与接触域的通信关系.此接触并行算法的优点是简单,在具有接触面的处理器上可以直接使用串行的接触搜索算法和接触力耦合计算算法.另一种是主面剖分区域分解的接触并行算法,此算法将所有接触面的主面区域分解到所有处理器上.须建立计算域与接触域以及接触域内各处理器间的两种通信关系.该接触并行算法是一个负载平衡的并行算法,具有很好的并行效率和可扩展性.数值算例显示,这两种接触并行算法都能够很好地模拟多种不同类型的接触问题.(本文来源于《气体物理》期刊2019年02期)
方睿,董树锋,朱炳铨,徐奇锋,宋永华[9](2019)在《基于并行加速LU分解改进回路电流法的配电网潮流算法》一文中研究指出随着电力系统规模的不断扩大,配电网节点数越来越多,对配电网潮流算法的计算速度和收敛性提出了更高的要求。为此,提出一种基于并行加速LU分解改进回路电流法的配电网潮流算法,该算法采用回路电流法进行建模求解,利用列选主元LU分解法求解病态线性方程组,并根据列消去树、关联列修正关系和多线程计算原理设计了潮流算法,实现了潮流计算的多线程的并行加速。通过对不同规模的配电网算例进行分析,结果表明所提算法计算速度快、适用性强、内存占用低,在大规模配电网潮流计算中有良好的计算效果,能够满足大型配电网在线潮流计算的要求。(本文来源于《电网技术》期刊2019年06期)
张佳楠,袁启海,余建明,单连飞,周二专[10](2019)在《基于联络线扩展区域分解协调的分布式并行状态估计》一文中研究指出为适应互联电网日益复杂的结构形式和分层分区管理模式,采用联络线分区解耦方式对互联系统进行分布式状态估计计算。考虑到估计计算精度与计算效率的均衡,提出了一种将联络线扩展区域状态估计和灵敏度矩阵协调算法结合的分布式状态估计算法。设计分布式状态估计整体思路,一方面,在实现联络线分区解耦的前提下,完成分区层各子区独立状态估计计算和灵敏度矩阵求解,利用子区计算时机动态构建协调层联络线估计区域并完成并行状态估计计算;另一方面,根据协调层下发的联络线估计值和灵敏度矩阵,分区层各子区并行实现边界估计值不匹配量的协调修正计算。最后,通过IEEE 118节点、IEEE 30节点和实际互联电网的模拟仿真,验证上述算法实现分布式状态估计计算的优越性。仿真结果表明,采用该算法进行分布式估计计算,既具有较高的估计精度、收敛速度和计算效率,又可实现并行独立计算,避免集中式状态估计计算规模大、无法解决局部不可观测或不收敛的瓶颈问题。(本文来源于《电力系统自动化》期刊2019年04期)
并行分解论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
在宽带信号采样的情况下,基带部分需要进行高速数据处理,此时单通道数据处理很难满足时序要求。而并行数据处理会占用大量的FPGA资源,这就需要对并行算法进行优化。在不同的场景下输出数据速率要求不同,这就要求进行数据速率变换。本文讨论了如何对并行FIR滤波器进行优化设计,同时也论述了如何利用多相分解技术进行数据速率变换,结果说明优化后的算法能大幅减少FPGA资源的消耗,并能适应多速率数据变换的应用场景。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
并行分解论文参考文献
[1].康林瑶,唐兵,夏艳敏,张黎.基于GPU加速和非负矩阵分解的并行协同过滤推荐算法[J].计算机科学.2019
[2].许自阳.基于多相分解技术的高速并行FIR滤波器设计[J].价值工程.2019
[3].李庆年,胡玉平.大数据环境下利用新型FTS的并行细节点指纹匹配通用分解方法[J].重庆理工大学学报(自然科学).2019
[4].黄启文,陆文甜,刘明波.随机动态经济调度问题的Dantzig-Wolfe分解及其并行算法[J].电网技术.2019
[5].苏秦.金属电大目标的并行多极子区域分解方法研究[D].西安电子科技大学.2019
[6].刘佳.基于PowerGraph的并行Tucker分解及应用[D].河北师范大学.2019
[7].王卫杰,陈晓洁,周海京.基于区域分解的大规模并行有限元快速算法[J].电子学报.2019
[8].姜玉曦,周海兵,熊俊.基于静态双重区域分解的两种接触并行算法[J].气体物理.2019
[9].方睿,董树锋,朱炳铨,徐奇锋,宋永华.基于并行加速LU分解改进回路电流法的配电网潮流算法[J].电网技术.2019
[10].张佳楠,袁启海,余建明,单连飞,周二专.基于联络线扩展区域分解协调的分布式并行状态估计[J].电力系统自动化.2019