网络多核处理器论文-童心田

导读:本文包含了网络多核处理器论文开题报告文献综述及选题提纲参考文献，主要关键词:叁维片上网络,片上多核处理器,缓存一致性协议,多播路由算法

网络多核处理器论文文献综述

童心田^[1]（2018）在《基于片上网络的叁维多核处理器缓存一致性实现方法研究》一文中研究指出基于片上网络的叁维多核处理器是多核处理器设计发展的趋势与研究热点,而缓存一致性协议是多核处理器系统共享数据正确存储与读写的保证。论文针对在基于片上网络的叁维多核处理器中缓存一致性协议的实现方法展开研究。论文首先针对在基于片上网络的叁维多核处理器系统中,随着处理器核数目的增加,基于目录的缓存一致性协议实现中目录存储开销越来越大的问题,提出了一种基于叁维片上网络结构的柱型节点分布式两级目录结构,将叁维网络划分为多个柱型节点,结合全映射和粗向量两种目录组织结构的优点,采用全局和柱型节点两级目录来存储共享数据副本的分布情况。相比传统的目录实现方法,该目录结构存储开销小,且基于该目录结构的缓存一致性协议访问延迟性能较好。其次,针对缓存一致性协议通信中展现出的多播通信特征,论文提出了一种基于叁维片上网络结构的柱型分区多播路由算法3D_CPM。该算法将叁维网络划分为多个柱型区域,根据多播通信的多个目的节点在各柱型区域的分布情况,按区域选择合适的联络节点,然后基于XYZ算法实现缓存一致性协议消息从源节点至联络节点至目的节点的路由传输。进一步,提出了一种改进的多播路由算法3D_OCPM,在节点之间选择路由跳数最小的路径,以达到充分利用公共传输路径,降低传输功耗,更好地实现缓存一致性的多播通信的目的。最后,定义了缓存一致性协议消息传输的数据包格式,并在Noxim仿真器中,对所提出的算法进行了验证。实验结果表明,在不同的通信模式下,与已有的多播路由算法相比,所提出的算法均有效降低了平均通信延时和通信功耗。(本文来源于《南京航空航天大学》期刊2018-03-01）

王秋城^[2]（2017）在《基于OCTEON多核处理器的网络流量分类技术研究与实现》一文中研究指出随着互联网技术的高速发展,对于网络环境安全的需要也越来越紧迫。网络流量分类技术作为实现网络可控性的基础技术和重要手段,在网络管理、服务质量保障和网络安全等领域正在发挥越来越重要的作用。本文研究了现有的网络流量分类技术,总结了基于端口号匹配、基于特征字段分析、基于传输层行为模式和基于流统计特征的机器学习方法各自的优势和不足。鉴于基于机器学习算法的网络流量分类技术分类精度高、易于扩展等优点,选取随机森林作为网络流量分类方法,并针对传统随机森林的不足提出了改进策略,最后再将改进的随机森林策略实现到OCTEON平台上,设计并实现了基于OCTEON多核处理器的网络流量分类系统。最后,搭建了系统测试环境,对系统进行了有效性测试。主要工作有以下几个方面:1、在充分理解传统随机森林算法的基础上,根据算法本身存在的单节点模型训练速度慢和不区分基分类器强弱性能差异的不足,从并行性和加权调整两方面入手提出了改进的随机森林策略;2、对OCTEON本身的硬件特性进行研究,将OCTEON的运行模式、核间同步通信机制和内存分配机制等优秀特性与改机的随机森林策略结合起来,在OCTEON平台上实现改进的随机森林模型;3、实现了基于OCTEON多核处理器的网络流量分类系统,详细介绍了系统的架构设计,各个功能模块的详细设计和实现,并搭建了系统测试环境,对系统的分类性能进行了测试,验证了系统在流量分类方面的优异性能。(本文来源于《北京邮电大学》期刊2017-03-09）

郭桂雨^[3]（2016）在《基于片上网络多核处理器设计与协同验证》一文中研究指出随着VLSI技术的飞速发展,单个芯片系统中各部分的逻辑密度也急剧增大。为适应更高的工作频率、更短的面向市场时间压力,今天的半导体工业要求提供越来越多的多处理器片上系统结构,然而处理单元数量增大到一定程度后,传统的基于总线的通信方法,由于缺乏可扩展性和可预测性,不能适应未来多核SoC在性能、功率、时序收敛和可扩展性等方面的发展需求。为迎接下一代系统设计中设计生产力和信号完整性的挑战,近来提出一个结构化的和可扩展的互连架构---片上网络(NoC),用于降低片上通信问题的复杂性。本论文的研究工作是以一个多核NOC芯片开发项目为背景,设计实现了一个可扩展的多核处理器平台,包括NOC架构的分析与选取、NOC架构的硬件实现以及协同验证和性能分析。在设计部分包含了核之间通信方式的设计和主从核控制关系的设计。对于核之间通信方式的设计,本文采用了片上网络(NoC)方式。和传统片上共享总线相比,NoC具有通信带宽大、可扩展性强、支持设计重用等优点。本文采用了双环拓扑结构、包交换和维序路由算法作为NoC的设计方案,该种方案不仅消耗资源少、数据传输延迟小,而且不存在死锁问题；在仲裁方式的设计上我们采用了应用广泛的round robin优先级,master端采用轮询的方式进行访问,避免了其他master端一直处于等待状态。对于主从核控制的设计,本文采用了一个主核来控制其他十五个从核的开关,该方案可根据负载来决定开启核的个数,从而提高了效率,降低了功耗。在验证部分,本文进行了协同验证以及该结构的性能分析。在协同验证部分,重点讨论了目前广泛应用的两种软硬件协同验证的方案：基于仿真平台的协同验证和基于FPGA平台的协同验证。重点论述本项目NOC的软硬件协同仿真系统的组成,包括硬件设计、软件的设计和仿真平台的设计以及使用的移植技术、调试技术等。协同验证确保了系统级芯片软件与硬件设计以及系统级NOC芯片通信网络架构的正确性,实现了在流片之前软件在硬件上运行的可能性,降低了项目的风险。最后本文进行了性能分析,本设计的16核NOC的逻辑在16颗Virtex-7 XC7A200T器件上实现,可以稳定的工作频率达100M,运行了矩阵乘法测试程序,其加速比可到15.5即运行速度为单核的15.5倍。本文研究了NOC通信方案设计,对路由节点的设计、仲裁方式等一一重点考虑,根据体系工作特点,对架构的功能在平台上进行了协同验证,表明此NOC结构具有良好的扩展性和较高的性能。(本文来源于《北京交通大学》期刊2016-06-15）

王磊,陆超,章隆兵,王剑^[4]（2015）在《基于神经网络预测模型的异构多核处理器调度》一文中研究指出为了提高异构多核处理器的性能和资源利用率,研究了优化异构多核处理器的程序调度方法。针对异构多核处理器的特点,提出了一种基于神经网络的低开销程序性能预测的调度模型。该调度模型根据程序固有特征预测各个程序在不同处理器核上的性能,然后根据性能预测找出程序与处理器核之间的最优匹配方案进行调度。试验证明,该调度模型对于异构多核处理器的性能和能效都取得了很好的提升效果,超过了现有的轮转调度、抽样调度和性能影响评估(PIE)调度。相比于轮转调度,该调度模型在处理器性能和能效上分别取得了13.64%和10.78%的提升。(本文来源于《高技术通讯》期刊2015年06期）

遇炳昕^[5]（2015）在《基于OCTEON多核处理器的网络数据过滤技术研究》一文中研究指出随着网络带宽和流量的不断增大,传统主机在网络数据包的过滤处理过程中已经遭遇了瓶颈,在网络安全的应用中越来越需要一种性能更高、速度更快的网络数据过滤平台。本文研究分析了传统的数据过滤技术,针对高速网络环境下对网络数据的过滤性能瓶颈问题,提出了一种基于OCTEON多核处理器的数据流队列过滤模型——FQM,充分利用其工作组核间调度机制、控制平面和数据平面的混合模式,通过工作组和核在不同功能模块上的合理分配,以及控制平面和数据平面的合理使用,大幅度提高了高速网络环境下数据包的过滤速度和匹配率。本模型对单一数据包和关联数据包做不同方式的处理,对单一包进行直接匹配,对分片的关联包在进入协议栈之前进行整组的规则匹配,避免了大量分片关联包进入协议栈重新组装之后再进行规则匹配的不必要的操作,提高了数据匹配的速度,同时降低了系统资源的消耗。本文在OCTEON68XX平台上针对提出的FQM模型进行了数据过滤系统的设计与实现,并对系统中的控制平而和数据平面中关键的数据包捕获模块、数据包匹配模块和数据包转发模块的设计与实现进行了详细阐述,仿真实验结果证明该系统在高速网络环境下能大幅提升数据包的过滤速度与匹配正确率。(本文来源于《北京邮电大学》期刊2015-03-11）

王俊辉^[6]（2015）在《高性能多核处理器的低功耗片上网络研究》一文中研究指出片上互连网络负责实现众多处理器核间、众多处理器核与大量片上存储体间的通信互连,是高性能微处理器的枢纽与核心,其体系结构决定着高性能微处理器的整体性能。传统的电互连网络体系结构存在带宽低、延迟大、功耗高等缺点,已经成为制约高性能微处理器性能提高的瓶颈之一。尤其是在功耗方面,随着互连网络规模的扩大,片上互连网络所需要的功耗已经占据高性能微处理器功耗的很大一个方面。研究低功耗片上网络,可以充分利用相关技术,实现互连网络以及微处理器的高效、节能,具有十分重要的意义。文章主要针对如何利用光互连技术、积压上界的分析技术以及低功耗电路技术等进行低功耗片上网络的设计展开深入研究。主要研究内容可分为以下四个方面:(1)基于蝶型结构的层次式低功耗片上光网络研究随着硅基光互连相关技术的发展,片上光网络已经成为低功耗网络设计中的重点研究方向。相比于传统的电互连网络,片上光网络通过利用光学传输链路,可以在数据传输过程中节省大量能量。但是,在光互连网络中,数据传输方式与电互连网络存在极大的差异。数据报文首先需要经过光学调制后,才能变成光信号在在波导中进行传播。传播过程中,光信号既不能被直接缓存、更不能被解读。如何能够利用光互连网络的特性成为片上光网络设计所面临的巨大挑战。目前提出的片上光网络结构都需要利用大量的光学器件来搭建网络基础设施,势必会带来光学损耗高、光学传输功耗高、面积开销大等问题。针对这些问题,本文提出了一种层次式的基于蝶型网络的片上光网络——HBPNo C。HBPNo C采用一种层次式的结构:在核簇内部采用报文交换方式,在核簇间通信采用光路交换方式。簇间通信利用一个高可扩展的光网络(BPNo C)进行数据传输。BPNo C可以实现高可扩展性的原因包含两个方面。首先,与以前的片上光网络中路由器的构建方式不同,BPNo C只使用一个基本的的的光开关元件(PS E2x2),来建立混合路由器。其次,蝴蝶网络和光开关单元PS E2x2都是单向的。因此,把PSE2x2应用到到蝶型光网络中可以有效节约光学资源、减少面积占用、提高网络的能量效率。BPNo C是一个双层网络,包含光学子网络和电学子网络。光学子网络采用负载平衡路由算法,使用基于连接的交换方式来传输数据包,而电学子网络利用改进转弯算法进行控制报文和数据报文的分组交换。为了提高光学资源的利用效率,HBPNo C在BPNo C网络的基础上,综合利用光传输技术和电传输技术来改善片上网络的性能。HBPNo C网络的最大特点在于,为了提高网络性能和降低系统功耗,对于簇内短距离通信,网络利用局部的电交换结构直接转发核簇内消息到它们的目的地;只有对于长距离、数据大的通信,网络才利用光互连技术进行传输。实验结果表明,HBPNo C片上光网络能够保证高能源效率、低光学损耗以及低延迟、高吞吐率的通信性能。(2)软件定义的低功耗片上片上光网络设计研究片上光网络为实现低功耗网络设计提供了很好的平台。相比于传统的电互连网络,片上光网络通过利用光学传输链路,可以在数据传输过程中节省大量能量。但是,目前已经提出的主动式片上光网络结构都采用一种分布式的方法来建立光学路径,每个光交换单元都需要一个电路由器来配合工作。这就导致片上光网络资源利用率低、能量消耗高等问题。针对这些问题,本文提出了一个软件定义的片上光网络(SD-PNOC)。它使用软件定义网络(SDN)的思想来提高片上光网络中光资源的利用效率。软件定义片上光网络拥有两个功能平面——一个集中式的控制平面和其所控制的一个交换平面。SD-PNo C利用集中式的控制平面来处理路径建立过程。该平面仅仅是由网关和一个集中控制器组成,从而实现利用集中控制来代替分布式的方法。数据交换平面由光交换单元构成,用于完成数据的转发或交换功能。实验结果表明SD-PNo C网络拥有较高的能量效率和较低的传输延迟。(3)片上网络最差积压上界的分析方法研究在主流的电互连片上网络中,路由器中的缓冲区所消耗的能量占据网络总能耗的很大一部分。如何在保证系统性能的情况下减少缓冲区大小就成为低功耗片上网络设计的一大挑战。分析路由器最差积压上界可以为设计过程中缓冲区大小的确定提供很好的理论支持。文章提出了基于有向竞争图(Di GB)的方法来分析最差积压上界。首先,本文分析了简单场景下如何利用网络演算中的到达曲线和服务曲线来推导积压上界。然后,对于复杂情形,文章构造一个有向竞争图(DCG)来帮助分析数据流之间的关系。进一步,通过使用广度优先搜索策略遍历DCG,Di GB方法把复杂情形分解为基本情形。这样,利用基本情形下的模型就可以完成所有路由器的积压上界推导过程。本章以并行处理中经常出现的聚合通信为例,详细描述了最差积压上界推导的过程。最后,通过对4×4和8×8网络中的最大积压结果与Di GB方法推导的最差积压上界进行比较,文章证明了Di GB方法所获结果的正确性与紧致性。(4)电压频率岛感知的低功耗片上网络研究在片上网络中,功耗已经成为一个重要的设计约束。虽然光互连技术以及3D技术等为片上网络的发展提供了新的契机,传统的电互连网络仍然需要发挥很大的作用。如何通过一些低功耗技术,如动态电压/频率缩放技术等,来降低片上网络的功耗是目前研究的一个热点问题。针对该问题,本文提出了一种基于网络演算的高效能(PNC)片上网络设计方法,在满足延迟需求的情况下,尽量减少网络的能量消耗。首先,文章提出了一个网络演算为基础的方法来分析No C中每个通信流在最坏情况下的延迟。基于网络报文在不超过延迟界限时能够经受的进一步延迟时间(也叫延迟空缺),我们的PNC方法利用电源闸控技术来减少处于工作状态的缓冲单元,并且利用电压频率调节技术来降低电压频率岛的电压-频率。通过减少工作状态的缓冲单元和降低路由器的电压和频率,片上网络的功耗得以降低。实验结果表明,我们的PNC方法可以节省至多达69%的网络总功耗。综上所述,本文主要针对光互连技术、积压上界的分析技术以及低功耗电路技术等设计低功耗片上网络展开深入研究展开了深入研究。本文的研究为低功耗片上网络的设计提供了很好的方法,具有一定的理论意义和应用价值。(本文来源于《国防科学技术大学》期刊2015-02-01）

朱新召,胡哲琨,周莉,陈杰,戈志伟^[7]（2014）在《基于多核处理器的多层感知神经网络设计和实现》一文中研究指出采用基于片上网络通信的多核处理器,设计并实现了一种具有可重构性、运行时配置和更新,以及具有学习能力的多层感知器神经网络结构以及对应的编程模型,并在FPGA上进行了验证.实验结果表明所设计的结构满足精度和实时性要求,且编程模型简单,易于扩展和维护,为人工神经网络在计算机视觉和人工智能领域的应用提供了良好的解决方法.(本文来源于《微电子学与计算机》期刊2014年11期）

黄海清,孟庆磊^[8]（2014）在《基于OCTEON多核处理器的高精度网络报文处理系统》一文中研究指出基于Cavium公司OCTEON Cn5650芯片设计与实现一种高精度网络报文处理系统。由OCTEON的硬件收发引擎Packet输入和Packet输出来保证线速收发报文性能,在simple executive环境下满足TCP连接20万/秒和HTTP连接10万/秒的要求。实验结果表明,报文处理系统能够接收网络上的数据报文,并根据指定的内容对网络数据报文进行分析和存储;根据需要可以实现标准协议如HTTP、FTP、SMTP、POP3等网络报文客户端及服务器端模拟以及流量模拟;将自定义的网络报文或接收到的网络报文发回到网络中。(本文来源于《计算机光盘软件与应用》期刊2014年08期）

苏文,王焕东,台运方,王靖^[9]（2013）在《面向云计算的多核处理器存储和网络子系统优化设计》一文中研究指出针对传统多核处理器设计缺乏对虚拟机和典型云服务的支持的问题,分析了云计算数据中心和虚拟机的基本架构和特点,指出数据传输、网络性能、I/O虚拟化是一直未被关注的影响系统性能的关键因素,进而提出了一种改进的多核处理器设计方案。该方案通过采用片上内存拷贝引擎、改进直接内存访问(DMA)设计、改进直接缓存访问(DCA)设计和采用快速地址转换和远程内存访问(RDMA)技术,来较大地提高存储系统、网络、I/O的性能和系统的并行性。实验表明,该方案实现的单核800MHz处理器千兆以太网络TCP传输带宽较传统方案提高48.2%并达到峰值800Mbps,内存拷贝操作加速比达到14倍以上,快速傅立叶变换(FFT)和矩阵乘法加速比达到2倍以上,同时系统高速缓存效率显着提高。(本文来源于《高技术通讯》期刊2013年04期）

贺江^[10]（2013）在《基于片上网络的多核处理器的研究与实现》一文中研究指出随着集成电路制造工艺的发展，单核处理器的性能很难再进一步提升，多核处理器越来越受到人们的重视。基于FPGA的可编程片上系统（SOPC）具有灵活的设计方式，它为多核处理器的设计和实现提供更加方便快捷途径。本文在探究了Xilinx SOPC的最新设计方法后，以Microblaze软核处理器为基础，在FPGA上设计并实现了一个可扩展的多核处理器平台。多核处理器平台的设计包括了核间通信的设计和处理器节点的设计。对于核间通信，本文采用了片上网络（NoC）方式。和传统片上总线相比，NoC具有通信带宽大、可扩展性强、支持设计重用等优点。文中采用了2D-mesh拓扑结构、包交换算法和确定路由作为NoC的设计方案，该种方案不仅消耗资源少、数据传输延迟小，而且不存在死锁问题。对于处理器节点部分，本文研究并设计了处理器节点的方案，包括主控单元和可配置接口单元。主控单元以Microblaze为核心，配置了存储器、总线、DMA等设备，主要用于处理器节点控制和进行简单的计算；在可配置接口单元中提供了加速器的通用接口，以进一步提高处理器的性能。针对设计的多核处理器平台方案，文中将其划分为四部分来分别进行设计。在主控单元部分给出了各个IP核的特点、参数设置和连接方式。互连接口部分中给出了IPIF的生成方法和接口信号的使用。在其他两部分均给出了相应的设计思路和硬件结构。为了方便Microblaze直接控制可配置接口单元，在处理器节点模块中还给出指令译码和指令收集的硬件结构。最后，本文按照设计的硬件结构，在Xilinx公司Virtex-7FPGAVC707评估板上实现了一个2*2mesh规模的NoC多核处理器平台。完成了该处理器平台的软件设计，包括系统的初始化以及典型标准IP核的软件设计。在此基础上，采用了大矩阵相乘来对处理器平台的性能进行了评估。评估结果表明，该处理器平台不仅功能正确，而且在速度上是单个Microblaze的286.73倍。(本文来源于《电子科技大学》期刊2013-04-01）

网络多核处理器论文开题报告

（1）论文研究背景及目的

此处内容要求：

首先简单简介论文所研究问题的基本概念和背景，再而简单明了地指出论文所要研究解决的具体问题，并提出你的论文准备的观点或解决方法。

写法范例：

随着互联网技术的高速发展,对于网络环境安全的需要也越来越紧迫。网络流量分类技术作为实现网络可控性的基础技术和重要手段,在网络管理、服务质量保障和网络安全等领域正在发挥越来越重要的作用。本文研究了现有的网络流量分类技术,总结了基于端口号匹配、基于特征字段分析、基于传输层行为模式和基于流统计特征的机器学习方法各自的优势和不足。鉴于基于机器学习算法的网络流量分类技术分类精度高、易于扩展等优点,选取随机森林作为网络流量分类方法,并针对传统随机森林的不足提出了改进策略,最后再将改进的随机森林策略实现到OCTEON平台上,设计并实现了基于OCTEON多核处理器的网络流量分类系统。最后,搭建了系统测试环境,对系统进行了有效性测试。主要工作有以下几个方面:1、在充分理解传统随机森林算法的基础上,根据算法本身存在的单节点模型训练速度慢和不区分基分类器强弱性能差异的不足,从并行性和加权调整两方面入手提出了改进的随机森林策略;2、对OCTEON本身的硬件特性进行研究,将OCTEON的运行模式、核间同步通信机制和内存分配机制等优秀特性与改机的随机森林策略结合起来,在OCTEON平台上实现改进的随机森林模型;3、实现了基于OCTEON多核处理器的网络流量分类系统,详细介绍了系统的架构设计,各个功能模块的详细设计和实现,并搭建了系统测试环境,对系统的分类性能进行了测试,验证了系统在流量分类方面的优异性能。

（2）本文研究方法

调查法：该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法：用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法：通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法：通过调查文献来获得资料，从而全面的、正确的了解掌握研究方法。

实证研究法：依据现有的科学理论和实践的需要提出设计。

定性分析法：对研究对象进行“质”的方面的研究，这个方法需要计算的数据较少。

定量分析法：通过具体的数字，使人们对研究对象的认识进一步精确化。

跨学科研究法：运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法：这是社会科学用来分析社会现象的一种方法，从某一功能出发研究多个方面的影响。

模拟法：通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

网络多核处理器论文参考文献

[1].童心田.基于片上网络的叁维多核处理器缓存一致性实现方法研究[D].南京航空航天大学.2018

[2].王秋城.基于OCTEON多核处理器的网络流量分类技术研究与实现[D].北京邮电大学.2017

[3].郭桂雨.基于片上网络多核处理器设计与协同验证[D].北京交通大学.2016

[4].王磊,陆超,章隆兵,王剑.基于神经网络预测模型的异构多核处理器调度[J].高技术通讯.2015

[5].遇炳昕.基于OCTEON多核处理器的网络数据过滤技术研究[D].北京邮电大学.2015

[6].王俊辉.高性能多核处理器的低功耗片上网络研究[D].国防科学技术大学.2015

[7].朱新召,胡哲琨,周莉,陈杰,戈志伟.基于多核处理器的多层感知神经网络设计和实现[J].微电子学与计算机.2014

[8].黄海清,孟庆磊.基于OCTEON多核处理器的高精度网络报文处理系统[J].计算机光盘软件与应用.2014

[9].苏文,王焕东,台运方,王靖.面向云计算的多核处理器存储和网络子系统优化设计[J].高技术通讯.2013

[10].贺江.基于片上网络的多核处理器的研究与实现[D].电子科技大学.2013

标签：叁维片上网络; 片上多核处理器; 缓存一致性协议; 多播路由算法;

网络多核处理器论文-童心田

网络多核处理器论文文献综述

网络多核处理器论文开题报告

网络多核处理器论文参考文献

猜你喜欢