导读:本文包含了算法移植和优化论文开题报告文献综述及选题提纲参考文献,主要关键词:计算机软件,Bellman-Ford算法,GPU并行编程及优化技术,并行归约算法
算法移植和优化论文文献综述
刘磊,王燕燕,申春,李玉祥,刘雷[1](2015)在《Bellman-Ford算法性能可移植的GPU并行优化》一文中研究指出提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。(本文来源于《吉林大学学报(工学版)》期刊2015年05期)
朱明,陆小锋,陆亨立,李莹娇,张东升[2](2014)在《AdaBoost人脸检测算法在DSP上的移植与优化》一文中研究指出将Viola等人提出的AdaBoost人脸检测算法由PC机移植到TMS320DM642嵌入式平台,采用EMCV(Embedded Computer Vision Library)移植方案,将PC平台的OpenCV(Open Source Computer Vision Library)视觉库中有关AdaBoost算法的模块修改使之适应嵌入式DSP平台。该移植工作主要解决了OpenCV在嵌入式平台的不兼容问题以及不同体系架构的编译器环境和库文件导致的编译和链接错误。优化工作在TI的编译器CCS中进行,在编译器平台下进行C语言的项目及程序优化,并进行了大量实验数据的对比,给出了优化的方案,对实现系统的实时性有指导性作用。(本文来源于《计算机工程与应用》期刊2014年20期)
王遥[3](2012)在《基于Arm-Linux的周界警戒算法研究及其移植与优化》一文中研究指出随着中国城市化进程的加速,保障公共安全变得越来越重要。视频监控是保障公共安全的重要手段。而传统的视频监控基于PC人工进行监控,移动性差且难以实时,准确,全天候进行监控。随着嵌入式Arm技术的发展,嵌入式设备计算能力显着提高。嵌入式网络ip监控设备结合计算机智能分析成为趋势。这种设备可以突破传统监控地理上的局限,避免人工监控中的疏忽,降低安保成本,并显着提高安保质量。因此嵌入式智能IP监控设备具有广阔的应用前景。本文研究的是基于Arm-Linux的嵌入式智能周界警戒系统。主要工作体现在如下方面:1.本文研究和分析了Arm-Linux嵌入式平台与相关设备的连接关系,并对周界警戒算法进行了需求分析,设计和定义了基于Arm平台的周界警戒系统接口,提供了一套完整的基于嵌入式平台的周界警戒系统解决方案。2.本文分析和研究了已有PC上的周界警戒系统,将周界警戒系统移植到了arm平台上,并根据系统实时性和准确性的需求,对核心算法如卡尔曼滤波和目标跟踪算法做了改进,降低了最坏情况下的计算复杂度并提高了算法的准确性。3.本文深入研究了Arm-Cortex系列内核的特性,从算法层面,代码层面和内存性能层面等多角度对周界警戒算法进行了优化工作,在普通场景中满足了实时应用的标准,在目标较多的极端场景中将处理时间控制在80ms以内。4.本文以海思3516开发板上mpp媒体处理平台为基础设计了一套视频监控demo平台,满足了日常监控与演示的需要,在实测中取得良好的效果。(本文来源于《北京邮电大学》期刊2012-11-30)
刘玲芝[4](2012)在《自主音视频AVS算法在DSP的移植与优化》一文中研究指出随着信息技术的飞速发展,视频在我们学习、工作、生活中的地位逐步提升,并且必将成为不可或缺的一部分。由系统、视频、音频、数字版权管理等四个主要技术标准和符合性测试等支撑标准构成的我国第一个具有自主知识产权的音视频产业的基础性标准——《信息技术先进音视频编码》标准(简称AVS)。 AVS视频标准是该标准的第二部分。视频基准档次标准已经基本成熟,产业化步伐在标准制订过程中已经开始。AVS编解码器的发展成为制约AVS产业化的关键因素。OMAP3530是美国德州仪器公司推出的新一代移动应用处理器,在单一的芯片上集成了具有弹性架构的ARM CortexTM-A8内核、TMS320C64x+DSP内核、图形图像库(IMGLIB)以及丰富的外设资源。TMS320C64x+DSP内核具有2个数据通道、8个独立的功能单(.Ll,.L2,.S1,.S2,.D1,.D2,.Ml和.M2)包括6个算数逻辑功能单元和2个乘法器,两个数据交叉通路。它采用超长指令字(Very Long Instruction Word, VLIW),即在每个时钟周期最高可并行处理8条32位指令,并且具有双16bit扩充功能,能在一个周期内完成双16bit的加减法、乘法、移位、比较等操作。本文旨在将实验室已经研究实现的基于PC机的AVS解码器代码移植到OMAP3530平台上并对其进行优化,最终得到一个基于OMAP3530平台的可以实时解码704*576格式的AVS码流的解码器。本文的主要工作可以分为以下两个方面:第一部分是将本实验室已经研究实现的AVS解码器C代码移植到OMAP3530平台上。鉴于被移植代码的实现环境与本课题实现平台有一定的区别,因此需要对代码进行包括添加相关文件,存储模式的选择,头文件定义,变量的定义及其初始化,存储空间的重新分配等修改,最终得到可以在OMAP3530硬件平台上正常运行的解码器。第二部分是对成功移植到OMAP3530平台上的解码器进行优化。包括解码器代码结构的调整,重新设置变量结构,调整存储空间,使用优化编译选项,编写汇编代码等策略。通过对移植到DSP平台上的C代码进行一系列的优化之后,实现了在OMAP3530仿真环境下可以近似实时解码704*576格式的AVS码流的解码器。通过对比优化前后的解码器,本文所实现解码器的解码速度有了明显提高,基本上达到了实时解码704*576的AVS码流的要求。(本文来源于《太原理工大学》期刊2012-05-01)
高维[5](2012)在《EVRC算法X86和ARM平台的移植与优化》一文中研究指出EVRC算法由于语音质量高和编码速率低而被广泛地应用于第叁代移动通信系统中。EVRC有叁种可选的编码速率:全速率8.55kbps、半速率4.00kbps和1/8速率0.8kbps。全速率和半速率用于语音帧编码,1/8速率用于噪声帧编码。EVRC的编码质量接近QCELP-13k,但是平均编码速率更低并且具有更好的抗干扰性。然而,EVRC编解码算法比其他算法复杂,因此在商业产品中应用所需的成本更高。本论文的内容主要是将EVRC算法优化和移植到X86和ARM这两种最常用的平台上。首先介绍EVRC语音编解码算法,并分析了其中的几个重要模块。然后详细阐述了X86平台上的移植和优化方法,以及ARM平台的移植和优化中使用的简单的汇编优化和编译器选项优化。最后,分别测试编解码器在不同平台上优化前后的性能,使用标准语音质量测试工具PESQ来测试语音质量。优化后的编解码器的复杂度在两种平台上都得到了显着的降低。在X86平台上,编码器复杂度降低了95%以上,解码器复杂度降低了89%。在ARM平台上,编码器和解码器复杂度分别降低了92%和90%。优化后的EVRC算法在一些实时设备上得到了很好的使用。(本文来源于《西安电子科技大学》期刊2012-03-01)
林群[6](2012)在《基于DM6437的车牌识别算法移植及优化》一文中研究指出车辆牌照识别技术是智能交通系统的核心技术之一,经常用于车流量监控,进出控制,电子收费等各种场合,通过管理自动化的应用,可以提高交通管理的能效及减少人工应用,所以他的相关技术研究越来越受到人们的重视。本文的主要研究目的是将车牌识别算法移植到嵌入式DSP平台上,实现车牌识别技术与DSP的结合以及对视频流的检测。本文首先对硬件开发平台和算法原理进行了详细的介绍,然后对基于DM6437的平台进行车牌识别算法移植,并对移植的算法进行优化,优化包括浮点运算、存储内存的优化、内联函数和直方图等的应用以及对算法的结构的优化,移植到平台上的车牌识别进行详细测试。通过对移植后结果的分析与验证,本文移植的车牌识别算法在DSP平台上得到了很好的效果,检测速度和精度上都满足了实际应用的需求。(本文来源于《西安电子科技大学》期刊2012-03-01)
黄康莹[7](2012)在《基于DM642的MPEG-4算法移植与优化》一文中研究指出随着移动互联网和数字多媒体技术的发展,嵌入式视频编码设备得到了广泛地应用。MPEG-4作为一种相当成熟的视频编码标准,具有适中的算法复杂度、较好的压缩性能以及在嵌入式平台上良好的可移植性,被大量用于网络视频和移动互联网等领域。最新的嵌入式视频设备不仅需要具备视频压缩编码功能,同时还需要具备视频分析功能,这要求嵌入式平台编码器具有更低的计算复杂度,并能开放视频分析所需的内容接口。本文针对这一需求,对MPEG-4算法进行移植和优化,并在DM642上最终完成实时视频编码和网络视频传输。本文首先分析和研究了MPEG-4的技术原理和关键模块以及DM642的平台特性,移植和裁剪了合适的MPEG-4编码器,使其适应实际的需求。接着在算法方面,本文主要针对计算复杂度最高的运动搜索模块进行优化改进。本文在现有快速运动估计算法的基础上,提出了一种改进算法,算法利用多运动矢量预测、搜索提前中止以及新的搜索模板,极大地减少了运动搜索的次数。其次在优化层面上,本文根据DM642的体系结构特性调整和改进了编码器的编码框架,并用线性汇编和TI库函数重写了编码器中运算量大的核心模块,如SAD,量化等,提高了编码器的效率。然后本文也编写了摄像头驱动程序,实现了DM642直接对模拟摄像头数据的采集以及YUV422到YUV420格式的视频转换。最后本文重新定义了视频数据包的UDP封装,并实现了网络通信功能,只需占用极少的CPU资源实现视频数据流的网络传输。最终实验结果表明,本文移植和优化的MPEG-4算法能在DM642上完成4CIF大小视频实时编码并实现网络传输功能。(本文来源于《北京邮电大学》期刊2012-01-03)
杨洪泽,程耀瑜[8](2011)在《H.264算法的DSP移植与优化》一文中研究指出在TMS320DM643平台上实现H.264基档次编码器的移植与优化显得格外实用和必要。基于对DSP平台的结构特性和H.264的计算复杂度分析,主要从核心算法、数据传输和存储器/Cache使用几方面对H.264编码器进行了优化。实验结果表明,对于C IF格式的视频序列,优化后的H.264编码器能够达到每秒高于24帧的编码速度,满足了视频处理对于实时性的要求。(本文来源于《山西电子技术》期刊2011年01期)
鲍协浩[9](2011)在《DaVinci平台上H.264视频编码算法移植优化与xDM封装》一文中研究指出作为新一代视频编码标准,H.264具有适用性强、压缩率高和图像质量好等特点。在相同的重构图像质量下,它相比以往标准码率更低、误码更少,更适用于传输条件恶劣的信道中的视频传输。但是,H.264在具备这些优势的同时,带来的是算法复杂度的大大提高。因此,如何在嵌入式视频系统中实现高质量高效率的H.264视频编码一直是业内研究的热点。德州仪器公司(TI)推出的双核架构(ARM+DSP)的达芬奇处理器是新一代多媒体通信终端的理想实现平台。在达芬奇平台上,数字媒体处理算法需符合TI提出的xDM算法标准,应用程序通过Codec Engine框架集成并调用xDM算法。为实现基于达芬奇平台的视频系统,本文研究H.264视频编码算法的移植和优化方法,针对达芬奇平台实现算法的xDM封装,以便算法通过Codec Engine框架调用。基于QT设计并实现一套数字媒体处理算法的Codec Server自动部署系统,具有快速集成、验证与修改xDM算法的功能,解决达芬奇平台上算法的Codec Server集成和应用程序部署不便的问题。在研究H.264视频编码算法关键技术的基础上,结合达芬奇平台硬件资源,对开源H.264编码算法的X264代码进行移植。根据程序开发流程对移植代码进行优化,采用了编译器选项优化、C语言代码优化、汇编优化和内存分配优化等主要手段。对于CIF格式视频,优化前的编码帧率仅不到1fps,优化后将近18fps。(本文来源于《北京邮电大学》期刊2011-01-11)
吕媛[10](2011)在《G.723.1算法ARM平台移植与优化》一文中研究指出在现代各种通信系统中,语音通信一直是一项重要的、必不可少的业务。语音压缩和编码在移动通信、VoIP、多媒体信息传输、保密通信等领域发挥着重要的作用。多种语音编解码的国际标准相继出台,中低速率的语音编码及其应用已成为一个重要研究领域。G.723.1是ITU-T在1996年提出的一种具有5.3kbps/6.3kbps双速率的高效率语音编解码标准,以其卓越的性能被广泛应用在各种领域。但它的高质量和低码率,是以高复杂度的编码算法、较高的延迟以及较大的存储空间换得的,这也大大增加了它的实时实现难度。由于ARM嵌入式处理器具有成本低、易开发等众多优点,非常适合于实时处理语音编解码器。因此,在ARM平台上有效地实现G.723.1算法是很有必要的。本论文首先对G.723.1编解码器的算法原理进行了描述,接下来具体论述了将该算法进行ARM平台移植与优化的方法。优化的目的是在尽量不降低压缩语音质量的同时尽可能地减少指令周期数。优化过程中使用的方法包括:算法优化、C代码结构优化和汇编优化。通过与优化前的算法进行对比,移植和优化之后,G.723.1编码器的复杂度降低了80%以上,解码器的复杂度降低了60%以上。优化后的G.723.1语音编解码算法能够在ARM平台上实时实现,从而可以将它投入到许多实际应用当中去。(本文来源于《西安电子科技大学》期刊2011-01-01)
算法移植和优化论文开题报告
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
将Viola等人提出的AdaBoost人脸检测算法由PC机移植到TMS320DM642嵌入式平台,采用EMCV(Embedded Computer Vision Library)移植方案,将PC平台的OpenCV(Open Source Computer Vision Library)视觉库中有关AdaBoost算法的模块修改使之适应嵌入式DSP平台。该移植工作主要解决了OpenCV在嵌入式平台的不兼容问题以及不同体系架构的编译器环境和库文件导致的编译和链接错误。优化工作在TI的编译器CCS中进行,在编译器平台下进行C语言的项目及程序优化,并进行了大量实验数据的对比,给出了优化的方案,对实现系统的实时性有指导性作用。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
算法移植和优化论文参考文献
[1].刘磊,王燕燕,申春,李玉祥,刘雷.Bellman-Ford算法性能可移植的GPU并行优化[J].吉林大学学报(工学版).2015
[2].朱明,陆小锋,陆亨立,李莹娇,张东升.AdaBoost人脸检测算法在DSP上的移植与优化[J].计算机工程与应用.2014
[3].王遥.基于Arm-Linux的周界警戒算法研究及其移植与优化[D].北京邮电大学.2012
[4].刘玲芝.自主音视频AVS算法在DSP的移植与优化[D].太原理工大学.2012
[5].高维.EVRC算法X86和ARM平台的移植与优化[D].西安电子科技大学.2012
[6].林群.基于DM6437的车牌识别算法移植及优化[D].西安电子科技大学.2012
[7].黄康莹.基于DM642的MPEG-4算法移植与优化[D].北京邮电大学.2012
[8].杨洪泽,程耀瑜.H.264算法的DSP移植与优化[J].山西电子技术.2011
[9].鲍协浩.DaVinci平台上H.264视频编码算法移植优化与xDM封装[D].北京邮电大学.2011
[10].吕媛.G.723.1算法ARM平台移植与优化[D].西安电子科技大学.2011
标签:计算机软件; Bellman-Ford算法; GPU并行编程及优化技术; 并行归约算法;