发育机器人论文-黄敏,路飞,李晓磊,田国会,孟可

发育机器人论文-黄敏,路飞,李晓磊,田国会,孟可

导读:本文包含了发育机器人论文开题报告文献综述及选题提纲参考文献,主要关键词:服务机器人,服务认知,自主发育,增量分层判别回归

发育机器人论文文献综述

黄敏,路飞,李晓磊,田国会,孟可[1](2019)在《基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统》一文中研究指出为了解决传统的基于知识或基于学习的机器人服务认知机制的智能性和普适性较差的问题,构建了一个基于IHDR(增量分层判别回归)算法和BP(反向传播)神经网络复合框架的机器人服务任务自主认知和自主发育系统.在家庭服务机器人智能空间中丰富的传感器和物联网技术的支持下,采集大量用于机器人学习和发育的样本数据;在此基础上,针对智能空间样本数据的混合特性,设计改进的IHDR算法,实现对混合型样本数据的聚类更新和响应计算,并将生成的IHDR树作为机器人存储历史经验的"大脑",使机器人能够利用"大脑"中已有的经验进行自主学习和相应判断,以实现对服务的自主认知;利用JSHOP2(Java simple hierarchical planner)规划器对认知的复杂任务进行分解,得到可被机器人直接执行的原子任务.为了避免IHDR树规模不足的局限性,设计基于BP神经网络的服务认知算法,利用样本数据训练BP神经网络,实现智能空间实际场景到用户所需服务的映射,在IHDR树无法提供历史经验的情况下,使机器人仍能基于BP神经网络自主进行服务决策.然后将此映射结果以增量的方式更新到IHDR树中,丰富其具备的经验知识,实现机器人服务自主认知能力的发育.仿真实验结果表明,该复合框架可以有效提高服务机器人对智能空间情景下用户所需服务的认知准确性及认知发育能力,推进人机共融的实现.(本文来源于《机器人》期刊2019年05期)

张俊琴[2](2018)在《基于内在动机的发育机器人路径规划的研究》一文中研究指出针对强化学习,人工势场算法等在两轮机器人的躲避障碍物和最优路径规划任务中存在的算法速度慢,白板学习和维数灾难以及自主能力不高等问题,受仿生学内在动机启发,将内在动机机制分别与Q学习算法,人工势场算法以及分层强化学习算法相结合,来解决以上问题。主要研究如下:1)强化学习在应用到机器人避障和路径规划当中存在着效率差且自发育能力不足等问题,提出了一种基于内在动机的Q学习算法(IM-Q学习算法)。该算法是用内在动机机制替换Q学习算法中的奖励值,从而使机器人能像人类一样通过动机来对做出决策,使机器人能自主发育并很好地完成路径规划任务。2)针对IM-Q算法在路径规划中前期存在白板学习导致整体学习效率底下的问题,结合了人工势场法,提出了基于内在动机的引力场Q学习算法(IM-GF-Q)。该算法首先利用引力场对环境模拟,为算法提供先验知识,然后再用IM-Q学习算法进行训练,从而提高了机器人在未知环境中对环境的学习和整体路径规划的速度。3)在实际情况中,障碍物不都是静止的,大多数情况下都存在动态障碍物,增加了机器人实现任务的难度,为了进一步提升机器人避障和路径规划的能力,提出了基于内在动机的分层强化学习算法(IM-HRL)。该算法利用分层原理,将普通的强化学习算法进行分层,把环境信息和任务详细分到各层去,从而简化算法的结构和求解效率,使机器人在未知的动态复杂环境中的避障和路径规划一样能很好地实现。基于内在动机的学习算法,主要针对机器人路径规划和避障任务,实验证明所提算法有效地实现了机器人在未知环境中的最优路径规划,为今后机器人自主学习和路径规划提供了新颖的想法。图41幅;表3个;参53篇。(本文来源于《华北理工大学》期刊2018-11-26)

韩建达,方勇纯,赵新,刘景泰[3](2018)在《机器人的智能发育》一文中研究指出当前,机器人技术受到了空前的关注,被认为是新技术革命的重要支撑。让机器人走进人类正常的生产环境、医疗/公共服务环境、甚至家庭环境,使其成为人类的助手和伙伴,已经成为新一代机器人的目标。要实现这一目标,现有的机器人需要突破两大技术瓶颈:一是如何使机器人具有与人类作业灵巧性与安全性相匹配的本体;二是如何使机器人具备与人相匹配的最基本的智能。要实现机器人与人、与人(本文来源于《人工智能》期刊2018年03期)

蔡建羡,阮晓钢,于乃功,柴洁,朱晓庆[4](2018)在《基于认知发育的移动机器人自主导航》一文中研究指出针对未知环境中移动机器人的导航问题,基于生物学的认知和发育机理构建自主导航的认知发育模型。通过自主插入神经元节点,设计结构可动态发育的神经网络,模拟生物的发育特性达到与应用需求相匹配的网络规模。通过热力学过程模拟动物的渐近学习特性,设计认知学习算法,并从理论上证明算法的收敛性。实验结果表明,该模型可使机器人模拟动物从环境中自动获取知识、积累经验,通过认知发育具备自主导航技能。(本文来源于《计算机工程》期刊2018年01期)

谢自强[5](2018)在《发育机器人增量学习方法研究》一文中研究指出发育机器人是指机器人能够像人类婴儿一样实现自主心智发育,不再针对特定的任务编程,而是以一套自主发育算法为基础通过不断的学习获取执行未知任务的能力,从而解决目前机器人针对特定任务进行编程,功能单一并且自适应性差等问题。因此具有自主学习能力的发育机器人成为许多学者研究的热点。本文针对发育机器人的视觉特征提取算法和自主发育算法进行理论和实验研究。首先是机器人的视觉特征提取算法。发育机器人对特征的学习必须是实时进行的。机器人依靠其视觉系统获取外界信息,然后对图像进行处理。但是一般摄像头的分辨率较高,获取的视频帧图像维度较大,机器人的计算能力有限,无法实现对视频图像实时处理,因此需要对图像进行特征提取,降低图像的维度,减少机器人的处理时间。本文结合已有的直观无协方差增量主成分分析算法和双向主成分分析算法,提出一种新的增量双向主成分分析算法,实现对图像的特征提取。算法采用迭代的计算方式,具备增量的计算能力,并且将二维原始图像矩阵直接作为处理对象,有效地降低了计算量,缩短了程序运行时间,基本满足发育机器人对视频图像的实时处理需求。发育机器人具有自主学习能力的核心是自主发育算法。本文通过模拟人大脑视觉皮层的工作机制,建立一种基于自主发育神经网络的机器人自主发育学习算法。算法采用叶分量分析算法实现发育过程,通过预响应值衡量神经网络的输入与网络内部知识的匹配程度,采用Top-k竞争机制模拟神经元侧抑制效应,利用赫布学习规则更新竞争获胜神经元的权重向量,并针对遗忘过程引入神经元年龄的概念。发育机器人通过自主发育神经网络对输入的样本图像进行学习,将学习的内容存储在神经网络中,形成稳定的记忆。本课题以六自由度可重构机器人作为研究平台,实现机器人对待抓取积木块的认知学习。本文作为前期研究主要完成机器人视觉特征提取和自主发育算法的基础研究。实验采用机器人在实际环境下获取的待抓取积木块的实物视频截图对算法进行了验证。实验总共分为两个部分。在特征提取实验中,将样本图像以增量的形式输入算法中,对叁种算法进行对比,实验结果表明,本文提出的增量双向主成分分析算法的分类率高于其他两种算法,达到了90%以上,同时运算时间要小于其他两种算法,基本达到了对视频的处理速度。在自主发育神经网络的实验中,利用神经网络分别对标准的手写数字数据集和积木块实物图像进行发育学习和预测分类,对神经元的权重向量进行了可视化,展示了神经网络的学习结果,实现对不同物体的分类和识别,说明自主发育神经网络可以实现发育机器人的学习和认知。(本文来源于《天津理工大学》期刊2018-01-01)

赵传松[6](2017)在《基于MDB的两轮自平衡机器人发育模型研究》一文中研究指出针对两轮自平衡机器人的直线行走自平衡控制问题,借鉴认知科学中人脑的双系统理论,建立通用认知模型,引入MDB(Multilevel Darwinist Brain,多层达尔文脑)认知发育范式,并基于此建立具有不同运算结构的发育算法模型。该类模型能够使机器人在与环境多次交互后,自主习得自平衡控制规则。针对MDB范式进化学习问题,在连续动作学习自动机(CALA:Continuous action learning automata)和进化策略模型(ES:Evolutionary strategy)基础上提出一种具有遗传特性的自主寻优算法,即基于进化策略的学习自动机模型(ESCALA),由动作函数、输出、学习函数叁部分组成。动作函数为正态分布函数,输出依照正态分布随机选择,采用进化策略方法调整动作函数的参数。实验结果表明,ES-CALA能表现出自主学习特性。针对两轮自平衡机器人的直线行走自平衡控制问题,将多个ES-CALA并行组合构成CALA组,建立if-then结构的认知发育模型。该模型由动机模型、控制环路和学习环路构成。通过自主学习能力实验与自适应实验表明,机器人能够自主学习获得自平衡控制规则,并且能适应变化的环境,表现出MDB范式的基本特性。针对ES-CALA方法描述的控制规则对倾角进行控制时,会出现较小角度的波动问题。建立了改进世界描述的认知发育模型,能在保持自主学习能力的情况下,消除小角度波动。该模型由控制环路、规则进化环路和模型修正环路构成。在Simulink/MATLAB平台,验证其能达到预期效果。基于ES-CALA建立了发育模型,并提出一种改进的方法。对于ES-CALA可以建立级联网络,对于世界模型可以采用神经网络、支持向量机或是随机森林等计算单元,用于解决更加复杂繁琐的问题。(本文来源于《华北理工大学》期刊2017-12-04)

刘伟民[7](2016)在《基于记忆机制的机器人视觉发育方法研究》一文中研究指出借鉴人类大脑皮层结构工作原理和信息记忆机制,研究基于记忆机制的机器人视觉发育方法,通过仿人智能图像处理方法实现场景的在线感知与学习,优化目标检测与跟踪框架,通过内在动机驱动使机器人自主探索学习新场景或新目标。依据海马、前额叶生理结构和功能以及“海马-前额叶”视觉感知神经回路,提出了一种基于记忆机制的图像信息处理模型,并设计了基于人类记忆机制的视觉计算模型。课题研究成果如下:1)针对目标跟踪算法中,因外界环境光照改变、目标姿态变化及目标发生遮挡时引起跟踪飘移或丢失目标等问题,提出一种基于人类记忆机制压缩多特征加权目标跟踪算法。利用人类记忆机制更新目标特征子空间,根据新输入目标特征与记忆库中已有的目标特征相对比,按记忆机制的图像信息处理认知模型进行更新子空间。实验结果验证了算法能够有效的增强特征对纹理改变、目标遮挡和光照变化的稳健性,表现了记忆库对目标学习和分类的能力。2)提出一种基于人类记忆机制的霍夫森林目标跟踪方法,该方法在压缩跟踪算法框架下,引入在线霍夫森林决策树,着重处理图像块与目标中心的位置关系,融入多种样本空间位置信息并规避过拟合的问题;引入人脑机制瞬时、短时、长时叁个工作记忆空间,实时更新目标特征,提高了目标匹配的速度和精度。3)将基于人类记忆机制目标跟踪算法应用到履带式目标跟踪机器人平台上,机器人始终保证目标在可视场景的中心,实时准确地跟踪目标,实验效果验证了提出的跟踪算法的实用性,证明了基于人类记忆机制的机器视觉发育方法有广阔的应用前景。课题提出的记忆机制的机器人视觉发育方法,在图像信息处理方面模仿了人类大脑关于信息记忆机制的感知能力,对目标检测与跟踪框架进行了优化,在自主探索学习,目标特征信息的积累以及不确定任务学习等智能行为学习较传统的智能体有较大的改进,为机器人视觉发育研究提供了一种新的思路和方法。(本文来源于《华北理工大学》期刊2016-12-05)

马爽[8](2016)在《具有自主发育能力的机器人感知与认知方法研究》一文中研究指出集装箱装卸自动化是运输集装箱化的必然要求,在当前集装箱装卸作业中,扭锁的装卸仍然由人工来完成,这不仅增加了劳动强度,降低了生产效率,还严重威胁到工人的人身安全,亟需以机器人为核心的自动化技术来取代人工操作。本文以海港集装箱扭锁的自动化安装为研究背景,根据扭锁安装需求搭建模拟平台,主要解决扭锁的认知识别与抓取位姿估计问题。由于扭锁种类繁多,且随着需求不断改进更新,抓取任务不断有新的挑战,机器人的认知系统需要在线实时地更新、存储新的特征,否则无法准确识别新类别物体。而传统机器人的认知系统存在任务确定、离线学习、实时性差及自适应性差等问题,无法完成非特定任务。为了解决从工作场景中识别并准确抓取指定物体的问题,针对传统机器人认知系统存在的局限性,从认知机器人的研究思路出发,模拟人类学习方式、智能表现形式以及人脑智能信息处理机制,建立本文的机器人认知系统,使机器人通过在线学习,将累积的知识和经验动态有组织地存储到记忆系统中,在执行任务时回调以往的经验知识做出准确的识别,进而获取准确的位姿估计。基于自主发育范式将扭锁抓取机器人的认知系统分为:感知发育、认知发育以及任务执行叁大模块,从叁个功能模块展开,本文主要的研究工作如下:(1)传感器数据预处理,本文提出了基于分域策略的联合双边滤波预处理方法,解决了Kinect传感器采集的深度图像存在漏洞、不对齐以及噪声等问题。根据Kinect传感器叁种误差来源的区域特性,对深度图像进行分区域滤波处理。根据深度图像和彩色图像的结构相关性,对深度像素进行分类,将漏点及不对齐像素归类为不可信任区域,其余像素归为可信任区域。融合彩色图像信息,采用联合滤波方法对深度图像进行引导滤波,针对可信任区域像素采用联合叁边滤波方法;针对不可信任区域中边缘像素采用Sigmoid-方向高斯的联合双边滤波方法,非边缘像素采用Sigmoid-颜色相似的联合双边滤波方法。其中,基于增强学习中的奖惩原则,使用Sigmoid函数为不可信任区域像素动态产生置信度空域权重,赋予滤波邻域内与中心点属性相同的可信任信息较高权重;使用方向高斯滤波函数为边缘像素产生颜色权重,赋予滤波邻域内与边缘方向一致的像素较高权重,保留边界方向性;基于可信度势场理念选取滤波方向,确保滤波邻域内含有更多有效的与待滤波点属性相同的可信任信息,通过以上策略手段来保证滤波后深度信息的合理性和准确性。最后通过对比实验从视觉度量、降噪性能及运行时间上,有力地证明了本文滤波方法的优越性能。(2)本文提出了在线自适应增量PCA学习方法,解决了感知发育中特征提取与数据降维问题。该方法能够在线自主地发现和选择输入数据的有效特征,更新优化特征空间,发育出适合机器人内部表达的模型。针对PCA学习方法对样本数量及多样性依赖程度高、缺乏自适应性、不能在线增量更新、可扩展性差等问题;增量PCA方法随着样本输入,特征维度、计算量和存储量都随之增加等问题。本文算法在增量PCA的基础上进行改进,基于新样本与已有特征空间重建样本之间的差异程度监测新类别输入,控制特征空间增量地更新;基于类内距离比较,自适应地更新类内距离阈值,优化特征空间向量。实验表明该算法在少量训练样本的情况下,能够在线地学习、更新与优化、累积新特征,将高维输入信号合理降维,增强了视觉系统的感知和识别能力。(3)本文借鉴人脑记忆系统中前额叶、海马以及海马前额叶回路的信息处理机制,提出了叁层的基于增量式神经网络的认知发育模型,能够在线对所学的知识和经验实时有效地存储、累积、整合以及回调,解决传统数据库存储知识的固定性、封闭性等问题,更好地适应未知的动态环境。认知发育网络中有监督学习和无监督学习方式可同时并存,随着与外界不断的交互,中间层神经元同时接受外界通过效应层传递的自上而下的监督指导信号和来自输入自底向上的响应信号,使用Hebbian学习规则来模拟神经元学习响应过程,采用Top-K竞争机制模拟神经元的侧抑制效应,引入遗忘平均函数产生权重模拟人类接受新知识的速度,通过以上策略模拟大脑皮层理解、记忆情况。认知发育神经网络在第四章感知发育模块基础上,基于重建误差控制神经网络节点的增加,基于熟悉相似度控制被激活神经元的权重更新。通过实验表明,认识发育网络可以将学习的结果以“知识”的形式有组织地、动态地存储到记忆系统中,取代传统数据库,提高了扭锁的准确识别率。(4)扭锁抓取位姿估计,本文根据扭锁安装需求搭建抓取平台,经认知分析后获取扭锁正确类别及其正反面信息,与相应类型的标准位姿做比对,将位姿估计问题简化为两个点云集匹配问题,采用迭代最近点(ICP)算法估算可抓取点的位置和姿态,为下一步抓取规划提供数据支持。通过实验,证明了该方法的可行性。最后,总结全文所做的工作,提出今后进一步需要研究的问题。(本文来源于《吉林大学》期刊2016-12-01)

李威凌[9](2016)在《基于脑心智发育网络模型的移动机器人场景认知研究》一文中研究指出传统的移动机器人控制及规划方法中,往往任务单一、学习过程是离线的且建模过程复杂,很难适应未知环境。本文研究了基于脑心智发育网络模型的移动机器人场景认知,以提高机器人的智能性,使机器人能够经历像人一样的学习和成长过程,逐渐适应复杂多变的环境。主要工作如下:首先,介绍了人脑工作机理以及基于生物视觉机制的场景认知方法,并对比研究了在两种场景下谱残差检测方法、基于引导学习检测方法和基于元胞自动机检测方法的效果,分析了它们的优缺点。然后,设计了基于光度立体方法的人脸检测实验,与传统的人脸图像方法相比,该方法能有效克服光照因素的影响,检测效果提高。在此基础上了,结合IHDR算法设计了人脸识别实验。实验结果反映了结合IHDR算法和基于光度立体构建叁维人脸的方法用于人脸识别上具有较好地效果。最后,提出了一种基于自主学习框架的机器人视觉导航方法,通过人为规划路径指导机器人学习,并运用IHDR自主学习框架建立场景图像和机器人运动速度之间的映射关系知识库。当机器人在线运行时,只需检索知识库便可实现自主导航。然而这种方法仅限于静态场景中,为了使机器人能适应更为复杂的场景,提出了结合学习算法和环境建模的机器人自主规划方法,使机器人保持在安全范围内行驶。在复杂环境下的机器人自主规划实验中,验证了结合自主学习框架和避障方法的可行性,机器人可适应更为复杂的场景。(本文来源于《武汉科技大学》期刊2016-05-19)

向迎帆[10](2015)在《一种仿生发育算法在两轮机器人中的研究》一文中研究指出针对两轮机器人的自平衡控制与路径规划的问题进行研究,借鉴发展心理学中内在动机的概念作为智能体发育模型中的内部奖励,提出一种基于内在动机的仿生发育算法。该算法利用不同的学习框架,受发展心理学所启发,将内在动机作为内部奖励,最终提高机器人在未知环境下的学习效率,驱动机器人的学习过程。论文取得的主要研究成果如下:1)基于内在动机的强化学习算法论文在有关发展心理学、机器人学和生物神经科学的研究基础上,提出了一种基于内在动机的强化学习算法。将该算法应用在两轮自平衡机器人上,使其渐进的学会了行为与奖赏信号或惩罚信号之间的对应关系,从而使机器人完成了自平衡控制。2)基于内在动机的学习自动机算法针对机器人在未知环境中学习自适应能力差问题,结合心理学内在动机思想,提出了一种基于内在动机的学习自动机算法。该算法使机器人通过与环境进行“感知-动作-感知”的交互过程,并由内在动机机制作用,使机器人学会了动作与奖励信号之间的对应关系,从而完成了路径规划任务。3)基于小脑-基底核-大脑皮层回路的机器人认知发育算法针对机器人连续行为学习问题,模拟人或动物神经系统结构及其神经信息演化规律,根据生理学中感觉运动系统的相关知识,引入心理学中的内在动机机制驱动学习,提出一种基于小脑-基底核-大脑皮层回路的机器人认知发育算法。该算法能够成功的使机器人学会平衡控制技能,具有一定的鲁棒性,表现出了良好的自组织、自适应和自学习能力。(本文来源于《华北理工大学》期刊2015-11-30)

发育机器人论文开题报告

(1)论文研究背景及目的

此处内容要求:

首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。

写法范例:

针对强化学习,人工势场算法等在两轮机器人的躲避障碍物和最优路径规划任务中存在的算法速度慢,白板学习和维数灾难以及自主能力不高等问题,受仿生学内在动机启发,将内在动机机制分别与Q学习算法,人工势场算法以及分层强化学习算法相结合,来解决以上问题。主要研究如下:1)强化学习在应用到机器人避障和路径规划当中存在着效率差且自发育能力不足等问题,提出了一种基于内在动机的Q学习算法(IM-Q学习算法)。该算法是用内在动机机制替换Q学习算法中的奖励值,从而使机器人能像人类一样通过动机来对做出决策,使机器人能自主发育并很好地完成路径规划任务。2)针对IM-Q算法在路径规划中前期存在白板学习导致整体学习效率底下的问题,结合了人工势场法,提出了基于内在动机的引力场Q学习算法(IM-GF-Q)。该算法首先利用引力场对环境模拟,为算法提供先验知识,然后再用IM-Q学习算法进行训练,从而提高了机器人在未知环境中对环境的学习和整体路径规划的速度。3)在实际情况中,障碍物不都是静止的,大多数情况下都存在动态障碍物,增加了机器人实现任务的难度,为了进一步提升机器人避障和路径规划的能力,提出了基于内在动机的分层强化学习算法(IM-HRL)。该算法利用分层原理,将普通的强化学习算法进行分层,把环境信息和任务详细分到各层去,从而简化算法的结构和求解效率,使机器人在未知的动态复杂环境中的避障和路径规划一样能很好地实现。基于内在动机的学习算法,主要针对机器人路径规划和避障任务,实验证明所提算法有效地实现了机器人在未知环境中的最优路径规划,为今后机器人自主学习和路径规划提供了新颖的想法。图41幅;表3个;参53篇。

(2)本文研究方法

调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。

观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。

实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。

文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。

实证研究法:依据现有的科学理论和实践的需要提出设计。

定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。

定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。

跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。

功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。

模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。

发育机器人论文参考文献

[1].黄敏,路飞,李晓磊,田国会,孟可.基于IHDR算法和BP神经网络复合框架的机器人服务自主认知和发育系统[J].机器人.2019

[2].张俊琴.基于内在动机的发育机器人路径规划的研究[D].华北理工大学.2018

[3].韩建达,方勇纯,赵新,刘景泰.机器人的智能发育[J].人工智能.2018

[4].蔡建羡,阮晓钢,于乃功,柴洁,朱晓庆.基于认知发育的移动机器人自主导航[J].计算机工程.2018

[5].谢自强.发育机器人增量学习方法研究[D].天津理工大学.2018

[6].赵传松.基于MDB的两轮自平衡机器人发育模型研究[D].华北理工大学.2017

[7].刘伟民.基于记忆机制的机器人视觉发育方法研究[D].华北理工大学.2016

[8].马爽.具有自主发育能力的机器人感知与认知方法研究[D].吉林大学.2016

[9].李威凌.基于脑心智发育网络模型的移动机器人场景认知研究[D].武汉科技大学.2016

[10].向迎帆.一种仿生发育算法在两轮机器人中的研究[D].华北理工大学.2015

标签:;  ;  ;  ;  

发育机器人论文-黄敏,路飞,李晓磊,田国会,孟可
下载Doc文档

猜你喜欢