当前位置:大学毕业论文> 本科论文>材料浏览

关于型仿生机器人论文范文写作 一种记忆可修剪型仿生机器人的速度跟踪算法相关论文写作资料

主题:型仿生机器人论文写作 时间:2024-02-18

一种记忆可修剪型仿生机器人的速度跟踪算法,本文关于型仿生机器人论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

型仿生机器人论文参考文献:

型仿生机器人论文参考文献 连续型电子期刊可以评职称吗智能机器人论文机器人期刊连续型电子期刊

摘 要: 针对强化学习算法训练网络规模较大、运行时间较长、过度拟合等问题,提出一种记忆可修剪型强化学习仿生模型(H?RLM)作为两轮机器人的学习机制.该算法将神经网络输出与期望输出的最小均方差作为代价函数,采用Hessian矩阵和Markov相结合的决策进行寻优,选择最大评价值对应的最优行为.这样既可以保证初期网络学习训练内容的完整性,又降低了系统对初始条件的约束性,提高了控制算法的泛化能力.利用H?RLM和强化算法对两轮机器人进行速度跟踪实验,结果表明,H?RLM算法能够提高网络学习效率、消除延迟影响、减小输出误差,获得了良好的动态性能.

关键词: 强化学习; 可修剪仿生模型; Hessian矩阵; 两轮机器人

中图分类号: TN911?34;TP391.4 文献标识码: A 文章编号: 1004?373X(2017)15?0141?05

Abstract: Since the reinforcement learning algorithm has the problems of large scale, long running time and over fitting for network training, a pruning reinforcement learning model (H?RLM) taken as the learning mechani of the two?wheeled robot is proposed. The output of neural network and least mean square error of expected output are deem as the cost function of the algorithm. The Hessian matrix and Markov decision model are combined to select the optimal behior corresponding to the maximum evaluation value, which can ensure the integrity of the training content of the network learning in initial period, and reduce the system contraints for initial conditions, and improve the generalization ability of the control algorithm. The speed tracking experiments were carried on by means of H?RLM algorithm and reinforcement learning algorithm. The experimental results show that the H?RLM algorithm can improve the network learning efficiency, eliminate the delay effect, reduce the output error, and obtain better dynamic performance.

Keywords: reinforcement learning; pruning bionic model; Hessian matrix; two?wheeled robot

0 引 言

仿生的思想就是使机器具有像人一样的学习能力,在没有人为参与的情况下,机器人能够自主完成任务来适应未知环境,其自主学习能力的强弱是十分关键的.强化学习是一种基于“感知?行动”的学习过程,待训练系统感知外界环境状态,选取某一策略作用于环境,环境接受该动作后状态发生变化,同时给出一个激励信号(奖励/惩罚)给强化学习系统,其系统根据强化信号和环境的当前状态再选择下一个动作,选择的原则是使受到奖励的概率增大[1?3].强化学习其优秀的自适应调节性能在自动化技术、智能控制、分析预测等领域得到了广泛的应用,但其网络规模过大、网络结构复杂和高度结构化造成的过拟合、泛化能力低等现象越来越引起研究人员的注意.

国内外研究人员希望在保持良好性能的同时使网络的规模最小化,通过选择有序的方式削弱或者消除某些突触权值来修剪多层感知器,既可以提高系统的降噪能力,又减少网络训练时间,增强系统网络的泛化能力[4?5].修剪算法?最优脑外科过程算法(OBS)对神经元网络连接权值进行修剪[6].文献[7]利用修剪技术与参数调整使动态模糊神经网络具有强大的泛化能力,快速的学习速度,紧凑的系统结构.文献[8]实现控制系统参数的自整定和消除控制系统的延迟,利用随机产生数组的方法减少强化学习偏差的过渡时间和增强系统的寻优能力.文献[9]将扩展信息滤波和“生长?修剪”训练基函数神经网络,获得了紧凑的网络拓扑结构,提高了在实际工程中复杂非线性问题的泛化能力,降低了预测误差.文献[10]将PWG技术(Pruning?While?Growing)应用到多输入欧拉多项式神经网络,使其选择隐层和输出层最佳的连接权重,并优化隐层神经元数目和层数,提高了系统的预测精度和实时性.

本文针对强化学习算法训练神经网络结构存在冗余、过拟合、泛化能力差等现象,提出一种记忆可修剪型强化学习仿生模型(H?RLM),作为两轮机器人的学习机制.利用误差曲面的二次导数信息得到网络复杂度和训练误差性能之间的折中方案.H?RLM算法根据神经元输出最小均方差对强化学习网络结构进行修剪,仿真结果表明,该模型有效地提高了两轮机器人的学习效率,修剪后的网络处理信息能力强,获得了较稳定的动态平衡过程.表明该认知模型的自学习动态变化特性,并生动地模拟了记忆遗忘的认知过程.

结论:适合不知如何写型仿生机器人方面的相关专业大学硕士和本科毕业论文以及关于型仿生机器人论文开题报告范文和相关职称论文写作参考文献资料下载。

协作型工业机器人如何更智能
在现代工厂中,工人和机器人是两大主要劳动力。出于安全考虑,机器人通常被限制在金属笼中与人分离开,而这无疑限制了生产力,以及生产线的灵活性。近年来。

有尺寸同型机分批排序问题近似算法
摘要:对工件有不同到达时间、不同加工时间和尺寸的同型机分批排序问题寻找近似算法。对于大工件(工件的体积严格大于机器容量的1 2)的加工时间不小于。

高职学生英语词汇记忆几种方法
摘 要:随着时代的发展和社会的进步,英语学习、英语教学越来越受到人们的普遍重视,英语已从一种工具变成了一种思想,一种知识库。没有掌握英语犹如缺乏。

有型是一种态度
张爱玲曾在《传奇》的再版序言里写道,“呵,出名要趁早呀!来得太晚的话,快乐也不那么痛快。”这个道理,在任何时代都不会错。如今的艺术圈,一些80。

论文大全