机器人运动学(机器人运动控制之学习方法:模仿学习和强化学习)
Posted
篇首语:我们用人生最好的年华做抵押,去担保一个说出来都会被人嘲笑的梦想。本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器人运动学(机器人运动控制之学习方法:模仿学习和强化学习)相关的知识,希望对你有一定的参考价值。
机器人运动学(机器人运动控制之学习方法:模仿学习和强化学习)
“机器人”一词首次出现于1920年捷克作家卡雷尔·恰佩克(Karel Capek)创作的科幻剧本《万能机器人》中。随着科技的进步,机器人已经逐渐走进人们的真实生活,各种不同功能的机器人被先后创造出来。自主运动作为机器人区别于其他机器的重要标志,一直是机器人研究领域最重要的主题。经过学者们多年努力,机器人的运动往往通过建模辨识、规划或控制这几个步骤来实现,也就是说机器人的运动依靠机器人专家手动编程实现。手动编程的方式能使机器人在结构化的环境下快速获得稳定可靠的运动,目前大部分实用的机器人尤其是工业机器人都是靠这种方式获得运动能力的。然而,随着机器人与人类的关系越来越紧密,机器人将脱离原来简单的结构化环境而进入到人们实际生活的非结构化环境中,原来基于手动编程的方式将不再适用。因此,如何使得机器人在复杂的非结构化环境中灵活自如地运动成为机器人研究领域最重要的课题。自然界中的动物和人类能在实际的非结构化环境下进行灵活的运动是由于他们从小到大不断地学习。受此启发,通过学习的方式使得机器人获得运动能力是替代传统手动编程方式的一个很有前景的研究方向。目前,机器人通过学习获得运动能力的方法主要包括模仿学习和强化学习。
模仿学习是指给定专家示例数据,机器人通过学习,复现专家轨迹"。在该类学习中,专家示例动作被认为是最优的,机器人通过模仿专家的动作实现最优运动。在机械臂的轨迹规划运动中,复杂的轨迹很难用编程的方法来实现,但可以很容易地从人类的试教中获得。模仿学习在该领域得到广泛应用。
在很多时候,机器人无法获得专家数据,因此无法进行模仿学习。这种情况下,机器人可以利用强化学习的方法通过与环境不断交互进行学习。学习过程大致如下:机器人感知当前的环境状态,利用运动策略采样动作并执行该动作,环境则返回给机器人新的状态和回报,机器人根据当前反馈的回报及后继反馈的回报不断调整运动策略,直到学到最优运动策略。
与需要事先对环境和自身建模的手动编程方法相比,模仿学习和强化学习无须事先对机器人和环境进行建模,只要有数据(对于模仿学习是专家示例数据,对于强化学习是机器人与环境的交互数据)就能进行运动策略的学习。当环境发生变化时,手动编程的方法完全失效;而基于学习的方法,只要有足够的数据,即使环境发生变化也能继续学习。另外,两种学习方法之间也存在着很大的差别:模仿学习是向专家示例学习,在学习的过程中专家示例提供正确的动作;而强化学习没有正确的动作信号,只能通过与环境交互,从环境给予的奖励中推测更优的动作。因此强化学习所能利用的信息比模仿学习要少,这就导致了强化学习需要大量的数据样本,学习效率低,而模仿学习一般能快速收敛。但是,模仿学习的学习效果不会超过专家水平;强化学习则没有上限,可以达到甚至超过专家水平。
相关参考
救援机器人人物介绍(24岁浙大毕业生研发两足机器人,可以蹲伏走路和载重走路)
当机器人遇见强化学习,会碰出怎样的火花?一名叫Cassie的机器人,给出了生动演绎。图|Cassie(来源:受访者)最近,24岁的中国南昌小伙李钟毓和其所在团队,用强化学习教Cassie走路,目前它已学会蹲伏走路和载重走路等。(...
机械手控制系统原理图(机械手的关节,靠什么连接的?为什么可以实现精准运动?附3d模型)
...BB的机械手大都用他们自己制造的齿轮机构减速。6轴工业机器人的1、2、3轴用的都是RV减速机,属于摆线针轮结构。4、5、6轴一般采用谐波减速机。由于轴承是特制的,这种摆线针轮的RV减速机轴向尺寸很
机器人的运动控制原理(浅析机器人(正 )运动学D-H变换原理及算法)
...考的朋友们提出一些很有价值的问题!比如,有人会问,机器人是怎么运动的?这种问题往往让我不知从何下手!多数情况下我都是讲一下机器人的各种坐标系用法,大家也都把这些坐标系的用法当成机器人最基础的知识来使用...
机器人驱动维修(机器人行业专题报告:运动控制,机器人供应链关键环节)
...,肖群稀,关东奇来,时彧,黄菁伦)运动控制成为人形机器人供应链的主要领域机器人产业链框架人形机器人产业链涉及的四大环节:感知、交互、运控、导航。自动化装置包括:1)传感器:本体感受传感器、触觉+视觉+声音...
...业机械手近年来发展成为高科技自动化生产设备,是工业机器人的
旋转咖啡杯(跟着包老师学机器人技术等级考试二级18旋转杯【GIF动图展示知识)
跟着包老师学机器人技术等级考试二级18旋转杯子全国青少年机器人技术等级考试(二级)基本机械认知与机构搭建认知机械机构运动,学习机械、机构、运动、摩擦力、传动、简单电路电机的基本知识,培养学生机器人作品机...
摩擦与磨损有什么不同(设备润滑的“5定工作”,41页内容介绍机器磨损与润滑,值得学习)
...磨损与润滑概述各种运转的机器,都有各种摩擦副组成的运动“副”,必然产生摩擦和磨损,是零件产生故障和失效的主要模式。设备润滑管理工作应包括下列的基本内容:(1)根据国家和企业的管理方针和目标确定设备管理...
润滑油基础知识大全(设备润滑的“5定工作”,41页内容介绍机器磨损与润滑,值得学习)
...磨损与润滑概述各种运转的机器,都有各种摩擦副组成的运动“副”,必然产生摩擦和磨损,是零件产生故障和失效的主要模式。设备润滑管理工作应包括下列的基本内容:(1)根据国家和企业的管理方针和目标确定设备管理...
润滑技术支持工程师(设备润滑的“5定工作”,41页内容介绍机器磨损与润滑,值得学习)
...磨损与润滑概述各种运转的机器,都有各种摩擦副组成的运动“副”,必然产生摩擦和磨损,是零件产生故障和失效的主要模式。设备润滑管理工作应包括下列的基本内容:(1)根据国家和企业的管理方针和目标确定设备管理...
润滑五定是指什么(设备润滑的“5定工作”,41页内容介绍机器磨损与润滑,值得学习)
...磨损与润滑概述各种运转的机器,都有各种摩擦副组成的运动“副”,必然产生摩擦和磨损,是零件产生故障和失效的主要模式。设备润滑管理工作应包括下列的基本内容:(1)根据国家和企业的管理方针和目标确定设备管理...