机器人开发(25分钟训练机器人学会6个动作,伯克利开发高效机器人操纵框架)
Posted
篇首语:忘记你是个女孩,然后像爷们一样去奋斗!本文由小常识网(cha138.com)小编为大家整理,主要介绍了机器人开发(25分钟训练机器人学会6个动作,伯克利开发高效机器人操纵框架)相关的知识,希望对你有一定的参考价值。
机器人开发(25分钟训练机器人学会6个动作,伯克利开发高效机器人操纵框架)
蕾师师 发自 凹非寺
量子位 报道 | 公众号 QbitAI
这个机械臂正在完成够、拿、移、推、点、开等6个动作。
而且动作娴熟,还不存在失误。
更令人意外的是,训练这个机械臂,只花了短短25分钟。
即使有人为干扰,它也能够成功完成抓取动作。
还能抓起以前没有见过的物体形状。
这就是来自加州大学伯克利分校的一项新研究——高效机器操作框架Framework for Efficient Robotic Manipulation(FERM),专门对机械臂进行高效率操作的算法训练。
FERM为什么比其他方法效率高?
目前来看,大多数针对机器人训练的的RL算法效率都不是很好。
采用稀疏奖励的方法训练Dota5游戏的人机操作,使之成为达到人类玩家的高手水平,需要花180年的游戏时间。
训练一个机械臂的手势,则需要上千万的模拟学习的样本和两周的训练时间。
Sim2Real和模拟学习这两个方法稍微好点。Sim2Real需要接受模拟训练,再将训练结果运用到现实事例中。
模拟学习则需要通过一系列的专业训练示范案例和监督学习,才能得出最后的训练策略,实验结果非常依赖于输入示范案例的质量。
FERM优势在于,既没有依靠模拟训练转换到现实,也不用高度依赖于输入的示范案例的质量。
而是基于非监督性表征学习和数据扩张技术,使用了pixel-based RL。
因此,它仅仅需要10个Demo,25分钟的训练时间,就可以让机器人学会六个动作。
FERM具体怎么训练?
FERM采用了基于像素的强化学习(pixel-based RL)方法。
具体而言,先收集小部分演示数据,并且将这些数据存放在“回放缓冲区”上。
然后,用观察结果结合对比损失量,来对编码器进行预训练。
而后,编码器和“回放缓冲区”运用一种线下的数据来加强RL算法,对RL智能体进行训练。
在论文中,研究人员总结了FERM主要优点:
1、高效率:FERM可以学习6种不同操作任务的最优策略,在15-50分钟的训练时间内完成每项任务。
2、简单统一的框架:框架结合现有的组成部分,将无监督的预训练和在线RL与数据扩充成一个单一高效的框架。
3、常规轻量设置:实施起来只需要一个机器人、一个GPU、两个摄像头、几个演示,以及稀疏奖励函数等等。
具体的实验结果如何?
实验结果
这项实验采用像素观察的方法执行了一系列任务。下图的每一栏显示了初始、中间、结果等三个状态。只有当机器人完成任务时,才会获得稀疏奖励。
这个训练算法的效率可谓很高了。具体完成时间如下图表格所示,在30分钟左右,它就可以让机器人学习操作任务。而简单的“够”(Reach)动作,则只需要三分钟。
实验结果称,它不需要很多的Demo,也不需要到大量的设备,首次完成任务的平均时间为11分钟,并且可以在25分钟内训练出6个机械动作。
所以研究人员骄傲地说:
“据我们所知,FERM是第一个能在不到一小时的时间内,能通过像素点直接完成来自不同组、采用稀疏奖励方法的机器操作任务。”
而根据相关报告,未来十年,制造业将需要460万个岗位。许多制造商也都在转向自动化生产,机械自动化将占比越来越高。FERM这样的高效训练框架,可谓是制造业福音。
参考链接:
https://venturebeat.com/2020/12/16/new-framework-can-train-a-robotic-arm-on-6-grasping-tasks-in-less-than-an-hour/
论文地址:
https://arxiv.org/abs/2012.07975
源代码:
https://github.com/PhilipZRH/ferm
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一时间获知前沿科技动态
相关参考
怎样才能在家练出一身肌肉(学会这5个动作,让你无需器械在家也能练出好身材)
...担心没空间?没器械?居家如何有效锻炼身体?一套组合训练等你来实践5个训练动作,无需器械让你在家也能快速强化臀部肌肉跟着小体一起来运动吧!上海体育,赞31相扑式深蹲区别于正常深蹲,相扑式深蹲要求双脚打开更宽...
...入泡好牛奶鸡蛋液的吐司,撒点蔓越莓干7、烤箱180℃烤20分钟,根据烤箱自行调节8、烤好后撒上糖粉9、外焦里嫩里面像果冻布丁一样奶香味十足。小贴士需要提前一晚把吐司泡在
...入泡好牛奶鸡蛋液的吐司,撒点蔓越莓干7、烤箱180℃烤20分钟,根据烤箱自行调节8、烤好后撒上糖粉9、外焦里嫩里面像果冻布丁一样奶香味十足。小贴士需要提前一晚把吐司泡在
机器炒板栗需要加什么(怎么用电饭煲做糖炒板栗?教你一招,香甜软糯好剥壳,3分钟学会)
#头条创作挑战赛#入秋以后,正是板栗成熟的季节。今天教大家利用家里的电饭煲,来做个简易版的糖炒栗子。不用烤箱也不用翻炒,保证好吃又容易剥壳,小白也能轻松学会。【食材和用料】板栗---------------------------1斤水------...
易拉罐打开后如何密封(呼吸有窍门更有“阀门”,学会瓦式呼吸让大重量训练更安全)
本章2602字,阅读约9-11分钟对于大部分非职业训练者来说,我们学习健身的最直接方式就是模仿和观察别人的动作,再根据自己的身体结构进行调整。我们可以复制别人的动作、组数、次数甚至是训练强度,但总有一些技巧宛如...
挖掘机较学(机手一分钟入门:不吹牛逼 8个动作教你学会开挖掘机)
很多人都好奇,挖掘机为什么能够有那么灵活的动作,就像人的手臂一样,单靠驾驶室的几根操作杆就能操作这个庞然大物吗?今天阿翔就来给大家揭秘,只要学会以下8个动作,人人都可以开挖机!挖掘机的驾驶室座椅两侧各...
...系统中。3、程控型:预先要求的顺序及条件,依次控制机器人的机械动作。4、数控型:不必使机器人动作,通过数值、语言等对机器人进行示教,机器人根据示教后的信息进行作业。5、搜救类:在大型灾难后,能进入人进入不...
手臂跟胸肌怎么练(练胸肌最好的6个动作,器械和徒手训练结合,让整个胸肌更饱满)
...了很长时间的胸肌,却一直看不见轮廓。那么到底该如何训练胸肌呢?又该选择哪几个动作呢?1.胸肌的整体结构整个胸肌,它从锁骨端开始,延伸至胸骨和肋软骨处,最末端达到腹直肌前鞘层。实际它就是一个整体,为了更好...
日本味霸相当于中国的什么(第七届上交会|20分钟做四菜一汤,炒菜机器人让你“一键变大厨”)
...交易会于4月18日至20日在上海世博展览馆举行,上海爱餐机器人(集团)有限公司的展区内香气四溢——这里是一家由机器人掌勺的智能餐厅,全部菜肴都由“味霸”炒菜机器人完成。“味霸”是中国首台完全自主知识产权的可...
悍马拉背训练器(练完背,瞬间感觉厚了哪6个动作让“弱背”拥有加特效一样的训)
...带着问题来问我们。视频加载中...毫无疑问,背部是最难训练的部位了。很多小伙伴总是向我们抱怨说无论用什么计划,采用何种技巧,背部都总是这样,没什么太大的进步。我们认为,很可能是你的动作选择出问题了。如果你...