麻省理工开发机器学习系统让
机器人可以互相学习
来源:Science、MIT news
编译:远望智库技术预警中心 温琳
很快,在将来的某一天,机器人助手会成为我们日常生活的一部分,即使我们不编程也可教他们新的任务。如果你必须要学代码,你也可以自己做三明治了。现在,有一个新系统可让教机器人变得像教孩子一样简单。机器人可以使用这个系统来分享他们的技能。
培养机器人有两种基本方法。一个是编程它的活动轨迹,这需要时间和编码的专业知识。另一个是通过触碰它的四肢来表示你想要的东西,或者自己做,让机器人模仿。但有些精妙的任务,其精度不是手能表达的,拆除炸弹是很好的例子。现在,用一个叫做C-LEARN的系统,科学家们让一个机器人拥有具有简单步骤的知识库,它可以在学习新任务时智能地应用。
大多数机器人编程采用以下两种方法之一:示范学习,他们观看正在进行的任务然后模仿复制,或通过运动规划技术,如优化或采样,这需要程序员明确指定一个任务的目标和约束。
这两种方法都有弊端。从示范中学习的机器人不能轻易地将他们学到的技能转移到另一种情况,并保证精确。另一方面,运动规划系统,使用采样或优化可适应这些变化,但十分耗时,因为他们通常必须由程序专家手工编码。
麻省理工学院计算机科学与人工智能实验室的研究人员最近开发的C-LEARN系统旨在将这两种技术结合在一起,该系统通过提供一些关于物体如何操作的信息,然后展示给机器人某项任务如何完成,可教给机器人完成一系列任务。
在伯克利加利福尼亚大学,未参与此项研究的机器人专家Anca Dragan表示:“C-LEARN系统采取非常实用的方法,效果非常好。”
在这个系统中,人类用户第一次帮助建立机器人的知识库。研究人员通过在一个软件程序中点击并拖动它的四肢来教一个叫做Optimus的双臂机器人。他们展示了动作,例如抓住圆柱体的顶部或块的侧面。他们从不同的位置将每个任务执行7次。每次移动都有轻微的变化,机器人找到变化的模式,并将其融入到系统。例如,如果抓取器总是最终大致平行于物体,机器人将推断并行性是该过程的重要约束。
麻省理工学院计算机科学家以及本研究工作的负责人Claudia Pérez D’Arpino表示:“在这一点上,机器人就像一个2岁的婴儿,只是知道怎样够到并抓住东西。”借助其知识库,机器人只需一次演示即可学习新的多步骤任务。用户使用C-LEARN软件向机器人展示所需的任务,然后批准或改正机器人的尝试。
西雅图华盛顿大学未参与此次研究的机器人专家Maya Cakmak表示:“可以服从几何约束的机器人已经存在了十多年,然而,目前为止,只有专家能利用他们。”
为测试该系统,研究人员教了Optimus四项多步骤任务:捡起一个瓶子并把它放进桶里;双手水平抓取和提起托盘;用一只手打开一个盒子,然后用另一只手按盒子里的按钮;用一只手抓住立方体上的把手,并用另一只手将立方体中的一根杆拉出来。对于每一个任务,Optimus会得到一次示范,并做出了10次尝试。40次尝试中,成功37次。研究人员将于本月晚些时候在IEEE国际机器人与自动化大会上发表报告。
对于一个更严峻的挑战,研究人员将Optimus的知识库及其四项任务的计划传输给了Atlas——一个必须保持其平衡的双足机器人。Atlas努力完成这四项任务。但当研究人员删除一些转移的知识时,例如保持某些移动平行的约束,它就失败了。
D’Arpino说,这种知识转移将有实际应用。“在德国的工厂里,你可以教一个机器人做一些事,没有理由不能将其转移到加拿大的不同机器人。”当然,对未来具有反乌托邦观点的人关心的是,通过互联网互相传递新技能的机器人将是走向机器人世界统治的第一步。
D’Arpino正在研究人们第一次与Optimus互动是否能教会他新技能。尽管她还没准备好详细讨论这些问题,目前的结果还是很乐观的。下一步,她希望教会机器人灵活地调整他们所学的飞行技能。
最终目标是教机器人拆除炸弹,机器人需要快速、准确地进行该项精妙的任务。其他应用还包括在灾难中寻人,制造电子产品,帮助生病或懒人做家务。D’Arpino表示:“有机器人在家服务的这个承诺,但现实是,现在他们什么都做不了。”她希望能改变现状。
一网打尽系列文章,请回复以下关键词查看: |
创新发展:习近平 | 创新中国 | 创新创业 | 科技体制改革 | 科技创新政策 | 协同创新 | 成果转化 | 新科技革命 | 基础研究 | 产学研 | 供给侧 |
热点专题:军民融合 | 民参军 | 工业4.0 | 商业航天 | 智库 | 国家重点研发计划 | 基金 | 装备采办 | 博士 | 摩尔定律 | 诺贝尔奖 | 国家实验室 | 国防工业 | 十三五 | 创新教育 | 军工百强 | 试验鉴定 | 影响因子 | 双一流 |
预见未来:预见2016 | 预见2020 | 预见2025 | 预见2030 | 预见2035 | 预见2045 | 预见2050 | |
前沿科技:颠覆性技术 | 生物 | 仿生 | 脑科学 | 精准医学 | 基因 | 基因编辑 | 虚拟现实 | 增强现实 | 纳米 | 人工智能 | 机器人 | 3D打印 | 4D打印 | 太赫兹 | 云计算 | 物联网 | 互联网+ | 大数据 | 石墨烯 | 能源 | 电池 | 量子 | 超材料 | 超级计算机 | 卫星 | 北斗 | 智能制造 | 不依赖GPS导航 | 通信 | MIT技术评论 | 航空发动机 | 可穿戴 | 氮化镓 | 隐身 | 半导体 | 脑机接口 |
先进武器:中国武器 | 无人机 | 轰炸机 | 预警机 | 运输机 | 战斗机 | 六代机 | 网络武器 | 激光武器 | 电磁炮 | 高超声速武器 | 反无人机 | 防空反导 | 潜航器 | |
未来战争:未来战争 | 抵消战略 | 水下战 | 网络空间战 | 分布式杀伤 | 无人机蜂群 | 太空站 |反卫星 |
领先国家:俄罗斯 | 英国 | 日本 | 以色列 | 印度 |
前沿机构:战略能力办公室 | DARPA | Gartner | 硅谷 | 谷歌 | 华为 | 俄先期研究基金会 | 军工百强 |
前沿人物:钱学森 | 马斯克 | 凯文凯利 | 任正非 | 马云 | 奥巴马 | 特朗普 |
专家专栏:黄志澄 | 许得君 | 施一公 | 王喜文 | 贺飞 | 李萍 | 刘锋 | 王煜全 | 易本胜 | 李德毅 | 游光荣 | 刘亚威 | 赵文银 | 廖孟豪 | 谭铁牛 |
全文收录:2016文章全收录 | 2015文章全收录 | 2014文章全收录 |
其他主题系列陆续整理中,敬请期待…… |
“远望智库”聚焦前沿科技领域,着眼科技未来发展,围绕军民融合、科技创新、管理创新、科技安全、知识产权等主题,开展情报挖掘、发展战略研究、规划论证、评估评价、项目筛选,以及成果转化等工作,为管理决策、产业规划、企业发展、机构投资提供情报、咨询、培训等服务,为推动国家创新驱动发展和军民融合深度发展提供智力支撑。