麻省理工学院研究成果:人工智能助力机器人用整个身体操纵物体

人工智能
后台-插件-广告管理-内容页头部广告(手机)

8月24日,据麻省理工学院新闻网报道,该院研究人员正在开发一项新技术,让机器人可以有效地推理和用整个手操纵移动的物体,而不仅仅是使用它的指尖。

麻省理工学院研究成果:人工智能助力机器人用整个身体操纵物体

图片来自MIT新闻网

想象一下,你想把一个又大又重的箱子搬上楼梯。你可以展开你的手指,用双手举起盒子,然后把它放在你的前臂上,用你的整个身体来操纵盒子。

人类通常擅长全身操作,但机器人在这类任务上很吃力。对于机器人来说,盒子可能接触携带者的手指、手臂和躯干上的任何一点的每一个点都代表着它必须进行推理的接触事件。由于数十亿的潜在接触事件,这项任务的规划很快就变得棘手。比如将一支钢笔调转180度,这个对于人类非常简单的工作,对于没有直觉能力的机器人来说,却需要比较复杂的预测和计算。

现在,麻省理工学院的研究人员发现了一种简化这一过程的方法,被称为“富接触的操纵行为规划”( contact-rich manipulation planning)。他们使用了一种名为“平滑”(smoothing)的人工智能技术,该技术将许多接触事件归纳为较少数量的决策,即使是一个简单的算法也能快速为机器人确定有效的操作计划。

虽然仍处于早期研发阶段,但这种方法有可能使工厂能够使用更小的可以用整个手臂或身体操纵物体的移动机器人,而不是只能用指尖抓取的大型机械臂。这可能有助于减少能源消耗并降低成本。此外,这项技术还可用于送往火星或其他太阳系天体执行探索任务的机器人。因为他们只需一台机载计算机就能迅速适应环境。

电气工程和计算机科学(EECS)研究生H.J.特里·苏(H.J.Terry Suh)是关于该技术的论文的共同主要作者,他说:“如果我们能够使用模型来利用这类机器人系统的结构,而不是将其视为一个黑箱系统,那么就有机会加速尝试做出这些决定的整个过程,并提出富接触的操控计划。”

和Suh一起参与该论文的还有共同首席作者庞涛博士(23岁),他是波士顿动力人工智能研究所的机器人专家;EECS研究生杨路杰(Lujie Yang);资深作者Russ Tedrake是EECS、航空航天和机械工程的丰田教授,也是计算机科学和人工智能实验室(CSAIL)的成员。这项研究发表在本周的《IEEE机器人学报》上。

麻省理工学院研究成果:人工智能助力机器人用整个身体操纵物体

模拟机器人执行三个富接触的操作任务:操作球、捡盘子和操作笔,如旋转180度。图片:由研究人员提供

对“学习”的学习

强化学习是一种机器学习技术,在这种技术中,被智能软件操作的系统,比如机器人,通过反复试验来学习如何完成任务,并在接近目标时获得奖励。研究人员表示,这种类型的学习采用黑箱方法,因为系统必须通过试错来学习世界上的一切。

它已经被有效地用于富接触的操作行为规划,其中机器人通过强化学习,可以掌握特定方式移动物体的最佳方式。

但是,由于机器人在确定如何使用其手指、手、手臂和身体与物体进行交互时,可能需要对数十亿个潜在接触点进行推理,因此这种试错法需要大量的计算。

“强化学习可能需要经历数百万年的模拟时间,才能真正学会一项策略,”苏补充道。

另一方面,如果研究人员利用他们对系统的知识结合他们希望机器人完成的任务,专门设计了一个基于物理学的模型,该模型包含了关于事物的结构,可以使其更有效率。

然而,当涉及到富接触的操作规划时,基于物理学的方法不如强化学习来得有效——苏和庞涛想知道为什么。

他们进行了详细的分析,发现一种被称为“平滑”的技术使强化学习表现得如此出色。

机器人在决定如何操纵物体时所做的许多决定在大计划中并不重要。例如,一个手指的每一个微小的调整,无论是否导致与物体的接触,都不是很重要。这样,中间的控制数据就可以“平滑”处理,去掉许多不重要的中间决策环节,留下一些重要的决策。

强化学习通过尝试许多接触点来执行“平滑计算”,然后计算结果的加权平均值。基于这一见解,麻省理工学院的研究人员设计了一个简单的模型,该模型执行类似的平滑计算,使其能够专注于核心机器人-物体交互并预测长期行为。他们表示,这种方法在生成复杂计划方面与强化学习一样有效。

一个胜利的组合

尽管平滑计算大大简化了决策,但搜索剩余的决策仍然是一个困难的问题。因此,研究人员将他们的模型与一种算法相结合,该算法可以快速有效地搜索机器人可以做出的所有可能的决定。

有了这种组合,在标准笔记本电脑上,计算时间缩短到大约一分钟。

他们首先在模拟中测试了他们的方法,在模拟中,机器手被赋予了一些任务,比如将笔移动到所需的配置,打开门,或者拿起盘子。在每个实例中,他们的基于模型的方法实现了与强化学习相同的性能,但时间只有一小部分。当他们在真实的机械臂上测试他们的硬件模型时,他们看到了类似的结果。

使全身操作成为可能的想法也适用于用灵巧的、像人一样的手进行规划。泰德雷克说,以前,大多数研究人员说,强化学习是唯一可以扩展到灵巧手的方法,但特里和庞涛表明,通过从强化学习中获得(随机)平滑的关键思想,他们也可以使更传统的规划方法工作得非常好。

然而,他们开发的模型依赖于对真实世界的更简单的近似,因此它不能处理非常动态的运动,例如物体下落。例如,他们的方法虽然对较慢的操作任务有效,但无法创建一个能让机器人把易拉罐扔进垃圾桶的计划。在未来,研究人员计划增强他们的技术,使其能够处理这些高度动态的运动。

如果你仔细研究你的模型,并真正理解你试图解决的问题,你肯定可以获得一些收获。苏说,做一些超越黑箱的事情是有好处的。

这项工作得到了亚马逊、麻省理工学院林肯实验室、美国国家科学基金会和Ocado集团的部分资助。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。