在算法中练习百年后,机器人的手能比你更灵活吗?
编者按:位于硅谷的非营利组织OpenAI的研究人员开发的AI系统Dactyl能使机器手像人类一样灵活操纵立方体。本文经授权译自MIT Technology Review原标题为" An AI-driven robot hand spent a hundred years teaching itself to rotate a cube"的文章。
Dactyl AI的研究人员成功研究出一种自学算法,它能让机器人的手具有很高的灵活性。他们研究出的算法使机器手能灵活地操纵一个立方体,这个过程在计算机模拟中相当于进行了百年的练习(尽管实际只有几天的时间)。
机器人的手还远不及人类的敏捷,而且如果想应用在工厂或仓库里也显得太笨拙了。即便如此,这项研究依然显示了机器学习的潜力。它还表明,有一天,机器人可能会在虚拟世界中自学新技能,这将大大加快编程或训练它们的进程。
这个机器人系统被称为“Dactyl”,是由位于硅谷的非营利组织OpenAI的研究人员开发的。它使用了一个来自英国公司称为“影子”的现成的机器手,一个普通的相机,以及一个已经掌握了一个庞大的多人在线视频游戏的DotA算法,它使用了同样的自学方法。
该算法使用一种称为强化学习的机器学习技术。Dactyl的任务是操纵一个立方体,把不同的面翻到上面来。通过不断的试错,会产生预期的结果。
视频显示,Dactyl能够非常敏捷地旋转立方体。它自动地找出了人类常用的几个抓点。但这项研究也显示了人工智能还有很长的路要走:在经过了数百年的虚拟训练之后,机器人成功地操纵了魔方的概率只有13/50,这远远超过了儿童所需要的时间。
麻省理工学院名誉教授、Rethink Robotics公司的创始人Rodney Brooks表示:“短期内,它不适合被应用于工业流程,但研究依然是一件好事。” Rethink Robotics公司是一家生产更智能工业机器人的初创公司。
强化学习的灵感来自于动物通过积极反馈学习的方式。它最初在几十年前就被提出了,但随着人工神经网络的进步,在最近几年才被证明是可行的。Alphabet旗下的DeepMind利用强化学习技术创建了AlphaGo。这是一个计算机程序,它学会了高超的技能来玩极其复杂和微妙的棋盘游戏。
其他机器人研究人员对这种方法进行了一段时间的测试,但由于模仿现实世界的复杂性和不可预测性,他们一直难有突破。OpenAI的研究人员通过在虚拟世界中引入随机变量来解决这个问题,这样机器人就可以学习如何解释诸如摩擦、机器人硬件噪音以及立方体部分处于视线之外的问题。
该机器人背后的工程师之一Alex Ray表示,通过赋予它更强的处理能力和引入更多的随机性,可以提高Dactyl的性能。“我认为我们还没有达到极限,”他说。Ray补充说,目前还没有计划将这项技术商业化。他的团队专注于开发最强的通用学习方法。
“这很难做好,”密歇根大学专门研究机器操纵的专家Dmitry Berenson说,“目前还不清楚最新的机器学习方法将会带来多大影响。我们付出了很多努力来为特定的任务提供合适的方法。”但他认为,模拟学习可能是非常有用的:“如果我们能够真正地跨越‘现实差距’,学习就会变得更加容易。
本文来自: 36氪