马斯克发起的OpenAI开发了新算法，让机器人通过VR学习新技能 | 潮科技

李振梁·2017-05-18 17:13

机器人将变得越来越聪明的同时，训练的门槛也会随之降低

训练机器人的方法正在变得越来越丰富。

之前，我们报道了MIT的科学家用机器人“教育”其他机器人，这种方法简便快捷，无需编程，大大降低了训练门槛。现在，马斯克牵头投资的非盈利公司OpenAI，也提出了一种同样很简便的训练方法。

这种新方法就是通过VR来训练机器人。

OpenAI在一篇博文中介绍道：“我们已经开发了一种新的算法，人们通过在VR环境中演示，就可以教会机器人如何完成一项工作。”

这种算法被被称为单次模仿学习算法（one-shot imitation learning）。

它的特点在于，人可以通过VR向机器人传达指令。只要先由人在VR中演示一遍，它就可以学会完成某项具体任务的方法。

OpenAI进行了一个堆叠立方块的实验。

如图所示，首先由人操作一遍。

然后，机器人就会跟着学习。

机器人通过VR学习

如图中显示的操作过程，桌面上共有6个不同颜色的立方块，不管怎么摆放，最终机器人都会采用相同的顺序，摆成跟人类操作一样的结果。

这个算法是怎么让机器人做到这一切的呢？

据研究人员介绍，这种新算法是由两个神经网络支持的。

一个是视觉网络（vision network）。研究人员用不同的光线、纹理和对象的组合，生成成千上万张模拟图像，然后利用这些模拟图像来训练视觉网络。

另一个是模仿网络（imitation network），它可以观察展示的过程，分析每一个任务的目的，然后从另一个起始配置开始完成这个目的。

那么，模仿网络是如何搞明白问题的呢？

据介绍，模仿网络从几十个不同的任务中得到训练，每个任务又包括上千次演示。

每次训练，模仿网络都可以观察到两个演示案例。第一次演示，模仿网络可以全方位仔细观摩，第二次只会被展示一次。

然后，研究人员就会使用监督学习，让机器人预测演示者下一步会采取什么行动。显然，机器人必须要学习如何从第一次展示中，推测下一步的行动。

这个算法已经成功地教会了机器人如何叠方块，但是OpenAI表示，这种技术还可以应用于其他任务。

OpenAI的研究人员说，他们的目标是让机器人能够像人类一样学习。

除了这个新算法之外，本周，OpenAI还推出了一个开源的机器人模拟器Roboschool。

这款模拟器是基于增强学习研究平台OpenAI Gym而开发的，提供了十几个新的操作环境。用户可以在模拟环境中训练一个或多个机器人。

早在2016年12月，OpenAI还推出了开源平台Universe，在这个平台上，用户可以使用游戏、网络浏览器和各种软件来训练人工智能。

如今在AI的风潮之下，必定会有越来越多的算法或系统，让机器人学会各种不同的技能。机器人将变得越来越聪明的同时，也会降低训练的门槛，让更多的人可以参与进来，共同见证AI的成长。

本文由「李振梁」原创出品，转载或内容合作请点击转载说明；违规转载必究。