马斯克发起的OpenAI开发了新算法,让机器人通过VR学习新技能 | 潮科技

李振梁·2017-05-18 17:13
机器人将变得越来越聪明的同时,训练的门槛也会随之降低

训练机器人的方法正在变得越来越丰富。

之前,我们报道了MIT的科学家用机器人“教育”其他机器人,这种方法简便快捷,无需编程,大大降低了训练门槛。现在,马斯克牵头投资的非盈利公司OpenAI,也提出了一种同样很简便的训练方法。

这种新方法就是通过VR来训练机器人。

OpenAI在一篇博文中介绍道:“我们已经开发了一种新的算法,人们通过在VR环境中演示,就可以教会机器人如何完成一项工作。”

这种算法被被称为单次模仿学习算法(one-shot imitation learning)。

它的特点在于,人可以通过VR向机器人传达指令。只要先由人在VR中演示一遍,它就可以学会完成某项具体任务的方法。

OpenAI进行了一个堆叠立方块的实验。

如图所示,首先由人操作一遍。

然后,机器人就会跟着学习。

机器人通过VR学习

如图中显示的操作过程,桌面上共有6个不同颜色的立方块,不管怎么摆放,最终机器人都会采用相同的顺序,摆成跟人类操作一样的结果。

这个算法是怎么让机器人做到这一切的呢?

据研究人员介绍,这种新算法是由两个神经网络支持的。

一个是视觉网络(vision network)。研究人员用不同的光线、纹理和对象的组合,生成成千上万张模拟图像,然后利用这些模拟图像来训练视觉网络。

另一个是模仿网络(imitation network),它可以观察展示的过程,分析每一个任务的目的,然后从另一个起始配置开始完成这个目的。

那么,模仿网络是如何搞明白问题的呢?

据介绍,模仿网络从几十个不同的任务中得到训练,每个任务又包括上千次演示。

每次训练,模仿网络都可以观察到两个演示案例。第一次演示,模仿网络可以全方位仔细观摩,第二次只会被展示一次。

然后,研究人员就会使用监督学习,让机器人预测演示者下一步会采取什么行动。显然,机器人必须要学习如何从第一次展示中,推测下一步的行动。

这个算法已经成功地教会了机器人如何叠方块,但是OpenAI表示,这种技术还可以应用于其他任务。

OpenAI的研究人员说,他们的目标是让机器人能够像人类一样学习。

除了这个新算法之外,本周,OpenAI还推出了一个开源的机器人模拟器Roboschool。

这款模拟器是基于增强学习研究平台OpenAI Gym而开发的,提供了十几个新的操作环境。用户可以在模拟环境中训练一个或多个机器人。

早在2016年12月,OpenAI还推出了开源平台Universe,在这个平台上,用户可以使用游戏、网络浏览器和各种软件来训练人工智能。

如今在AI的风潮之下,必定会有越来越多的算法或系统,让机器人学会各种不同的技能。机器人将变得越来越聪明的同时,也会降低训练的门槛,让更多的人可以参与进来,共同见证AI的成长。

+1
2

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

纺织服装领域,男装、休闲装、运动装的集中上市波段之后,终于轮到女装了

2017-05-18

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业