为什么谷歌的 AI 能创作有艺术感的音乐,却讲不好一个笑话?

chiming·2017-09-14 16:01
人工智能没有笑点。

编者按:近日,TechnologyReview采访了谷歌大脑中Magenta的项目负责人Douglas Eck。采访中,Douglas Eck详细的介绍了Magenta项目正在进行的一些有趣的尝试。比如说,用人工智能创作歌曲、画画。但在尝试让它们讲笑话上碰壁了,这到底是为什么呢?Douglas Eck在采访中都给了详细的答案。文章由36氪编译。

用AI来创作钢琴曲、绘画猫图,这些听起来可能并不像是谷歌比较显眼的项目,但对Douglas Eck来说,这是很有意义的。

Eck花了大约15年时间研究人工智能和音乐,他现在是谷歌大脑团队的一名研究科学家,领导Magenta——谷歌的开源研究项目,旨在通过机器学习来创作艺术和音乐。

他接受了TechnologyReview的采访,讲述了谷歌是如何用利用深层神经网络来创作音乐的,以及为什么Magenta不能讲好一个笑话。

使用人工智能技术来创作艺术并不是什么新鲜事,谷歌的做法有什么独特之处呢?

我们正在探索这个方向非常具体,主要与与深层神经网络和循环神经网络以及其他类型的机器学习有关。同时,我们也在努力让有创意的程序员和开源开发者同时参与到这个社区中来,所以我们将其作为一个开源的项目。

很多Magenta项目都集中在音乐上。为什么人工智能对音乐的创作和发展有好处?

老实说,这只是我的偏好。我的整个研究生涯都围绕着音乐和音频。我认为Magenta的研究范围一直都与艺术相关,无论是讲故事,音乐,叙述,还是图像。简单一点来说,就是尝试理解如何将AI当作创意工具使用。但你必须从一个具体的方向开始。我认为,如果能在像音乐这样复杂的事情上取得了重大进展,对我们来说非常重要。那么下一步就是能够像音乐一样,把其中的一些内容映射到其他领域。

我们能听一些用Magenta做的音乐吗?

这是一种名为“Performance RNN”的模型的音乐(点击这里)

这是一段音乐作品,但同时也是一种音乐表演,因为这个模型不仅产生了四分音符,也会决定乐曲的播放速度、声音大小。事实上,它还在复制训练的内容,那是一些钢琴比赛中表演的片段。

正如该作品所展示的那样,Magenta制作的音乐基本上是即兴演奏。那么AI可以创作具有连贯音乐结构的音乐吗?

我们正在努力解决这个问题。对我们而言,未来主要研究的方向之一就是让机器学习模型来学习架构。这会在音乐中体现出来。你会听到,没有一个总体模型能决定事情的发展方向。

我们现在做的是想让和弦、甚至和弦的符号发生变化,并学习如何利用这些和弦变化。最终的目标是开发出一种端到端模型,可以自行计算出所有层次的结构。

说一说Sketch-RNN(递归的神经网络)吧,听说最近Magenta实验中,就采用了这样的技术来画画,可以跟你的你的草稿用多种风格进行绘画。

我们可以获取到人们在玩Pictionary时的一些数据来训练人工智能,这些数据都是来自于谷歌创意实验室(Google Creative Lab)的AI绘画实验。

但这些数据是有限制的。你只能从这些20秒的小图中得到一些相关的数据。不过,我觉得Sketch-RNN的负责人David Ha的工作做的挺漂亮。他训练了一个周期性神经网络模型来学习如何复刻这些绘画。他迫使模型学习什么是重要的。这个模型不够强大,不足以记住整幅画。因为它无法记住它所看到的所有笔画,所以它的工作就是复刻大量的猫或其他的东西。在整个过程中,它被迫学习数百万张猫图像中的共同特征是什么。所以当你玩这个模型的时候,你可以要求它凭空画出新的关于猫的图像。它会画出来非常有趣的猫,不过,这看起来和人们画的猫的样子并不是很像。

我了解到你正在和Magenta一起教电脑讲笑话。电脑会产生什么样的笑话?

这个项目才刚刚开始,非常具有探索性,而且也给机器提出了一个问题:它能理解笑话中的笑点吗?尤其是那些与双关语相关的笑话。人们很容易就能理解到其中的笑点,但在机器看来这就是一句普通的句子。而且,在我看来,我们能够理解到其中的笑点,其实是一种“被迫”进行的关联,只有理解了它本身的含义,才能“Get”到笑点。而且我认为,直觉上,这句话有一个几何图形。如果建筑物倒塌在你的头上,这是令人惊讶的;一句妙语并不会让你感到惊讶。就像,哦,对了,我明白了!你知道吗?我认为,这种“我得到它”的感觉是一种倒退,你必须要做才能得到它。所以我们研究了一些特殊的机器学习模型,它们可以产生这些所谓的真矢量,来理解句子中语义的变化,然后,我们就能获得不同的效果吗?

比如说这样的一个笑话:“魔术师非常生气,把她的“hare”都拉了出来。”这里面有很多的双关语,hare和hair,你懂的,对吧?(译者注:笑话中的兔子用的单词是“hare”,和“hair”头发构成了双关。)

是啊。你必须要了解很多词汇和语言才能理解它。

是的,你必须知道很多。这个模型不仅不会讲笑话,也不会有趣,而且它所说的内容我们也无法理解。

你现在想要通过Magenta来研究什么呢?解决什么问题呢?

我们想要试着通过音乐让人工智能理解更多的长期结构,并尝试去研究另一个有趣的问题:我们能从听众(受众)、而不是从艺术家的反馈中学习吗?

这也可以看做是一种艺术的迭代过程。甲壳虫乐队有12张专辑,每一张都不一样。这些都在展示,他们正在从同伴和观众那里得到反馈,同时也在学习其他艺术家的作品,然后创作了作品。所以,他们与我们的文化联系非常紧密。艺术家并不是静态的。

这是一个非常简单的想法:你能不能让一个有创造力的模型从得到的反馈中学习呢?比如说“哦,那太好了”,或者是“太糟糕了。”我们想要达到的效果是,让机器学习模型和艺术家一样,通过不同方面的反馈进行学习。我们还可以通过强化学习来设置这些参数,我们也在研究这个问题。

当我在听Magenta创作的音乐时,我在想:如果你可以使用数据来训练人工智能,那么人工智能可以原创吗?还是只能根据训练的数据进行再创作?

我认为这取决于我们怎么去定义原创。机器学习算法不太可能具有独立性,并产生一些革命性的新方法来进行艺术创作。但是一个从事这项技术的人或许能够做到这一点。何况,我们离人工智能创造真实世界的那一天还有非常、非常、非常远的距离。

就像这样,离得那么远。与此同时,我认为人工智能创作出来的很多艺术作品在另一种意义上都是原创的。就比如说,人工智能创作出了一首很酷的EDM歌曲,并放到了合适的地方。作为舞会的背景音乐是非常有趣的,而且是全新的,也或许不是,但这创造一个全新的音乐类型。

而且在我看来,这种创造力无论如何都很有趣。总的来说,我们所做的大部分事情都是我们所理解的,我们也都在尝试新事物。就这种创造力,我认为我们现在拥有的人工智能可以发挥巨大的作用。它并没有复制数据集,不是吗?这是把事情搞混了。

原文链接:https://www.technologyreview.com/s/608777/why-googles-ai-can-write-beautiful-songs-but-still-cant-tell-a-joke/

编译组出品。编辑:郝鹏程

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

消费者每月花费、订购数据会沉淀在平台上,平台将数据收集、处理、分析,进而帮助奶企决策、避免资源浪费,提升运营效率

2017-09-14

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业