AI 下棋已经不稀奇了，Google 的这个 AI 成了一名“作曲家”

图普科技·2017-06-01 14:39

尽管Google 一直致力于计算机音乐创作能力的训练，但是想要真正让计算机进行音乐创作，专家们要做的还有很多很多。

一个封闭的教室，充斥着杂乱的噪音，在教室前面的屏幕上，全都是一行行复杂的代码，每台笔记本电脑的扬声器都发出哔哔的刺耳声。

这些声音让人不禁想起了老式的音乐合成器，但这些声音跟复古可没有太大关系。

这些旋律、音调是由一个强大的神经网络创造的，专家们希望通过这个神经网络向音乐家们提供一些先进的、前端的作曲工具。他们甚至希望有一天，这些作曲工具能够自己创作出音乐来。

这个教室是由两个谷歌工程师Adam Roberts和Colin Raffel负责的，他们在迅速扩张的“谷歌大脑”人工智能实验室里从事着Magenta项目的研究。去年5月，Magenta项目在杜伦“Moogfest科技音乐节”上首度公开亮相。Magenta项目专注于机器理解、生成音乐能力的训练，以及创造能够进一步完善和补充人类创造力的工具。现在，距离Magenta公开已经近一年了，Roberts和Raffel再次回到Moogfest，介绍Magenta的使用方法及其运行方式，以便工程师和音乐家们对Magenta进行操作。Roberts和Raffel同时希望工程师和音乐家们能为这个开源项目贡献更多代码，并提出建设性的建议。

Roberts表示：“Magenta项目的目的是连接外部世界，特别是音乐创作者。从某种意义上来说，每个人多多少少都有一些艺术细胞，但是我们不会把自己当成艺术家，我们可能成为研究者和软件工程师。”

一个与众不同的旋钮

这个研讨会是Magenta工程师今年在“Moogfest科技音乐节”举办的数场活动中的一场，它主要是研究Magenta项目中MIDI音乐序列生成器的API。在为期四天的音乐科技节中，他们举办了几场研讨会，并向公众展示了Magenta的最新播放界面的唱片样本，比如基于网络的NSynth“神经合成器”，这个合成器利用了神经网络把现有的声音混合，进而生成一个全新的声音。

Roberts解释说：“有了合成器，就意味着有了旋钮和振荡器，我们就能够通过合并声音来创造一个新的声音。这是一个完全不同的旋钮”。

Magenta团队在“Moogfest科技音乐节”上的频繁亮相，不仅仅出于他们对科技和音乐的狂热。这也是他们发展战略中的关键一步。作为一个开源项目（代码基础可以在Github被检索到的项目），Magenta需要软件开发者对其代码进行操作测试，然后针对其接入界面的设计提出建设性意见，从而推动这个项目不断发展和完善。“Moogfest科技音乐节”十分重视音乐与科技的融合，这一点吸引了大批Magenta的目标受众。通过举办公众研讨会，Magenta希望有更多人安装和使用他们的工具包，这样他们才能根据用户的操作反馈不断完善其功能。

这一类活动的开展有助于谷歌工程师改进项目。正如Roberts所说的，Magenta的用户界面并不是完美的，仍有很多地方需要打磨、改进。“我们必须承认，Magenta工具包现在还不是一个能让所有用户任意操作的完美工具，它还有许多地方需要完善，用户自身也需要了解工具包的所有指令和使用方法。”

通过这样的研讨会，Roberts和Raffel在安装Magenta所需工具包的过程中，对编码器进行了一次测试。大部分的测试工作都是在命令行中的原始代码中进行的，也经过了一些应用程序的操作，比如PureData。Magenta创建了像NSynth App这样的用户接口界面，除此之外，Magenta编码员还正在努力建立一个连接谷歌AI设施与音乐创作工具（如Ableton Live和Logic Pro）的桥梁。Magenta团队的工作，在“学术研究模式”（他们的四篇研究性论文刚刚取得下一年“国际机器学习大会”的认可，这是一项不小的创举。）和“建设模式”之间取得了平衡。因此，用户接口界面还需要一段时间打磨、完善。

看创新工作者使用人工智能

当所有人都开始安装Magenta工具包、使用这个软件时，Roberts和Raffel就会得到一些非常有价值的东西——建设性的意见和反馈。研讨会的与会者都处于不同的技术能力水平上，他们能够快速地识别出Magenta的使用缺陷。这些都是建设性的意见，是谷歌工程师从Github和其他网上社区都无法得到的意见。他们还能第一时间观察到用户是如何使用代码和接口的，有时候还能发现一些非常特别的使用方式。

“Moogfest音乐科技节”期间，谷歌工程师Colin Raffel在一次Magenta研讨会上。[图片来自：John Paul Titlow]

Roberts表示：“当你在创造某样东西时，你心里会产生一个关于这个东西利用方式的明确想法。所有音乐方面的发明的的发明者，对于他们的发明最初都有一个明确的目的，但是后来富有创造力的人们会超越发明者最初的想法，用一些不同的方式来利用这些发明。”

从去年5月份向公众公开到现在，Magenta项目已经成长了很多。但是在宏伟的人工智能背景下，它还处于“婴儿期”。Magenta可以自动生成一些新的声音和短小的旋律，不过对于歌曲的更大结构的了解还不够深入。这正是Magenta团队在接下来将要着手解决的问题之一，团队打算通过把学术性研究和创造性工具结合起来，进而解决这一问题。

“我认为这是一个非常有价值的挑战——你能完全理解这个长期音乐结构吗？就算你能够理解这个音乐结构，那么你能给人们提供一个操作这个音乐结构参数的工具吗？”Roberts追问道。

假设一种情况，这个工具可能是“车库乐队”或Ableton的一个插件或按钮，它能让作曲家利用人工智能自动生成一些旋律，从而为他们的歌曲提供一些旋律结构的选择。另一种情况可能是，一个经过良好训练的神经网络能够创作出永不间断的“可生音乐”——这一想法已经由音乐家Brian Eno通过“浅技术性”方式探究过了。类似这样的预言和前景可能会让艺术家们感到心寒，因为他们的存在可能会变得没有意义了。但是Roberts和他的同事们坚持表示，他们的目的是创造一些能够完善和补充人类创造力的工具，这些工具绝不会取代人类创造力。

机器的音乐创作之路还很长

谷歌Magenta团队的领导Doug Eck表示：“我并不期望有一天人们会坐在扶手椅上听着电脑创作的交响乐，但在将来人工智能一定会模仿和学习音乐演奏的社会性及协作性。”

Eck补充说：“如果你是一个音乐家，你需要与其他音乐家共同演奏一首曲子。你有一些能够发挥其他音乐家作用的工具，但这并不代表你想要听这个工具自己输出的音乐。”

人工智能的发展节奏非常讯速，但即使如此，我们可能还需要几年才能打造出音乐家的“插接式”合奏机器人。在这期间，Magenta项目要做的还有很多。Roberts承认，针对新手，他们会构建更加直观的界面，编写更清晰的、易于操作的代码。他们还将继续他们的音乐科技节巡回展，甚至把Magenta工具带到六月份巴塞罗那的“声纳音乐节”上。

因此，他们也迫切地需要更多的数据，单靠这些研讨会和唱片样本是没有办法完成底层机器学习模型的训练的，至少不能直接对模型进行训练。所以说，Magenta需要更多关于音乐的原始数据。Roberts提出的关于训练机器，让机器理解和创作更长的歌曲结构的想法，需要大量书面的音乐史知识。谷歌早期的人工智能艺术实验，比如“ Deep Dream图像生成器”的完成是相对容易的，因为网上有大量的图像数据可供使用。而音乐不同，它是一个比二维图片复杂得多的媒体形式，因此找到有意义的、并且机器可读的数据非常困难。

参与大会和音乐科技节的另一个好处是，你能够从中获取潜在的数据源。在“Moogfest科技音乐节”上，有些人是创建了MIDI数据库的，还有些人找到了编译和播放音乐相关数据的有效方法。Roberts指出，研究者们都绞尽脑汁，希望找到人与谷歌的“人工音乐大脑”合作的方法。

Roberts表示：“这种类型的交流和谈话能让我们获得更多的数据，但这必定是一个内部和外部的协助项目，所以，这样的交流非常必要的。”

注：本文由「图普科技」编译，您可以关注微信公众号tuputech，体验基于深度学习的「图像识别」应用。

本文由「图普科技」原创出品，转载或内容合作请点击转载说明；违规转载必究。

寻求报道