无论你想要什么,Alexa都能搞定,这就是亚马逊的人工智能蓝图

机械鸡·2017-08-28 07:44
未来,亚马逊希望Alexa能了解用户想要“吃什么、读什么、听什么、看什么”。

编者按:本文来自微信公众号“机械鸡”(ID:jixieji2017),编译:vivian;36氪经授权发布。

Jeff Bezos(杰夫•贝佐斯)可能是世界上最大的“星际迷航”粉,这位亚马逊创始人兼首席执行官曾考虑以 Jean Luc Picard 舰长的名言,为其电子商务平台makeitso.com命名。

2016年,经过数年跪舔派拉蒙之后,贝佐斯终于在《星际迷航3:超越星辰》中客串了一把外星舰队长官。

△Mike George

因此,当亚马逊开始创建人工智能助手Alexa时,Bezos终于实现了想象中的“星际迷航”式计算机——一个温和而博识的助手。

亚马逊Echo、Alexa和AppStore 副总裁Mike George说:“我们真的认为它是“星际迷航”计算机,只要它在旁边时,你只需要说:‘嘿,伙计,让我开心一下’。这位在亚马逊工作了20年的老将穿着V领夹克和牛仔裤,有着爽朗的笑声,看起来颇有点Bezos和Picard的风范。

George坐在办公室里,眼神坚定,笑得的忘乎所以,他最喜欢以有力地击掌来表示欢迎。从位于西雅图市中心亚马逊大厦一眼望去,蓝色天空下太空针塔在远处的雪山映衬下相形见绌。

对亚马逊帝国来说,这些看起来似乎都是无关紧要的戏剧背景。构成公司基地的30栋大厦可以直接看到联合湖码头。往地下150m是一个大坑,正在修建一些建筑。这些摩天大厦之间正在修建两栋30米高的生态建筑,将放入300种植物并作为亚马逊人的另一个工作区域。

公司已批准建设920万平方米的办公空间,足以容纳双倍数量的员工。这个园区就是亚马逊的一个缩影:永远向前看,发展快到难以赶超。

“长期以来,我们认为极致的产品,就是要将手和眼解放出来”—— 亚马逊的首席科学家,Rohit Prasad 

2017年4月,亚马逊股票市值达到4398亿美元。它已跃升为世界第四大公司,仅次于苹果、Alphabet和微软。

从只售卖书籍至今,贝佐斯的网上商店已经取得长足发展。

Amazon Prime(金牌会员——包括年度会员和快捷送达服务)在英国有数百万用户,在美国有数千万的客户(亚马逊拒绝提供精确数字)。亚马逊的网络服务(AWS)与云计算平台,为其包括Netflix和Spotify在内的网络服务提供了强大支撑,这本身就是一项年收益达120亿美元的生意。

2月,亚马逊工作室首次获得三项奥斯卡。亚马逊在美国开设了实体店,租赁了40驾货运飞机,并开始涉足出版业。

其在线商超Mechanical Turk拥有成千上万的常客。该公司正在英国剑桥进行30分钟Prime Air(无人机送货服务)测试,并计划额外雇佣400多名员工进入机器学习研究与发展中心。

6月,以137亿美元收购了连锁超市Whole Foods,包括旗下的400多个零售网点。

7月27日,亚马逊(Amazon)的股价涨破1070美元。股价飞升后,拥有亚马逊17%股权的杰夫·贝索斯(Jeff Bezos)身家突破900亿美元,把身家约890亿美元的比尔·盖茨(Bill Gates)甩在身后,夺得了“世界首富”的宝座。然而“世界首富”的宝座,在不到一日的时间内,瞬间易主,重回比尔·盖茨之手。


AI早已成为亚马逊的核心业务。

5月贝佐斯在互联网协会年会上说:“我们从机器学习中获得的很多价值,实际上都是悄悄进行的。诸如改进搜索结果,改善产品推荐,改善库存预测管理和许多其他事情。”

随着2014年11月引入Alexa,亚马逊已经跨入了Bezos所谓的AI “黄金时代”。

Alexa是亚马逊的AI进展的标志之一;这个助手可以帮助消费者操作,并在亚马逊平台消费。这个帝国始于卖书,现在可提供自己的音乐、电影和硬件、以及日用必需品和杂货。

亚马逊已经成长为一个庞然大物,但它之前却受制于网络的刚性接口。通过向第三方开发者和品牌开放平台,亚马逊旨在将Alexa融入生活的方方面面:家庭、汽车、医院、工作场所。

万有商店将无处不在。

Rohit Prasad正处于历史变革的中心---这全写在他的脸上。

△Rohit Prasad

这位亚马逊首席科学家一直就职于BBN科技,研究自然语言和语音识别,为诸如国防高级研究项目署这类客户提供服务。2013年亚马逊带着声驱AI与他接触时,那正是他一直在等待的机会。

现在,坐在亚马逊波士顿办公室里,远离学术象牙塔,俯瞰波光粼粼的查尔斯河,Prasad穿着条纹衫和西裤,在会议桌上挥斥方遒。

他说:“我的眼里闪烁着光芒。很久以来我们都在说,极致的产品,就是要将手和眼解放出来,我要迎接挑战。”

在Prasad到来前,关于Alexa的设想已经敲定。

像亚马逊的每个新想法,已设计好新闻发布会,来阐述这种环绕型的设备,当你在另一个房间呼叫它的名字,它就会醒来。它的个性也反映了亚马逊的品牌方针:智能,谦逊,乐于助人。它还得像人类,而不是机器人。

Lab126的团队(亚马逊加利福尼亚研发部负责开发Kindle、Fire TV Stick与命运多舛的Fire Phone的神秘团队)逆向处理了原始文件。(在更早的时候,Lab126前员工说该项目始于一个搁置的增强现实项目,是亚马逊从未确认的那类。)

大约就是这个时候,亚马逊收购了两家AI新公司,位于北卡罗莱纳的YAP和总部位于剑桥的Evi,它们构成了Alexa的声控技术的基础。但是,Prasad说开发产品需要打破机器学习的挑战。

在某种程度上,这不符合贝佐斯的高标准。一名研究人员告诉彭博社:“他对这个设备几乎怀着荒谬的期待。Jeff憧憬着它完全融入整个购物过程。”

2014年,Echo一发布就受到了欢迎。到目前为止,亚马逊已卖出了数百万台的Alexa设备。George说:“它是全新的、彻底不同的,以前从未有人实现过。”

Erik Brynjolfsson说:“它改变了游戏规则,也使互动变得更容易。从理论上讲,这需要前期的积累,才能让语音交互体验顺畅。”(Erik Brynjolfsson:《机器、平台、大众—掌控数字化革命》的合著者,MIT数字经济创业计划负责人)

刚发布时,谈不上竞争:Google Home直到2016年10月才出现。囿于智能手机的语音助手,如苹果的Siri和微软的Cortana,面临一个大瓶颈:没有人愿意在公共场合与AI对话。

风险是巨大的。语音助手竞赛就是争相成为下一个无处不在的界面。从理论上讲,它取代的不仅是触摸屏,还有搜索栏。12月,苹果将推出搭载Siri的HomePod。微软已发布了由第三方生产的Cortana(微软小娜)。

谷歌于4月自称是“「人工智能先行」(AI First)”,开放其APIs来加速Google Home的成长,并在图像识别和翻译方面取得重大技术进步。

5月,谷歌旗下DeepMind开发的AI程序Alpha go,击败了世界冠军柯洁。Facebook也在投资AI,中国的百度也在全力加码AI。

“语音助手拥有的数据越多,它就做的越好。有时候,它也需要利用计算机视觉和其他技术。”——Evi创始人William Tunstall-Pedoe

一开始,亚马逊通过任命聚焦式的“卫星团队”来打造Alexa,团队倾注于以最好的方式将Alexa融入亚马逊的零售部门。George说:“我们拥有数千名来自不同领域的人,致力于Alexa基础技术方面,定域名、命名交互方式,我们组建了这些专门的产品线团队来执行。”

有团队不断改进Alexa的个性、语调和知识库来应对客户的反馈,这一切都是为了做成一个全能的、像人一样的助手。波士顿园区的分析人员,正研究Alexa内部警报中常见的未回应的问题。这有助于亚马逊决定在Alexa的个性中赋予何种能力,填补何种知识空白,来保持其成型AI形态。

Alexa的很多“像人”的复杂性,实际上是来自于严谨的分析和客户反馈。亚马逊认为自己是世界上最以客户为中心的公司(马大大表示不服),和记者谈话的所有11名高管都提到了“Jeffism”。

通过这种方式,Alexa的团队形成共识,来识别可能会被问到的热点问题,所以从未措手不及。

AI学习了年度和季度事件日志,因此人们发问时,它知道人们要找什么。“得分多少?”新性能,比如Alexa可以辨别出歌曲和歌词,也可以指出精心构思的类人的想法;它是基于对话中你询问朋友一首歌曲的方式。

George解释说:“因为Alexa是建立在云中的,所以我们每周都能增加新特性。”

△摇滚巨星prince

2016年4月,Prince去世时,Alexa团队决定让AI对相关问题的反映更敏锐,因为Pince备受爱戴。这并不会自动适用于所有的名人,并因此保留一些团队手动添加的内容,来避免尴尬结果。

4月发布的New Skills,使Alexa能够低语、停顿、深呼吸和调整音调,而同时在英国和德国发布的“speech cons”,允许诸如“yay(呀)”和“ahem(嗯)”这样的关键词以更生动的方式呈现。

像亚马逊这样既著名又神秘的公司,其成功是显而易见的:吸收了AWS快速扩张的教训。

George说:“想想我们的传统,亚马逊全球业务近乎50%来自向于第三方开放平台。通过AWS,一开始我们就建立了初步的计算服务,软件开发商曾是我们的主要客户。这有益于我们更快提升能力,因此我们有这种开放的传统。这推动了Alexa发展。”

通过语音服务,Alexa可以存在于几乎任何产品中。

通过Alexa的基金,已筹集了1亿美元的风险资本,亚马逊也在资助对平台做出贡献的新公司。因此,Alexa被植入所有产品,包括洗衣机、空气净化器、婴儿监视器和牙刷。

George解释道:“我们完全承认,开放某些东西,别人就能与我们的产品竞争,但这令我们高兴,因为它使我们变得更好,也会将Alexa推向更多的人。”

Brynjolfsson说:“Amazon在创建平台方面很聪明,它创建了一个更有价值的生态系统。当其他机构把他们的Skills联机后,亚马逊和消费者都会受益。”

亚马逊专注于,如何加快利用Skills和Alexa产品。这个可以依靠创建Wi-Fi盒子,它解决了Echo或新语音产品每次需输入验证码的问题。让Alexa明白“搭我一程”就是要使用Uber。(最初,客户只能说“ Alexa,启动Uber。”)

这种开放方式为更多深度应用打下了基础。一位名叫Bob Paradiso的纽约电脑工程师基于这些灵活特性创建了Echo租车。他还用Alexa设计了声控病床、轮椅和娱乐系统。

Steve Rabuchin说:“有人把Echol Dots固定在天花板上,供身体残疾的兄弟使用。这改变了他的生活,他的孩子们可以通过Alexa提醒父母吃药。”这位语气温和的Alex副总裁主管开发者关系。

Rabuchin还向位于西雅图的Evergreen Health的新生儿ICU,捐赠了Echo Dots。他的双胞胎女儿也是诞生于此。父母可向Alexa询问孩子的护理情况。Alexa也被用于帕金森患者练习讲话。George补充说:“世界将要解决我们甚至想都没想过的问题。”

亚马逊的硬件商业计划之根本,在于帮助你花更多钱。加快速度是为了让你按一下按钮就可以迅速重新购买日用品。2016年11月,公司曾发起只针对Alexa相关产品的打折活动,以此提升声控购物的吸引力。

4月,WIRED拜访西雅图办公室时,亚马逊揭开了Echo Look的面纱。这是第一台全视全听的Echo,装有一个摄像头,这个时髦的助手可按需拍照。结合亚马逊的Style Check Skill,其机器学习力能为你做出套装购买建议。

△Echo Show

几天之后,亚马逊开启了Echo Show:带屏幕的Echo,可进行视频通话。宣传视频显示,它能帮助父母监视自己的新生儿(还可订购尿布,听亚马逊音乐和看电影)。

Echo Show填补了Echo性能的空白:作为一台用来推销东西的系统,听Alexa报读购物清单和它的便利设计感觉非常棒。这也是亚马逊累累伤痕中的一个教训。

2016年9月,Nucleus推出Alexa家庭对讲装置,并宣称已经筹集了560万美元的资金,主要来自Alexa基金。Alexa团队在会谈中对Nucleus赞口不绝,完全盖过了他们自己的产品。Show宣传视频,甚至额外增加了一些亚马逊零售经历,与Nucleus原始广告惊人地相似。

亚马逊设备与服务高级副总裁David Limp认定,在Show系列中Nucleus更受重视。发布会后他曾表示: “该产品并非意外。我依然是Nucleus的粉丝,它是Show的一种补充。

它能悬挂在墙上,非常纤薄。在我头脑里这是另一种用法。Nucleus和其他产品也可以进入APIs,并且他们可以和Echo Show一样好甚至更具潜力。” 

△Dave Limp,亚马逊设备与服务高级副总裁

Show发布后不久,在采访Recode网站时,Nucleus创始人Jonathan Frankel说:“不同的是他们想卖出更多的洗涤剂,而我们是真心想让家庭沟通更容易。

他们必须认识到,试图践踏Alexa资金生态系统内的首要合作伙伴,他们实际上是在破坏这个系统并向他人发出警告。如果他们真想对这个系统造成威胁,这当然是个好机会。”

Show和Look的零售机遇极大。但是,Nucleus这个小插曲与钟爱便利的亚马逊如出一辙,而有时又不屑用这种方式实现便利。

2015《纽约时报》一篇文章描绘了亚马逊残酷的工作环境,其中一条是逼迫人们超越极限。亚马逊对此进行了激烈争辩,要求文章收回这种子虚乌有的言论。但这印证了2013年Brad Stone(布拉德•斯通)绘于公司传记中的一幅《万有商店》图画。

Lab126的Echo初始团队中大部分人已不在亚马逊工作。然而,很明显,亚马逊的客户享受到的便利,从当天送货到低成本,正是源于这样的专注和坚定。

所谓的“Love Memo”(爱的备忘录)以独特的视角,揭示了专注思想在全公司的表现,也体现在“万有商店”中。亚马逊发布了一款,帮助公众比较线下产品和亚马逊线上同类产品的APP却招致批评后,Bezos写下了这份备忘录。

这个举动被认为是反竞争的,也让Bezos开始思考为何亚马逊这样的大公司受人喜爱却无人畏惧。

他列出了一份“受欢迎”公司(如苹果或迪士尼)或“不收欢迎”(如微软、沃尔玛)公司的特征清单,并把它分发给了最高管理层。

“爱的备忘录”与亚马逊一直努力实现的AI有着惊人的相似之处:

“礼貌最酷”(Alexa总是被描述为有谦逊有礼);

“年轻最酷”(进入备受争议的Look,目标客户是年轻人);

“直率最酷”(Alexa给出了直接的答案);

“出人意料最酷”(Alexa是严格保密的,其后续产品也是如此)。

Amazon工作的神秘性,加上贯穿我们谈话的“Jeffisms”和“爱的备忘录”,使高管们的话风和性格趋于统一,有时这让人觉得可爱,也会让人不安。

不止一个高管谈到亚马逊的竞争,Limp 说:“这里会有很多成功产品。”随后他又谦逊地补充说:“我相信Alexa会是其中之一。”(“纠结于对手很不好,只为公司获取价值也不酷。”)

在开发Alexa产品时,每个人都崇尚冒险,这是快速成长的新公司的方式。Limp解释说:“我们有责任继续创造超越客户眼界的产品。”(“冒险是很酷的。”)

西雅图总部配有一个屋顶公园,一个工艺中心,每个电梯里都有白板,供大家记录稍纵即逝的创意(每一块都是一片空白,除了其中一块上面写着一个中文字符)。


会议大厅能容纳1600人,Alec Baldwin和 Al Gore曾在这里发表演讲;整个大厅在周五下午就变成了员工运动场。下午5点,走廊里全是亚马逊员工,大家牵着狗狗涌出电梯,这种场景与《纽约时报》那篇文章内容形成鲜明对比。

但是,这是亚马逊总部,而不是执行任务的前哨,也不是Doppler地区Day1总部任何30栋建筑之一。

在WIRED记者与Alexa和Echo小组成员碰面的那层楼,那里的墙壁和空旷的大厅是由抛光的黑灰水泥改造的,有着巨大的让人不适的裂缝。厚重的窗帘笼罩着供员工休息的沙发间。这种审美观太粗粝了,这里看上去更像死亡星球,而不是Bezos那可爱的飞船公司。

体验和Echo设备副总裁Toni Reid,每天负责监督庞大团队中的行为科学家和工程师,这些科学家和工程师致力于优化Alexa的个性。总的来说,工作目标是弄清楚如何利用分析来改进Alexa,从最小的对话层面到较大的性格特征。

Reid穿着套装和开领衫,谈话时,她小心翼翼地拧着脖子上的紫色证件挂带。她加入Alexa(她认为是初始阶段)团队时,就意识到Alexa要变得更可爱才会更像人类。

“当我家人在车里时,我们会自然而然地尝试使用Alexa。” Reid说,这是他们想在所有客户中引起的感觉。“Alexa应该是你需要的时候就出现,不需要时就消失。”

Alexa越善解人意,它就越好相处。Prasad说:“情感是一个超级难的问题。你需要非常了解这个人。”如果有任何公司能做到,那就是亚马逊:它知道你穿什么,读什么,看什么,听什么。Alexa可能还不知道你,但亚马逊比你最亲密的朋友还了解你。

2016年9月,亚马逊推出了Alexa奖,鼓励大学生创造一个能持续对话20分钟的机器人。有14个团队争夺33.8万欧元的奖金。前提是要制造更人性化的AI,以确保它可以进行生动的对话。

Prasad说:“想象一下你第一次见到某人,还要和他谈话20分钟——这很难。你遇到的这个人必须有趣、知识渊博,善解人意,对你的情感表述有情感回应。这是一个非常艰巨的任务,不只是从语言理解的角度,还有词汇知识。

你如何回应这些非语言信号?对我来说那是终极AI的下一步任务。”

Prasad对这种现实可能性很乐观,他已经在考虑,是否要用检测和平衡,来避免Alexa看起来过于像人类。

4月,亚马逊推出了一款装置发出哔哔声盖过脏话,微妙地提示这是一个机器。

Alexa必须像人类还有一个原因:信任。如果它的终极目标是无处不在,只有客户信任它,包括它的摄像头和一切,才能让它进入他们的生活。

△亚马逊Alexa体验和Echo设备副总裁Toni Reid,1998加入亚马逊

现在,Alexa可以设法仅靠词语进行理解。它有可能理解来自摄像头的视觉信号—如果人们信任它。通过推出Echo Look,让摄像头进入家庭,亚马逊已经向这个目标迈出了第一步。

Evi 创始人William Tunstall-Pedoe 说:“这是行业走向,语音助手的信息越多,它就可以做的更好。当然会有隐私方面的顾虑,这和Look的相机完全不同,你让它拍照它才会拍照。但是AI已经有了很大进步,其深度神经网络懂得识别照片内容。”Alexa会记录每一句话,但人们也可以删除。

亚马逊一直强调隐私对公司的重要性。当AI无处不在时,事情就复杂了。

在2017年阿肯色州一桩谋杀案中,亚马逊拒绝交出一个人的Echo声音数据,直到法官依法强制其交出。这就是得有一个唤醒口令的原因,Alexa激活时会发出光和声音,Echo上有一个静音按钮。

Limp说:“静音键断开麦克风和摄像头。如果你把它放在柜子里,按下静音,黑客也无法打开摄像头。打开是不可能的。除非他们有一个烙铁,你要知道那是从嗅觉开始的。”

信任一直是Amazon成长中的重点。在“万有商店”,亚马逊总编Susan Benson介绍了快速编辑的重要性:“创造良好的购物体验,但也得让人们在想到屏幕另一边有值得他们信任的人时感到有舒适。

我们让人们把信用卡插入电脑,那一刻的想法是激进的。”现在有了重大反转:客户必须信任Alexa,并相信另一端没有人类窥视。

每个谈话的高管,都沉浸在怀旧情绪中,多次提到把Alexa看做是“星际迷航”计算机。

但它也有逻辑:它不是具有威胁性的“Ex Machina”(机械姬),而是明朗的未来。

这是亚马逊的大赌注,谷歌、苹果和微软都在为智能助手竞争。很快,你就不用想念Alexa了,就像Reid一家,在车上、办公室或者酒店(拉斯维加斯永利酒店全部4748个房间全都装上了),因为你从未远离它。

随着Alexa的普及,更多的机器学习将改善它,使它更能干,更像人类。也许当到处都是它的声音时,保持隐私将更麻烦,但生活会变得轻松。

而在这一切之下,亚马逊会为您提供购物和娱乐。无论你想要什么,Alexa都能搞定。

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业