Alphago又赢了! 5队友想靠团体赛帮柯洁群殴AlphaGo, 最终被狗彻底反杀

宇多田·2017-05-26 16:32
感觉这个结果也在情理之中,甚至比柯洁赢棋的概率还要小。
PH
已上市福建省2022-01
派克汉尼汾公司于1938年在美国俄亥俄州成立
我要联系

5人围剿AlphaGo的结果如何?答案仍然是“被机器秒杀”(还是上午的人机合作战更精彩一点,简直打开新世界大门)。事实证明,在AlphaGo面前,“三个臭皮匠顶个诸葛亮”的说法是不存在的。

在下午的人机团体战中,5位人类顶尖棋手陈耀烨、周睿羊、芈昱廷、时越、唐韦星(均为9段)尽管集群体智慧之力,也未能打败AlphaGo,最后主动认输。看来,他们为柯洁“复仇”的预想已经破灭了。

从左到右分别是时越,芈昱廷,唐韦星,陈耀烨,周睿羊

根据比赛设定,每方仅有2.5小时。在时间紧张的情况下,五人团队究竟谁布局,谁主攻,谁辅助,分工必须要明确。

在比赛刚开始布局的时候,陈耀烨、周睿羊、芈昱廷、时越、唐韦星(执白子)一方的气氛非常轻松,而负责“主刀”的周睿羊也一直嘻嘻哈哈,心情非常不错。

但就像AlphaGo与柯洁此前的对战策略一样,这只狗最喜欢“后期发力”。当然,这跟AlphaGo的算法设计有直接关系。因为每下一步棋,其计算量就会变少,也就是说,越往后,AlphaGo的思路就会越清晰,“精力”就会越充沛。

果然,AlphaGo很快就掌握了局势,特别是在赛程已经过去30分钟后,周睿羊的表情已经不像一开始布局时那样乐观,而是陷入严肃的沉思中;同时,5人的用时也逐渐增多,与AlphaGo拉开差距,而盘面及胜率也逐渐处于明显劣势。

被柯洁誉为“AI机器人”的不吃不喝的黄博士

值得注意的是,在对弈中,AlphaGo又使出了自己最喜欢的“点三三”,这是这几天比赛中最频繁出现的一着,也是人类棋手认为应该最谨慎出手的一着,大概以后会因为AlphaGo“翻身”成为围棋界最流行的下法。

此外,这局棋的另一个特点就是AlphaGo“大局观“愈发明显。与上午的”出其不意“相反,AlphaGo的每一步都似乎气定神闲,在中后期又进入“小心谨慎”阶段,与第一天对弈柯洁的中后期状态很相似。

这说明了什么?证明AlphaGo已经“胜券在握”。因为以“赢”为目标的前提下,它在保持较高胜率的时候,往往会走风险最小的那条路。也就是说,你看它拼的时候,证明它形势不太好,反而是打的亦步亦趋的时候,才证明它掌握了局势。

5人在商量策略

果不其然,在团队还剩38分钟左右时,周睿羊已经紧皱眉头,非常无奈,似乎不知该怎么下子了,而棋局似乎也尽在AlphaGo的掌握,只准备“收网”了。这个时候,双方的用时差距已达到1.5小时。

进入倒计时阶段,执黑子的5壮汉虽然已经很难扭转局面,但却越战越勇,擅出狠招的唐韦星代替周睿羊执棋上阵;而AlphaGo也似乎也感受到了对方的“怒气”,开始“奔放”起来,频频使出罕见着数。

譬如“打将”(每次读秒时间迫近一分钟时,选择对方必应的地方下一着)这一着,我们就基本没在之前的比赛中见到过。

但很遗憾,就像讲解员王磊所说,局势已经很难撼动,白棋已进入“绝望”阶段。最终,5位顶级棋手联手也不敌AlphaGo,在消耗完全部赛时后,主动认输。

人类团队负责执棋的为周睿羊,右为AlphaGo的“人肉壁”的黄博士

可能这时候你会稍有点疑惑,5人对弈AlphaGo,优势应该绝对会大于1人优势,为何从一开始局势就不太乐观呢?

理论上虽然是这样的,但团体合作引发的问题其实更明显,其弱点就源于“相谈棋”本身的设定。

什么是相谈棋?通俗点说,就是一方有2~5人,围在一起像聊家常一样来对弈下棋,大家“相谈甚欢”,大概就是这么一种对局形式。

比较有趣的是,在纯人类的团体赛对弈中,无论是一对多还是多对多,两拨对手通常都要被隔离开,避免听到彼此的讨论。但这次5人对弈AlphaGo,就不需要“隔离”代AlphaGo执棋的黄博士了,基本是当着黄博士面各种侃大山。

问题来了,虽然相谈棋形式宽松,就像是一场“开卷考试”,但大家一起交头接耳,摆棋质量既有可能因意见不合而降低,也可能因为“一个好汉三个帮”而达到最高水平(譬如进入最后的读秒阶段,单人作战很容易出现点错目,然后逆转局势;但多人作战,就可以帮忙制定策略,减少失误)。

就如王磊8段在讲解这场比赛时所说,在此前进行团体赛的很多时候,多人讨论的时间要远远多于下棋的时间,而性格不合及个人棋风间的差异也是导致棋局发生“变故”的重要原因:

“这5个人的棋风迥异,甚至性格也不太一样。你看芈昱廷和唐韦星都是那种‘超级能讲派’,具备攻击性的棋风,而周睿羊等人是那种大局派,其实很容易出现分歧。”

5个棋手的风格迥异,图片来自网易科技

其实我们来推算中国棋手在合力方面是否有明显优势,可以参考2013年与2015年在广州举办的世界团体赛。这项赛事从第2届半决赛起,比的就是三名棋手共同合作的“相谈棋“。

然而这两次比赛的结果却并不理想,中国选手组成的团队均败给韩国选手组合。特别是在第二届比赛中,柯洁、时越、周睿羊组成的”豪华组合“最后不敌朴廷桓、金志锡与李东勋。

因此,这场5人组成的团体赛实际上并不比柯洁与AlphaGo的三番棋单人对决赢面大。相反,在中国个体过于强大,且棋风具有显著差异的前提下,选手们需要在赛前花费不少时间来训练和磨合。

总之,从这场比赛来看,比起上午的惊心动魄,下午的比赛结果似乎在情理之中,没有较大的反转。这可以说明,在AlphaGo完全能够“以一敌百”的当下,我们不必再关心“人类赢还是AI赢”这种老套的问题,而是应该从上午的“合作战”中看到更多可能性:

  • 在竞技类比赛中,人类应该怎样与机器进行配合与沟通?

  • 在非竞技类事件中,人类应该怎样克服“AI完全靠数据衡量世界”的缺陷?

稍后就会进行全天两场精彩赛事的发布会,此文会持续更新中……


在赛后发布会上,今天参加了配对赛与团体赛的7名顶级棋手全部到场,基本上每位棋手都对今天的比赛有很多感慨。特别是专门与AlphaGo合作过的连笑与古力,他们的确在现场承认了AI作为场上主导更有优势。

赢得了上午配对战的连笑表示,在没与AlphaGo对弈之前,他认为AlphaGo的棋路一定是天马行空的,但没想到它还是更像人类。但在棋面的判断上,他承认AlphaGo更胜一筹:

“其实它下的还是蛮保守的。一开始我觉得这个棋面不能只让AI主导,所以我就挑起了一些战斗,但没想到损失惨重。AlphaGo的表现真的非常稳健,感觉在一步一步等待机会。我想我能赢或许是因为古力的那只AlphaGo没有发挥出水平吧。

但我感觉它并不是这么无敌,它还是有退缩的地方,它很像人类,只是能力上又超越了人类。

而输掉配对赛的古力也在赛后懊恼了一阵后变得更加坦然,甚至把AlphaGo尊称为“Alpha老师”:

在布局阶段,我觉得自己还是能跟上节奏的,当时觉得这棋一直朝着对我有利的方向发展,我还很开心。但到中后盘,我有一个地方没下出来,出现了疏漏,这是我的错。

最后AlphaGo主动认输的时候,我还小任性了一把,认为我是能翻盘的。但越走到后面,我才越发现自己应该是输了。AlphaGo的判断是对的,我想是我跟不上Alpha老师的节奏,它应该是给我留了一些颜面。

实际上我跟连笑都是力战型选手,内心其实很希望AlphaGo能下的激进一些,但等它下的激进一些的时候,却发现我们已经不行了……

从战争了李世石的AlphaGo再到Master,棋手们几乎见证了狗的技术成长之路,特别是连笑与古力,从对战再到合作,对AlphaGo的认识有了巨大的转变:

“去年的时候,我们还不知道AlphaGo的实力,觉得李世石一定能赢。而狗赢了之后我们才通过棋谱发现它这么厉害,现在又跟它的升级版对战及合作,我觉得它的思路更加广阔,棋路也更加丰富了,真的很佩服Google的技术。

而参加团队赛担任“主刀”的周睿羊则很直白地承认了自己的不足,顺便也小幽默地“黑”了队友一把:

“非常感谢团队能让我主下,但这并不是我的个人原因(大家笑)。可能我的责任比较大吧,猜先(就是先决定谁执黑子,谁执白子)都不会猜,4个小伙伴都埋怨我。不过AlphaGo的着法的确比较罕见,后面我们非常弱势。但实际上我们通盘都没有找到机会……不过也许我们执白表现会更好一些。”

不过就像AlphaGo在比赛过程中一直在“观察学习”人类棋手一样,5个顶级棋手也见缝插针地测验了一下AlphaGo是否真的钟情于保守打法:

“到了后面定局的时候,我们就试验了一下AlphaGo是否会走最稳健的路子,就抛了一个棋,但发现狗并没有明显的退让,但有时候也亏一点是一点,反正就是走的很保守。”

而作为DeepMind首席科学家,Davis Silver并不分为这是两场比拼,而是两次最难忘的AI应用及技术的探索形式。特别是人机配对战,就像4位风格迥异的画家在一副画布上涂抹一样,你会发现很多不一样的崭新的东西出现。

实际上,让AI与人类进行合作比赛,更像是DeepMind对AlphaGo进行的一场胜率测试。

如果AlphaGo自己独立作战,它每一步都会向着最终胜率最高的结果而选择下子位置,但加入了两位力战型选手的棋路之后,在某种程度上就扩大了AlphaGo每一步的风险,可能会让最后的胜率产生较大的起伏。

这也是DeepMind的一个探索方向:是否能通过改变每一步的胜率,来控制最终胜率,获得更多可能性。同时也找到AlphaGo更多的弱点:

“在一年来,我们的确找到了AlphaGo的很多弱点并进行了修复。相信在这几天的时间里,我们也会通过比赛,让AlphaGo变得更加完善。”

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

报道的项目

PH
我要联系
派克汉尼汾公司于1938年在美国俄亥俄州成立

下一篇

倒退的零售百货业何时能刹车?

2017-05-26

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业