“首次通过图灵测试的计算机”只是一场成功的娱乐宣传

氪友wHeC·2014-06-10 13:33
昨天英国雷丁大学宣布,俄罗斯人弗拉基米尔·维西罗夫(Vladimir Veselov)创立的人工智能软件尤金•古斯特曼(Eugene Goostman)通过了图灵测试。 我和许多人一样,看到这篇文章的标题时感到极为兴奋,然而看完内容后却又感到一阵空虚,心想,“通过了图灵测试,然后呢?这代表了怎样的技术进展呢?”

昨天英国雷丁大学宣布,俄罗斯人弗拉基米尔·维西罗夫(Vladimir Veselov)创立的人工智能软件尤金•古斯特曼(Eugene Goostman)通过了图灵测试。

我和许多人一样,看到这篇文章的标题时感到极为兴奋,然而看完内容后却又感到一阵空虚,心想,“通过了图灵测试,然后呢?这代表了怎样的技术进展呢?”

事实上,当我们认真体察这个所谓通过了图灵测试的软件古斯特曼后,便会发现三个问题:

1,聊天机器人古斯特曼的“背景设定”极为取巧。一个来自乌克兰的,母语不是英语的13岁男孩。他回答的许多问题都可以被理解为是因为他英语不好,或者太小而没有听懂,而不是因为他是一个AI。

2,古斯特曼只让33%的人相信它是一个13岁的,母语不是英语的乌克兰小孩。如果算成考试分数,这就是个大大的F。有人说,“当时图灵说的就是骗倒30%的人就算通过图灵测试了呀。” 然而当我们寻找这个标准的来源时却发现,图灵只是在论文中说过“我相信在50年内,人们能够编出这样一个程序,在经过5分钟的询问后,30%的询问者都能觉得回答问题的是真人,而非一个台机器”。也就是说,图灵从未提出这样的标准,“30%的人”,“5分钟的询问”只是他对未来50年AI发展预测中的两个因素而已。

3,既然我们知道了古斯特曼并没有通过“真正的”图灵测试,那其实可以看看其他达到了相应标准的聊天机器人。比如说,在1991年的一次比赛中,一个叫PC Therapist的聊天机器人成功骗倒10个裁判中的5个,让他们相信这是个真人。2011年,一个叫Cleverbot的程序让60%的使用者相信它是一个真正的人。

并且,从BBC的截图来看,古斯特曼和一个正常的聊天机器人没有区别,交谈者稍有经验便会发觉这是一个AI。

因此,MIT的计算机认知学教授Joshua Tenenbaum认为,这场测试完全没什么意义,只是做一个聊天机器人去满足一些标准罢了。

事实上,“图灵测试”是一个已经存在了65年的概念,许多研究者认为它已经不能检测现代的AI了。比如纽约大学的Gary Marcus教授便认为现代的“图灵测试”应该是,让AI看一段视频,然后就视频中的内容对它进行询问,如果它让所有人都觉得是真人,便算通过了。

人工智能自诞生以来已经获得了极大的发展,不论是推荐算法,google的无人车,还是Siri,都是AI被运用在生活中的例子,我们真的有必要执着于这样一个65年前的测试标准么?

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

这篇专访是对上一篇的承接,关注焦点由人人贷放大到P2P行业,目标仍然是为外界解答我们此前对于这个行业的一些疑惑和误解,比如关于国内外P2P的本质差别,以及技术的能力界限等。

2014-06-10

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业