Google用AI来回答含糊的问题,它的名字叫做“RankBrain”
已有之事,后必再有;已行之事,后必再行。
——《传道书》
你能提出的大部分问题别人都已经提过了,并大都有了答案。所以一直在抓取网上信息的Google能够给出你查询的结果,只要你的定义够清晰明确。但是总有一些含义模糊或没人问过的问题存在,以往Google只能遗憾地宣布未能找到符合查询的结果。不过最近情况有了变化,据彭博社报道,过去几个月Google悄然上线了名为RankBrain的AI,对相当一部分比例的查询进行结果过滤和回答一些Google没见过的问题。结果表明其搜索的相关性改进效果不错,在结果页面选择的测试中还击败了公司的专家。
据统计,每天向Google提交的查询中有约15%是其未曾见过的。公司的资深研究科学家Greg Corrado透露,为了更好回答这些问题,Google利用了RankBrain来将海量的书面语嵌入到计算机可以理解的向量里面。
如果RankBrain看到自己不熟悉的单词或短语,它会去猜测其类似的意思并对结果进行相应过滤,从而有效地处理一些从未见过的搜索查询。比方说RankBrain 能够有效回答“What’s the title of the consumer at the highest level of a food chain?(食物链当中最高级的消费者的头衔叫做什么?)”这样的问题。
对于Google的搜索处理机制来说,RankBrain只是为其搜索算法提供输入的数百个信号之一,但这种信号跟别的信号的不同之处在于它懂得学习,而别的只是别人在信息获取中的发现和洞察。正是因为RankBrain具备了学习能力,几个月后它就已经成为对搜索第三大重要的信号,其效果之好甚至出乎Google人员的预料。Google内部曾让做算法的工程师人工去猜测搜索算法会选择哪个页面作为排名第一的结果,其准确率为70%,然后RankBrain去做了同样的事情,准确率达到了80%,超过了那帮做算法的工程师的平均水平。
RankBrain原先由Google的5人团队用了一年的时间进行研发,在今年初获得了搜索负责人Amit Singhal的放行后又投入了几十个人进行优化。为了确保结果排名的相关性,团队一直在进行细致的监控,并通过不断地向这个AI提供大量新数据来帮助它学习新概念,AI仍在进化中。