Facebook动态消息揭秘(二)

boxi·2016-01-07 17:02
算法构造再怎么一丝不苟,也总会有你掌握不到的数据:教练的比赛计划,罗斯(公牛的明星后卫)那天膝盖的感觉如何,篮球的气打足了没有。

Image title

编者按:本文编译自Slate的探秘文章。作者难得探访到了Facebook的动态消息团队,了解到了是谁控制着你在Facebook看到的动态消息,以及为什么它那全球最有影响力的算法要不断改变。篇幅较长,我们将连载刊出,此为第二部分。

Facebook的动态消息揭秘(一)

你以为我以为的就是我以为的吗?

那要是大家“喜欢”的帖子实际上自己并不喜欢怎么办?

算法构造再怎么一丝不苟,也总会有你掌握不到的数据:教练的比赛计划,罗斯(公牛的明星后卫)那天膝盖的感觉如何,篮球的气打足了没有。简而言之,比赛不是比数据,而是人打出来。而人对于任何算法来说都太复杂了,很难建模。

Facebook的算法还面临着另一种复杂性,这稍微多了一点认识论的东西。相关性得分类似于公牛获胜的可能性。这属于完全可测的离散结果:要么赢要么输。Facebook的排名算法用来预测类似的可测结果:你会不会以某种方式与某个帖子交互。Facebook动态消息背后的团队指出,交互是特定帖子是否引起共鸣的一个很好的指标。这正好又是推动Facebook经济的动力:正是因为有了这些点击、喜欢、分享以及评论,才让帖子流行起来,把个体变成了社区,给Facebook收入所依赖的广告商带来了流量。

但是这种交互仅仅是Facebook用户实际需要的简单形式。如果有人给自己实际上并不喜欢的帖子“点赞”或者发现点击进去的内容自己不满意怎么办?其结果可能会是为了获得病毒式传播而不是内容品质而优化的动态消息—先让用户尝点甜头,骗他们在这里或者那里点个赞,结果发现内容却货不对版令人作呕,然后慢慢地对这场愚蠢的游戏越来越反感。对此你要怎么去优化呢?

2013年末的时候,Faebook是当时全球最热的公司。社交网络巨头的用户刚刚超过了10亿,并且以超过1000亿的估值上了市。它用了过去1整年的时间重新修订了自己的移动app,很快就超越了Google Search和Google Maps成为全美最流行的应用。Facebook不仅仅只是跟朋友保持接触的方式,实际上也变成了21世纪的全球性报纸:有即时的新闻流、娱乐消息、朋友爱人的状态更新,这些都是根据每个用户兴趣自动量身定制的。

在公司内部,负责动态消息的人对它的发展感到兴奋。不过尽管用户参与热情高涨,但并不清楚他们对Facebook的整体满意度是否跟上相应节奏。大家在Facebook上点赞的东西前所未有的多。但是不是他们对Facebook反而没那么喜欢了呢?

要想知道为什么会这么问,你得回到2006年。

原来只不过是类似Myspace那样大规模的个人和小组资料页的Facebook,在那一年开发了动态消息作为用户朋友在网站活动更新的中心。用户对自己的状态更新、个人照片更换以及相互间的打情骂俏被放到所有朋友的消息流里面感到很愤怒。但Facebook还是继续推进。

哪怕是那个时候,也不是你所有的朋友都放到你的动态消息里面。为了避免每天几百条的更新把人淹没,Facebook开发了一个比较粗糙的算法,根据他们感兴趣的可能性来过滤掉一部分消息。由于没有真正的手段去衡量这一点(点赞按钮3年后才出现),公司的工程师只是根据自己的直觉来做出假设。早期确定要不要把帖子放进你的动态消息的条件包括帖子的时间以及有多少朋友提到过它。随着时间的推移,团队试图对这些假设进行调整,并对这些变更给用户在网站消耗的时间造成的影响进行测试。但由于没有手段去评估哪一类帖子能够取悦用户,哪一些令人生厌或者困惑,工程师基本上就是在抓瞎。

点赞按钮不仅是用户在网站上进行互动的新方式,还是Facebook让它的用户帮助弄清楚怎样才能最好地过滤动态消息这个问题的关键。用户没有意识到自己在帮Facebook也许是这个机制最巧妙的地方。如果Facebook告诉用户说他们得对朋友的帖子进行评价和排名,以帮助这家公司确定有多少人应该看到它们,那整个过程可能就会变得很沉闷,很令人分心。Facebook的动态消息算法,是最早偷偷地利用用户来对其体验进行个性化,并影响别人的算法之一。

突然之间,这个算法找到了识别最热门帖子并让它们获得“病毒性传播”的办法。病毒式传播这个词原先是用来指在人和人之间的交流的,而不是指在算法上广播给大众受众。不过Facebook的员工并不是唯一能看到特定帖子要怎样才能获得病毒式传播的人。出版商、广告主、网络骗子(hoaxster),甚至个人用户都开始分析整理病毒式帖子所具备的共同要素—那些能让一大群朋友、粉丝甚至偶然拜访的陌生人点赞的特征。很多人还开始定制自己的帖子来获得尽可能多的点赞。社交媒体顾问纷纷跳出来个大家支招如何玩弄Facebook的算法:应该用什么样的词,在什么时候发表,要怎么样的图文并茂。感觉不错的帖子会“求点赞,”然后大家就会点赞,哪怕大家实际上对帖子并不是很关心。用不了多久Facebook用户的帖子看起来都出奇地相似:充斥着调制过的、为了获得病毒式传播的内容,这些帖子大都令人作呕或者态度傲慢。而实质内容、玄妙之处、悲伤以及一切能引发思考或情感共鸣的东西都被一个小小的点赞给淹没了。

互动指标一路攀升,高高在上,但这真的就是动态消息优化的目的吗?Facebook的早期员工,动态消息的知识架构师Chris Cox对此忧心忡忡。“考察点赞、点击、评论以及分享是确定某人兴趣的手段之一,”33岁的Cox(现为Facebook CPO)在邮件里面说:“但是我们知道在一些地方这种办法是有瑕疵的。比方说,你读了一篇令人悲伤的帖子,你的本意并不想对它点赞、评论或者分享,可如果我们要你这么做时,你会说这也许对你读过它很重要。针对这种情况,几年前我们意识到得考察除了点赞和点击以外更多的东西来改进动态消息。”

算法可以优化来得到给定结果,但它不能告诉你那个结果应该是什么。只有人能做这个。Facebook动态消息背后的Cox等人决定,其最终目标是把对用户真正重要的帖子展示出来,其他统统不要显示。他们知道,为了提高用户满意度这也许意味要牺牲一些短期的互动,可能还有收入。由于Facebook财源滚滚且创始人扎克伯格控制着大部分有表决权的股份,该公司有着不可多见的奢侈,可以为了长期价值而进行优化。但问题是怎么做呢?

历史上,媒体组织是通过自己的编辑判断来决定哪些内容对受众是重要的。它们会根据故事的价值来决定出版,而他们感兴趣的价值会包括真相、新闻价值以及公共利益等。但Cox和他的Facebook同事却要尽力避免在动态消息上留下自己的编辑印记。相反,他们对确定什么对用户重要的工作定义只是这个东西:用户自己对选出来的消息流会怎么进行排名。“解决这一问题的完美方式是问每个人他们想看到和不想看到哪些故事,但这是不可能或者说不切实际的,”Cox说。相反,Facebook决定只问部分用户想看哪些,不想看哪些。大概有1000名左右,直到最近,这群人大都还是田纳西州诺克希维尔人士。不过现在到处都是这样的人。

32岁的Adam Mosseri是Facebook动态消息的产品总监,跟Alison地位对等的另一个人,只是技术弱一点—用硅谷的行话来说,是一位“fuzzie”或不是“techie”。他经手的是问题和通则,而Alison处理的是方案和细节。他是动态消息的常驻哲学家。

推动动态消息输入输出人性化的工作始于Mosseri的前任,Will Cathcart。Cathcart先从收集更加微妙的行为数据开始:不仅看用户是否点击,还要看他点击后看了多久;不仅看他是否喜欢,还要看他是先点赞再看还是看了再点赞。比方说:如果你是先点赞再看,Facebook认为,这种喜欢程度要比看后再点赞要弱很多。

2013年末上任后,Mosseri的一大计划就是设立Facebook所谓的“质量专家组。”计划从2014年夏天开始,他们在诺克希维尔找了几百号人,付钱请他们每天集中到一个地方,对所看到的动态消息提供持续细致的反馈。Mosseri和他的团队不仅研究他们的行为,还会询问他们,试图理解为什么他们会喜欢或者不喜欢给定的帖子,有多喜欢?如果让他们选的话更愿意看什么东西。“实际上他们对动态消息的每一个故事都写了一小段东西,”动态消息排名团队的产品经理Greg Marra指出。(这个小组实际上相当于Facebook的Nielsen家族。)

“问题是,‘我们还可能漏了什么没有?’” Mosseri说:“有没有盲点?”比如说,他补充道:“我们知道动态消息里面有些东西是你喜欢和感到兴奋但却没有参与互动的。”这个如果没有办法衡量的话,算法就会贬低这类帖子,抬高那些让他们点赞和点击的帖子。但Facebook可以利用什么信号去捕捉这一信息呢?

Mosseri委派产品经理Max Eulenstein和用户体验研究人员Lauren Scissors监督消息质量小组,并向他们提出此类问题。比如说,Eulenstein利用质量小组来测试自己的假设。这个假设是用户观看动态消息里面的故事的时长(而不管有没有点赞)也许是衡量他是否喜欢的一个很好的指标。“我们推测可能会是这样,但你也会想这个假设不成立的原因是什么,” Eulenstein说:“有可能是这个故事很恐怖很令人震惊,你只是盯着,但并不想看。”动态消息质量专门小组的评级使得Eulenstein和Scissors不但能够证实自己的直觉,还能够检验其相关性的细微差别,从而开始对喜欢程度进行量化。但这种量化“不会像‘5秒是好的,2秒不好’这么简单,” Eulenstein 解释说:“在不同故事的阅读时长对比方面我们还有更多的工作要做。”研究还发现需要考虑用户的互联网连接速度情况,有时候用户看似花了很长时间看一篇故事,其实只是页面加载太慢。这一研究促使Facebook对算法进行了一次优化,提高动态消息里面用户浏览时间更多的故事的排名。

Facebook动态消息揭秘(三,完)

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

2016 年 CES 大展才刚刚开始, HTC Vive 的虚拟现实之路也将越走越宽敞。

2016-01-07

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业