专访腾讯杰出科学家贾佳亚:计算机视觉30年,如何从云游太空到脚踏实地?

宋长乐·2017-10-27 14:26
计算机视觉30年间,发生了哪些事情?

今年5月15日,香港中文大学终身教授贾佳亚博士加入腾讯任优图实验室杰出科学家。如今,还不到半年时间,他就带领团队在国际计算机视觉大会(ICCV)刷了一把存在感。

在威尼斯举办的ICCV会议上,贾佳亚带领的优图实验室有12篇论文入围,其中3篇被选做口头报告(Oral),而该类论文仅占总投稿数的2.1%,含金量颇高。入围的论文中也不乏AI卸妆效果、完美解决多帧信息融合困难的多帧超分辨率视频结果,以及手机双摄图像匹配和分割研究成果等前沿技术。

虽然ICCV与计算机视觉模式识别会议(CVPR)和欧洲计算机视觉会议(ECCV)并称计算机视觉方向三大顶级会议,但ICCV却是三大会议中公认级别最高的,论文录取率也低的可怜。

并且,不同于 CVPR 与 ECCV,ICCV在全球范围内每两年召开一次,今年也恰恰是ICCV首届举办至今30年,贾佳亚作为一个参与者,见证了这几十年计算机视觉领域的发展。

历经30年,计算机视觉发展的三个阶段

作为计算机视觉圈子里耳熟能详的个人IP,贾佳亚博士自2003年就开始参加ICCV。“以前ICCV就像是一个小圈子的聚会,人数也不多,几百个人参加就很不错了”,贾佳亚表示。

但伴随着计算机视觉的飞速发展以及企业的加入,ICCV的参会人数和规模都突飞猛进,以今年为例,参会人员已经突破3000人,中国和美国硅谷的科技巨头几乎都赶到了现场。

在贾佳亚看来,与规模增长相比,ICCV带来的更大价值是30年间计算机视觉的发展,至少可以分为三个阶段:

第一阶段:提出问题

早期对计算机视觉的研究,局限于探讨哪些结构是可以让计算机知道,这源于当时像素很低导致无法分辨一个物体的细节,只能做出大致的轮廓。于是很多研究者发现并定义了五花八门的研究主题,生活中遇到的一个个智能化的需求转变成CV的各个分支,比如物体特征提取、边缘识别。

第二阶段:解决问题

这个阶段的十几年中,研究者们开始发明了许多方法,或是借鉴数学、物理甚至统计学的办法。几乎在各个研究问题中都涌现出一大批富有洞察力的算法,大家对问题的认识得到深化。当然,这个阶段依旧是处于摸索阶段,也体现了计算机视觉领域的开放。

第三阶段:实际场景的落地

2010年之后,计算机视觉不再是小数据集上的玩具,因为有很多公司和团体提供海量数据,与此同时各个问题都在向着实际场景的落地。

按照贾佳亚的说法,前两个阶段是计算机视觉的云游太空,进入第三个阶段就是真正的脚踏实地。

他举例说,早期计算机视觉是研究几何,后期是研究高层语义理解。而贾佳亚团队的几何研究很早就在做Slam,之后为了应用创建了诸如去模糊,滤波,图像超分辨率等很多算法。

与此同时,在最热门的分割检测领域,贾佳亚团队也开发了一系列的系统,包括去年的PSPNet和ICNet用于道路级语义分割,今年的LineNet(ICCV)是一种新型的SDS分割算法。当然,还有即将发布结果的MSCOCO检测和分割,都是居世界前列的有效系统。

研究的目的是摒弃推广营销,转为技术驱动的产品体验

毫无疑问,ICCV聚集了全球计算机视觉领域的前沿论文研究,但是在贾佳亚眼中,即便论文的研究再前沿,对于企业来说,最终目的都是实现落地,如何服务于产品。

“以往营销推广的打法是时候抛弃了,我们应该做的是如何通过技术改变产品的体验,让用户潜移默化的用着舒服,愿意留下来”,他说。

腾讯优图实验室杰出科学家贾佳亚

贾佳亚认为,优图是很适合做计算机视觉的团队,因为背靠腾讯,无论是直播、视频、游戏,还是其他社交的玩法,都有很多的场景落地实践。

早些时候朋友圈刷屏的军装照互动H5,之所以能快速实现个性换妆,背后正是天天P图人脸融合技术和腾讯优图实验室人脸识别技术的共同支持。

如今,ICCV举办间隙,优图实验室又大玩了一把AI卸妆,简单来说就是把化妆的“照骗”还原成自然的人像,这种新算法的特别之处在于,即使不知道美化系统具体参数的情况下,仍然能对美化后的图像进行复原。而且这种“盲复原”的效果,比目前几种主流模型的结果都要更接近原始的图像。

支撑AI卸妆功能实现的是Zero-order Reverse Filtering和Makeup-Go: Blind Reversion of Portrait Edit两种系统,都是今年在ICCV发表的论文。与深度学习相对,前一个方法是一个非深度学习的方法,它的优点是快、适应性强,只需一行代码,不用任何深度学习库。

通常来说,论文往往滞后于实际应用,因为它们不满足实用场景中对于速度、精度、能耗和硬件水平等要求。

但是贾佳亚认为这种情况也不可一概而论,举例来说,Neural style风格化技术,论文还没正式发布,许多公司和App都已经应用起来了(典型的当属Prisma),然而更为知名的AlphaGo打败了人类最厉害的棋手,却很少在落地的产品中见到应用。

“我们的目标是在一个技术还没有变得很有趣之前,提前就把它做出来,一方面承诺技术何时转为应用是一个大课题。加上现在的研究方向,很多都是根据腾讯平台的众多需求来考量,相比学术界的研究,我们可以更接近实际应用”,它总结道。

进入工业界,需要Get哪些技能?

从机构和学校进入工业界的技术大牛,贾佳亚不是唯一一个,但却是转型颇为成功的典型代表。

“大部分教授都不适合领导团队”,贾佳亚这样评论学校教授进入工业界的现状。

在他看来,从机构进入工业界,是完全不同的两种工作模式。以往在学校做研究,除了日常的教学,几个月或者一年拿出一两篇论文就可以。但在企业工作甚至带团队,做的研究成果就要考虑如何快速的实现场景落地,应用到实际业务层面。

这也是为何很多研究机构没落的原因,因为技术很难推动产品,并且与业务相切合。

而贾佳亚之所以加入腾讯优图实验室能够快速适应,恰恰是因为之前所做的研究更多的是偏向应用,而不仅仅是局限于理论。

当问及是否可以给一些初入工业界的学者一些转型建议,贾佳亚说了两个字:务实。原因很简单:公司都有自己的评价标准,希望所属员工能带来创新价值,而不仅仅是几篇论文。

“现在做论文是副业,更多的是考虑公司层面的业务和技术结合,如果副业都做的有声有色,那么主业就会快速突破”,他说。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

因此从营收层面来看,百度已具备崛起的业绩基础,不过要达到阿里、腾讯的体量只有信息流,或者说只有营收增长是不足够的,百度还需要更多有想象空间的业务布局。

2017-10-27

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业