科大讯飞联合创始人兼高级副总裁江涛:AI连接万物,共创新时代 | 2019 WISE 超级进化者大会

未来一氪·2019-07-11 15:59
人工智能不光要实现技术突破,还要形成量大面广、可以在商业上获得巨大成功、有影响力的产品。

7月9-10日,36氪在北京和上海同步举办“2019WISE超级进化者”大会,活动设有七大会场,关注企业发展变革路径、行业风向把握、零售行业的进击与蜕变、万亿企业服务市场的崛起、产业创新机会、全球化趋势与差异化需求的爆发逻辑等议题,邀请超百位行业领袖,聚焦那些引领行业变革的超级进化者的崛起之路。

万物互联时代,人工智能取得了突飞猛进的发展,语音合成、识别等技术也在司法、教育、医疗、家庭等多场景上落地。未来还有哪些应用可以大规模的进行产业化落地,实现从算法到应用的持续迭代成为最受关注的问题,也成了未来人工智能领域最大的产业机会。对此,科大讯飞联合创始人兼高级副总裁江涛认为,一方面要让机器从能听会说到能理解、会思考,从感知智能进阶到认知智能。另一方面,人工智能不光要实现技术突破,还要形成量大面广、可以在商业上获得巨大成功、有影响力的产品,让用户真正有意愿付费购买,为你的产品“投票”。

以下为嘉宾演讲实录:

各位开发者、创业者,大家上午好!

科大讯飞是由一群中国在校大学生发展起来的上市公司。1998年科大讯飞的团队成员还是中国科技大学实验室里一帮做研究的人,1999年才成立了这个小公司。今天看到这个主题“超级进化者”,我们还是蛮有感触的。2008年科大讯飞上市,33亿的市值。上市十年之后,规模进一步扩大,也跟大家一样共同面对人工智能时代巨大的产业机会。

今天想跟大家分享我们对人工智能时代产业机会的看法。从科大讯飞的角度来看,人工智能已经发展到了什么阶段呢?首先要跟大家回顾一下科大讯飞过去十年,在人工智能上所做的工作。

2010年全球有两家公司基于深度学习算法,在语音识别上第一次做出了突破。一家是谷歌,做了英文的连续语音识别。另外一家是科大讯飞,2010年10月28号在北京香格里拉酒店,发布了全球第一个连续中文语音识别系统,这个系统在全球也是领先的。我们用了几年时间,把深度学习理论框架进一步琢磨透了以后发现,深度学习这套体系,不光是解决机器能听会说的问题,也可以进一步延伸到能理解、会思考。很多有规律可循、重复性的脑力劳动,在特定任务里拿到足够多的过程化数据,有足够多的领域专家给我们训练,在特定任务上机器可以不断逼近这个领域的专家水平。2014年我们开了一个很大的发布会,正式启动了“讯飞超脑”这个项目,它要解决的问题就是让机器从能听会说到能理解、会思考,从感知智能到认知智能。

科大讯飞在努力探索从能听会说到能理解会思考,有哪些应用可以规模化落地,可以实现从算法到应用的持续迭代。过去几年的探索下,2018年科大讯飞在包括教育、医疗、司法等领域的赛道上,已经跑出了一批非常好的应用。在我们公司的大会上,刘庆峰董事长跟大家说,现在科大讯飞人工智能战略到了2.0阶段,就是红利兑现期。人工智能不光要实现技术突破,还要形成量大面广,可以在商业上获得巨大成功、有影响力的产品。

我们回过头来再看看人工智能的核心技术发展到什么阶段了,首先看一下语音合成技术。今年中央广播电视总台联合科大讯飞,基于我们的技术做了全球第一个多语种的虚拟记者“通通”。我们拍摄了主持人的形象,录了一小段视频,可以让机器说世界主流的语言来当主持人。这不光可以用在央视,像36氪这样的媒体合作伙伴也是有需求的,它能让你们的内容变得更加生动有趣,更加个性化。

语音识别这几年取得了突飞猛进的发展,但随着万物互联时代的到来,语音识别的要求也越来越高了。在万物互联时代,很多设备离我们比较远,比如智能家居。如果你要走到设备的开关面前再说指令就没有意义了,还不如直接摁一下开关。智能家居,就是要在远距离情况下,能控制家用电器。在高噪音的情况下,比如一边开车,一边语音命令控制。在远距离、高噪声、多人说话的情况下,语音智能还能不能做到,这才能体现出万物互联的价值。

去年,在号称史上最难的语音识别比赛CHIME-5上(一个在厨房、起居室等各种场景下进行的高难度比赛),科大讯飞作为中国代表击败了美国同行,拿到了全球最好的水平,在所有的四个主要指标上都囊括了全球第一。基于这些技术的突破,人工智能从去年到今年在大规模的进行产业化落地。科大讯飞也发布了一系列围绕办公场景的产品,比如转写机,现在有一些基金公司在购买使用。它是一个小箱子,一打开可以实现会议记录。会议开完以后,生成一个二维码,所有在场的人一扫二维码,从PPT到演讲者说的话、从语音到文字,都可以直接分享查看。我们还有智能办公本,大家开会中说的语音内容也可以变成结构化的文字。除此之外,会议记录系统、智能录音笔,都在618取得了很好的售卖成绩。我们是把办公场景产生的声音和手写的文字,变得可保存、可检索、可统计、可分析,极大提高办公效率。我相信这个场景未来有很大的空间,这是人工智能实实在在落地的、已经达到的规模化应用。

当然光讲技术突破没有用,还要看用户是不是拿他的钱来为你的产品“投票”。刚刚过去的618,在京东、天猫这些平台上,科大讯飞围绕办公场景做的一系列产品,都得到了市场的高度认同,比如“机器翻译”。科大讯飞去年的机器翻译推动实际规模数据的统计对比结果,已经远远超过六级考试的大学生水平。而基于这项技术开发的讯飞翻译机,也得到了市场的认可,已经覆盖了200个国家和地区,在今年618众多翻译机品类中遥遥领先,得到的用户的广泛认可。

刚刚说了“能听会说”的规模化应用,从2014年科大讯飞启动“讯飞超脑”之后,科大讯飞重点加码的领域,是从能听会说到能理解会思考。围绕很多脑力劳动者,也就是产业互联网中的需求,除了语音之外,进一步到了认知层面。这些脑力劳动者在特定任务上的表现,机器也在不断学习。这里有一项基础技术叫机器阅读理解技术,也就是机器对于人类自然语言描述的文章能读懂多少。在“讯飞超脑”项目支持下,这方面的研发加大了力度。去年1月22号的SQuAD上,科大讯飞首次在F1指标上,超过美国大学生水平。这是斯坦福举办的机器阅读理解的挑战赛,谷歌、微软、IBM、Facebook等全球主要的科技巨头都参加了。尤其是微软,这几年持续加大对人工智能的重视,且微软过去几年里都在这项比赛中保持了全球领先。但是2018年1月份,我们超过了微软。目前在精确匹配指标上,全球有两家公司超过了美国大学生水平,一是家微软,一家是科大讯飞,而且我们得分比微软还高。今年3月20号,我们用全新的算法,再次刷新了记录。在SQuAD 2.0比赛中,精确匹配和模糊匹配,我们都超过了美国大学生的水平,这是机器阅读理解领域非常有里程碑意义的测试。 

机器阅读理解达到了这样的水平,在应用上有什么变化呢?教育领域是个例子。在前年一些典型的比赛比如高考、研究生考试上,机器在批改作文的主观题上,已经达到了人类专家的水平。机器无论是小分差、中等分差还是大分差上,都比人类的阅卷老师有明显的优势,改得更准、评分更稳定。基于这些技术突破,我们通过人工智能可以系统分析孩子写在纸上的内容,然后把孩子做作业、考试的过程化数据收集到,分析孩子的薄弱环节,给他提供个性化的指导方案。

除此之外还有医疗领域的应用。科大讯飞是全球唯一一个通过了国家医师资格考试的技术系统。国家的医师资格考试满分600分,科大讯飞的系统跑了456分,超过了2017年53万考生理的96.3%,具体的临床问题机器能够分析,并给出解决建议。在去年我们把这项技术真正做成了产品投入应用,到今年年初每天已经有1.3万个真实场景下的辅助诊疗的案例产生,覆盖了900多种常见的疾病。这套系统不是给最顶尖的医生用的,而是给基层医院社区、县级医院的医生用,减少他们的漏诊、误诊。95%的常见病,机器都能提供建议,诊断的准确率也在不断提升,目前是达到了97%。随着数据规模不断提升,未来的准确率还会持续提高。

当然人工智能是一个伟大的历史进程,不是三五年就能走完的。人工智能的核心技术从算法上,包括对小样本、无监督的场景进行持续训练,怎么跟脑科学、类脑科学进行结合,还有很多工作要做。人工智能在应用模式上,怎么实现人迹协同,也都还有大量要探索的工作。从感知智能到认知智能的很多核心技术,我们都已经把它包装成科大讯飞开放平台,向所有开发者开放。现在这个平台上已经有100万开发者,在场也有很多创业者,希望大家都可以到科大讯飞的人工智能开放平台上来。你不用管深度学习底层的技术实现有多复杂,你尽管在熟悉的领域做擅长的事情,把复杂的人工智能算法交给科大讯飞。通过这个平台,我们希望帮助大家共同获得成功。


+1
1

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

蔚来汽车股价6个交易日涨超50%,能否持续取决于ES6持续销量表现。

2019-07-11

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业