百度语音新开放技术接口,智能语音的圈地暗战争分夺秒

孙然·2016-11-23 21:45
几年前语音识别还是大公司拿出来炫耀的实验室技术,今年却被推上了追求实用性的真实战场。

11月21日至11月23日,搜狗语音、百度语音、科大讯飞排队召开发布会。除了三家都默契地公布语音识别准确率在97%以外,更值得一看的是他们在构建大数据壁垒上的竞赛。

昨天的百度语音在开放平台三周年会上,开放了新的语音技术——包括情感合成、远场方案、唤醒二期、长语音方案——并宣称为开发者提供免费的接入接口。远程方案技术都是今年智能语音厂商扎堆推动的技术突破。而今年早些时候,百度还免费开放了语音唤醒和自定义语音技术。

在AI市场的争夺战役中,语音的战略地位类似于关口。它是一种入口级、且目前最自然的人机交互手段。近年来智能语音巨头一直在接入开发者和合作伙伴,扩充数据库,不过见诸报端的比拼更多还处于实验室和技术赛场。但2016年,火药味已经蔓延到普通个人用户触手可及的范围,就比如输入法。

更多人跟朋友微信聊天、或通过手机里的APP选择服务时,已经不再单一地通过九宫格汉语拼音或手写服务,而是说出一句话,看着它在屏幕上实时转成文字。这背后时输入法市场前三位企业搜狗、百度和讯飞的推动。

(图片来自比达咨询发布的《2016年第三季度中国第三方手机输入法市场研究报告》)

 不过输入法只是一方面。作为底层技术,智能语音未来的发挥空间,将广泛出现在手机、智能家庭、车载、医疗、教育、司法等各种场景。至于这将意味着多大的市场规模?根据国际市场研究公司Research and Markets日前发布的《全球及中国语音产业报告,2015-2020》报告,未来五年语音市场显著增长,到2020年,全球语音市场规模预计将达到191.7亿美元。

报告同时称,2015年全球智能语音市场规模为61.9亿美元,除了领头羊Nuance占据三成的市场,谷歌、微软、苹果和科大讯飞迅速增长,全球市场份额占比分别为20.7%、13.4%、12.9%和6.7%。

但语音技术要在现实生活中落地,必须与场景结合,这需要吸纳来自各种场景的数据去训练语音技术,让其更加智能化。这也是为什么微软小冰每周都要上线新功能,努力刺激用户贡献更多聊天数据,而科大讯飞则不断扩大同长虹等智能电视厂商的合作名单,吸纳来自入口级硬件的数据。

百度同理。在百度生态内部,目前语音技术的落地渗透在百度地图、手机百度、百度输入法等产品中。而在外部,截至今年年中,使用百度语音的App数量超过8万,大型合作厂商包括联想、中兴、魅族、联想、康佳、SONY、特斯拉、比亚迪等、惠普、三诺、艾米通讯等。

百度语音如今能获取的数据规模有多大?百度首席科学家吴恩达透露了最新数据——注册开发者数量达到14亿,在线识别请求量2016年每天达到1.4亿次,在线语音合成请求量则达到2亿次。对比科大讯飞今天公布的数据,目前人工智能云平台总用户数8.9亿,而与讯飞人工智能连接的应用,日均访问量为30亿次(一人用一次,计为一人次)。

随着这些数据的输入,每分每秒,AI的模型会迅速迭代和升级。就像谷歌的AlphaGo在每一场棋局的每一步对决中都在学习。

对于智能语音巨头们而言,大数据积累上慢一步,智能化上也相应慢一截。如果O2O市场的圈地比的是烧钱,那么智能语音的圈地恐怕比得是比钱更贵的东西——时间。

 

 

 

 


+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

不同于新车市场,二手车一车一世界,一平台一江湖。随着众多二手车交易app映入眼帘,谁的平台车源多?谁的服务更靠谱?

2016-11-23

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业