科大讯飞推离线语音输入,意在拓展产品适用场景

氪友iOu6·2013-09-13 21:23
继Google之后,科大讯飞先于苹果推出了离线语音输入技术。该技术通过将语音资源库保存在本地,实现弱网络或无网络环境下的语音识别和输入。依靠较小的资源占用、较高的中文识别率和相应速度,讯飞离线语音已被小米3采纳。

提起科大讯飞,毫无争议是国内语音技术界的金字招牌。依靠相对深厚的技术储备和广泛的合作关系多年来一直领跑行业,目前可以说是三分天下有其二(70%的中文语音技术市场份额)。就在昨天的一场小型媒体交流会上,讯飞向我们展示了其最新的离线语音技术。

以往的语音资源库保存在云端,应用在提取音频特征后上传云端处理。而离线语音将资源库下载到本地,在弱信号或无信号环境下也可进行高精度的语音识别和输入。由于在资源占用和识别精度上的技术矛盾,目前在该领域推出成熟产品的公司屈指可数。

据统计,中国只有 26.1% 的手机用户接入 3G 网络,许多用户仍然处于流量敏感的状态。而讯飞的离线语音包仅有 15M 到 30M 大小,对不同性能的设备会自动在语音包体量上做出适配。再加上离线语音不受网络延迟的影响,对用户体验会带来较大提升。目前讯飞离线语音的中文识别准确率可以达到 85%,识别速度 300ms,两项指标相比 Google 均有一定优势(据称 Google 的 Offline Voice Typing 中文识别率不到 40%)。基于特定语言模型的分析,讯飞也可以实现长句语音输入和自动标点,用户无须再对文本频繁修改。另据小米官方消息,讯飞离线语音已被小米3采纳。

值得一提的是,讯飞的个性化语音识别也将应用在稍后版本中出现。系统会为用户数据建立个性化资源库,通过个性化资源的动态加载、融合使得语音智能更加“聪明”。

离线语音不是个新鲜名词,Google 在去年发布的 Android 4.1 版本中就已经应用了此技术,而据媒体此前报道,苹果即将推出的 iOS7 也具备这一功能。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

“德勤 -36氪明日之星”是由德勤和36氪共同合作的针对互联网创业公司的奖项,旨在挖掘和发现互联网领域最具增长潜力、最具投资价值的明日之星。 我们秉持客观、公正的态度,从超过200家报名参选的创业公司中,对产品创新、复制门槛和增长轨迹3个核心指标经过数轮打分,最终评选出了8家明日之星,他们分别是:友宝、蘑菇街、七牛、Viva畅读、新派公寓、聚合数据、知乎和K歌达人,恭喜他们。

2013-09-13

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业