百度AI推出音频转录应用SwiftScribe,将改变什么?

百度AI·2017-03-16 12:56
人工智能将实现1+1大于2的效果。

人工智能变革速记行业

百度最近宣布推出SwiftScribe网页应用,它的出现意味着人工智能将改变完全依赖人工的速记行业。百度首席科学家吴恩达在Facebook说:“这个应用非常适合那些需要把长语音转换为文本的人们,人工智能将实现1+1大于2的效果。”

SwiftScribe怎么用?

  • 用户可在PC端打开SwiftScribe网页应用,选取wav和mp3格式的文件上传,系统就能马上进行处理,时长1分钟的音频文件可以在30秒内转换完成。

  • 使用键盘快捷键可以进行加快播放、后退和添加换行符等操作,处理完成后,只需人工调整大小写、标点及部分拼写细节就能快捷、准确地完成音频转换。

从使用效果看,SwiftScribe可以为速记员带来1.67倍的效率提升,缩短40%的工作时间。目前可处理1小时内的音频文件,而这一时长正在开发团队的努力下逐步延展,未来会增加视频文件的语音识别及自动添加标点符号等功能,并支持更多文件格式,降低用户使用门槛。

SwiftScribe的开发原理

这次推出的SwiftScribe网页应用,依托于百度新一代深度语音识别系统Deep Speech 2,通过利用长达数千小时的语音数据训练,Deep Speech 2可以不断“学习”从语音中识别特定的字或词。

Deep Speech 2也被《麻省理工科技评论》评为“2016年十大突破技术”之一:“在识别汉语语音片段方面,要比人为识别更加准确。”目前,百度语音识别准确率已达到97%,这也为SwiftScribe的转化效率提供了技术基础。

SwiftScribe的灵感来源

作为非英语母语者,百度SwiftScribe项目经理吴田曾深受长语音记录的困扰:“要整理一段1小时录音对我来说要花上10个小时。” 而这就是这一应用的灵感来源。

百度在去年也推出了应用Deep Speech 2的安卓输入法TalkType,让用户能够用语音快速输入文字。百度硅谷人工智能实验室项目领导人Bijit Halder在公告中称:“TalkType是首款智能语音优先输入法。”

语音交互的时代

对话机器将成为2017人工智能的发展风口,吴恩达曾在《华尔街日报》的采访中说,随着准确率的提高和用户体验的提升,百度的语音产品已度过用户心中的“试用期”。

在语音产品迅猛发展的大环境下,亚马逊、苹果、谷歌和微软等科技巨头都在加紧研发各自的语音识别技术,然而在长文本音频转化技术上,百度的技术仍然领先。

+1
3

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

文字商标搜索市场几乎瓜分完毕,图形商标搜索的战争才刚刚开始。

2017-03-16

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业