解放双手,微软让Office套件能听你语音指令,还可充当60多种语言的翻译官

夜叶·2017-06-21 17:14
听起来很牛,但具体用起来是否顺畅还有待观望。

当语音从扮演人与人间承接流转的角色跳脱,转而成为人与物间沟通交流的桥梁时,想象空间也跟着拓宽了。

如过去仅播放音乐的音箱,结合语音识别等技术,摇身转变为家庭小助手。微软就这样做了,他们与本就做音箱的哈曼卡顿合作,推出搭载微软人工智能语音助手Cortana的智能音箱Invoke。

现在微软想用语音为其主要营收的Office套件赋能,延展“边界”。

微软实验研发小组Microsoft Garage今日推出新项目Dictate,能与Outlook,Word和PowerPoint等Office程序结合使用。安装Dictate后,过去打字输入法即可告一段落,语音听写将成为替代,通过讲话便能随即转为文字。

这背后用到与语音助手Cortana相同的语音识别技术及人工智能,包括Bing Speech API和Microsoft Translator。


不过语音操作对微软而言非稀奇事,此前Office 365或Office 365 Online就支持听写,微软内置的Windows系统也支持语音,这背后都是Nuance Dragon语音识别解决方案作支撑。

相对而言,Dictate相对应用范围窄,仅能用于Office。但它支持些命令,如“换行”、“停止听写”、“输入”及其他标点符号和行动指令。想手动增添标点符号,或当你滔滔不绝叙述时,让软件自行加标点也可以。还能移动光标、通过语音对文本进行修改。

(来源:Techcrunch)

Dictata还能让Office套件,摇身一变,成为“翻译官”。它支持20多种口语语言,可实时翻译为60种语言。意味着当你需要英文文件时,操着口普通话就能搞定得差不多。

目前该加载项还仅适用于Office 32位和64位,并要求用户在Windows 8.1或更高版本,Office 2013或更高版本及.Net Framework 4.5.0或更高版本。

同样集成听写处理技术的科技巨头还有谷歌

2015年Google Docs增添语音输入功能,用户能在Chrome浏览器端,通过语音输入文字。只是当时精准度就成问题,有错误出现时还得用键盘修改,反复物理按键与语音输入的交替,实际体验并不见得较之前畅快。去年,谷歌语音功能到提升,开始支持文字编辑。

国内WPS软件有内置语音功能,但还停留在设置朗读方式,用来核对数据,达到的效果是边输入边用语音听是否输入有误。不过借助百度拼音输入等输入法,还是可用语音输入WPS文档。目前国内市面主流的三大支持语音的输入法,科大讯飞、搜狗、百度,官方称其语音识别精准度分别为97%、97%、94%。

说回Dictata项目,目前已能免费下载在这里该应用,但由于这是微软Garage的项目,一般更多处在实验阶段,很可能不会有进一步发展。

+1
6

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

总部设在东京的东芝一直承受着出售芯片业务的压力,以此来筹集资金并弥补其核电业务的亏损。

2017-06-21

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业