搜狗推出速记工具“搜狗听写”,能将文字工作者从枯燥的语音速记工作里解放出来么?

石亚琼36氪@123·2017-08-08 17:15
人工智能解放生产力已经是大势所趋

语音速记是语音识别技术的应用之一,包括科大讯飞、华声捷通、云知声等语音识别公司都推出了相关的服务或者产品。主打AI的搜狗也是其中一家,8 月 8 日也为此前推出的“搜狗听写”正式召开了发布会。


“搜狗听写” 希望解决是记者、编辑、作家等文字工作者工作中耗时耗力枯燥的环节,主要的功能就是将语音实时变成文字,主打的卖点是“长语音”、“零延时”。根据官方信息,搜狗听写的技术来自于搜狗知音独家研发的长时语言撰写技术,并与端到端的深度神经网络技术整合,可以使得语音识别的准确率保持在较高水平。


针对不同的需求和场景,搜狗听写有“听写”和“转写”两种模式,前者可以实时给到识别结果;后者为离线录音整理。为了更为方便文字工作者,产品同时增加了蓝牙标重点(外接蓝牙设备标记重点,选中发送摘要,后期无需再筛选)、多终端同步(录音和文字免费同步到云端存档,随时可以调用)、信息分享等功能。同时,针对图书馆、咖啡厅等不便于大声说活的语音场景,搜狗听写提供耳语识别技术,官方表示,在说活音量低至30分贝时,也能识别。


搜狗听写推出时,市面上已经有不少类似产品,比如科大讯飞录音宝、讯飞语记等,不过其中不少已经开始由免费转向收费。目前,搜狗听写采用了免费的策略,发布会期间表示,未来一段时间内,搜狗还不打算通过产品收费进行商业变现。


现阶段,语音识别行业的准确率可以达到97%左右。36氪也在发布会现场试用了讯飞速记“听写”现场发布会,从现场的识别结果来看,与目前市面上大多数产品类似,识别的结果都还很难直接被使用。搜狗公司语音交互技术中心总经理王砚峰解释,主要是因为远程环境且使用扬声器造成的,远场环境下的识别也是目前智能语音交互的难点之一。

当百度、Google、微软等有搜索业务的公司都在发力人工智能时,AI也成了搜狗重要战略之一,王小川也提出“搜索即AI”,业务上也呈现出机器翻译、输入法、AI开放平台等多条产品线并发的局面。此前,在接受36氪采访时,搜狗就表示,搜狗以自然语言处理和自然交互为核心。目前,搜狗已经建立了语音自研团队。官方表示,搜狗拥有互联网规模最大的语音数据,每天有超过2.6亿次的语音请求,提供了大量的真实语料数据,使得识别准确率越来越高。

对于AI公司来说,除了技术,落地场景也是关键。搜狗的AI场景目前主要锁定了三大方向:车载、智能家居和户外可穿戴设备,除了已发布的车载产品,搜狗目前同魅族盒子、微信手表、大白遥控器等企业达成了合作。从发布会现场王砚峰透露的信息来看,搜狗接下来可能还会推出面向智能家居的终端产品。


+1
5

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000
36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业