以色列公司VocalZoom:脸一动就知道你在说什么

杜暮雨·2016-03-10 15:46
据说当地军方就用这种技术窃听。

仅凭人类说话时嘴巴、面部附近的皮肤震动频率便能得知他在说什么,这就是以色列公司VocalZoom的HMC光学人机交流传感器,它可以帮助语音识别技术做到更加精准。

通过将VocalZoom HMC Sensor集成到声控解决方案中,可以捕足、测量面部震动的数据,并将其转换为一个独立的参考信号。系统可以通过这个信号进行运转,而不受噪音水平的影响。

捕获.PNG

这是一个比硬币还小的多的sensor,可能乍看起来没什么用——都能放置在人脸附近了,难道听不到他在说什么吗?直接用麦克风录音不就好了?

其实不然,拿人们熟知的Siri举例,在人声嘈杂的环境中它的识别准确率并不高,这都是噪音带来的影响。而HMC Sensor恰恰可以在人群之中通过激光探射某一用户的面部(用户并不会感知到,也没有健康危害),采集0-1.5KHz频率的人声信号。不过一般而言人声信号频率高达8KHz,HMC Sensor采集到的信号在人耳听来会比较模糊,只有经过训练的语音识别系统能够识别。所以VocalZoom也会配备一个能采集到0-15KHz频率的麦克风,配合Sensor一起使用,先采集正常的声音再提炼出想要的人声。

HOME.jpg

理论上来讲所有需要语音识别的设备都是它的应用场景。VocalZoom公司的VP Rammy Bahalul告诉36氪,其已经谈成合作的厂商包括美国最大的汽车后视镜厂商之一、附带通讯功能的摩托头盔厂商、AR眼镜厂商,但暂时还没有落地产品。

中国的语音识别技术厂商科大讯飞也已和VocalZoom达成合作,该公司表示,通过向用户耳机和汽车信息娱乐解决方案中加入VocalZoom传感器,科大讯飞的自动语音识别(ASR)功能可以平均得到50%的改善,在打开车窗噪声明显的时候效果更加明显。其正在与科大讯飞共同研发一款耳机产品,而最先的合作方式将是把传感器与科大讯飞语音云结合。

Rammy Bahalul表示,当HMC Sensor拿到足够多订单批量生产时,售价大概是不到10美金。

据他介绍,这项技术在大学实验室已经比较成熟,实际上军方早已有过应用,比如将激光发射到玻璃上采集震动频率来进行窃听。VocalZoom从2012年开始研发更适合商用的Sensor,可以做到激光的发射和接受都用同一个传感器实现,从而提及小到足够放进电子产品里,这一产品将在今年二季度正式上市。

该团队有25人,在2010时拿到Iris Ventures的70万美元A轮融资;2012年11月拿到3M New Ventures、OurCrowd、SilverFish的300万美元B轮融资;2014年8月拿到Motorola Solutions领投,3M New Ventures、OurCrowd、SilverFish、Radiant Venture Capital跟投的900万美元C轮融资。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

6年前,有一群“等饭否回来”的人,写了很多感怀的话,凝结了当时那代人对一个伟大产品尝试的心绪,这些等待帖至今还能在豆瓣上搜索得到。

2016-03-10

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业