这是两位中国少女为失语者群体设计的翻译臂环, 识别精准度高达95%|发现

宇多田·2017-05-31 20:11
这是一个并不受关注的利基市场。

作者| 田筱阳

编辑| 傅博

北京航空航天大学研究生王娜娜,清华大学研究生黄爽,历时两年,为失语者群体研究出一款直接将手语转化成语音的翻译臂环——“手音”。在使用这款臂环后,可以实现失语者与普通人的流利对话。

据中国青年报报道,“手音”是一款针对失语者的小众产品,预计今年5月下旬上线。普通人可能难以想象这款产品的意义所在——手语是失语者彼此日常沟通的主要方式,但对于普通人来说却是比所有外语都难的语言。

一边是手语,一边是普通语言,可以想象将两者“嫁接”起来的难度。

手音的两位设计者,图片来自中国青年报

据统计,截至目前,全中国大概有2100万失语者,全球总共有6500-7000万失语者左右。对于这些不幸的人们来说,你我习以为常,平凡到不能再平凡的日常语言交流,都成了遥远的奢望。

以“手音”为代表的帮助手语者更好与他人交流的辅助设备,无疑是一款为聋哑人生活带来极大方便的产品。

 有这个想法以来,两个女孩从最基本的技术环节开始,不断完善这款智能产品。最开始,她俩从零开始学习手语,并着手研究如何将手语翻译为语音。

查论文、做实验、写代码,在没有资金的情况下,她们便用冯如杯一等奖奖金5万元作为启动资金购买需要的设备。

在整个研发过程中,她们多次否定了图像识别技术,因为不能随时携带摄像头;她们也否定了手套这种形式,因为会考虑到以“不伤害失语者群体的尊严”为前提……

最终,她们确定采用臂环捕捉肌电信号的方法,这在某种程度上让失语者带看上去一如常人。

在确定研发方向后,她们需要不断输入数据、调试数据以保证手语翻译的准确性。两位姑娘基本上是每天执行枯燥无味的纯体力劳动。

如今,“手音”涵盖了200个手语动作,为了保证精确度,每一个动作基本都录制了1000多次。

在有了自己的手势数据库之后,手音团队还搭建了一个7层BP神经网络(一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一)对数据速度进行训练,目前识别准确度已经达到95%。 

而我们也注意到,在“手音”出现之前,其他国家也有类似的尝试如创新。

学生Hadeel Ayoub发明的Hadeel Glove, 华盛顿大学两名大二学生Navid Azodi和Thomas Pryor 发明的SignAloud均意图帮助失语者更好地与他人交流。

Hadeel Ayoub发明的Hadeel Glove

SignAloud

二者工作原理和外形十分相近,均为手套,通过传感器捕捉输入的手语信号,通过电脑或者芯片的处理,转换为语音信号输出。

另一个承担相似功能的则是UNI出品的平板MotionSavvy,具有双向翻译的能力,既能把手语翻译为日常交流的话语,也能把他人的语音翻译为文本供使用者阅读。

 

MotionSavvy

值得一提的是,上述三项产品的推出距现在已均有两年之多。这漫长的时间内,均无重大的技术更新或新的跟踪报道;而且,目前三项产品均不支持多语言。

由此可见,这一细分垂直领域,并非能高速增长发展的广阔蓝海,需要精心耕作。而不同语言之间天生的壁垒,亦横亘在各大竞品国际化的的道路之上。

另一方面,超脱技术层次的考虑则是,失语者是否愿意接受这一新兴的辅助工具呢?他们需要多长时间来学习并适应呢?“手音”团队如何优化产品设计,给予用户更好的穿戴及产品体验呢?

国内两千万,全球七千万的受众群体,或许并不足以肩负得起宏伟的财政目标和投资人的期许。而这一领域看起来也并非商业化发展的良田。

但是,并非只有成为独角兽抑或是斩获漂亮的营收数据才是成功。像Google、微软等科技巨头都在通过各种途径(设立比赛及慈善基金)为全球各类弱势群体开发新型产品,有时候,只要对特定需求有一个精准的定位,利基市场反而具备更大的消费市场和能量。


+1
999+

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

虽然不能完全定位于女生的短视频平台,但确实我们未来做的很多内容会优先考虑女生的喜好。

2017-05-31

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业