通过语音检测新冠?新方式还有待验证

超神经HyperAI·2020-04-10 08:59
CMU 和剑桥先后提出语言诊断新思路

编者按:本文来自微信公众号“HyperAI超神经”(ID:HyperAI),作者:神经小刀,36氪经授权发布。

内容概览:近期海外的疫情愈发严重,检测不力成为了一个亟待解决的问题。日前,卡内基梅隆大学的研究人员,以及剑桥大学的研究人员,分别利用声音探测器的方式,将 AI 用在了检测诊断的辅助程序之中。

关键词:语音处理辅助测试新冠检测

新冠肺炎疫情在海外迎来了爆发之势,而检测手段的繁琐和设备的短缺,也成了疫情防控过程中的拦路虎。

许多媒体都报道,检测不力是多国无法有效追踪疫情,导致病例迅速激增的一个原因。

近日两所知名的高校,卡内基梅隆大学(CMU)和剑桥大学,不约而同地使用了一种新的方式:通过 AI 系统分析声音信息,来检测被 COVID-19 感染的风险。

CMU:几分钟就可给出结果

在卡内基梅隆大学给出的测试器 COVID Voice Detector 中,需要完成几种声音的录制,仅需几分钟即可得到感染风险的结果。

进入网站注册后,需要进入个人情况的填写。其中涉及的信息包括人种,年龄,健康状况,是否确诊或确诊过等信息。

需要填入身体健康状况的信息

上述信息填写完毕后,需要录制咳嗽、英文元音的发音,数字和字母表朗读等语音信息。

而模型经过了确诊者和正常测试者的一些数据的训练,可以对新输入的声音进行分类的匹配。

最终会返回一个分数,表明所录制的声音,和收集到的 COVID-19 患者数据相比,感染特征相符合的程度。

最终呈现出来的结果

为了让系统的判断尽可能准确,必须拥有足够多的训练数据,而且还要涵盖多元化的信息,研究人员正在倡议更多的志愿者参与进来。

此外,他们称系统具备可扩展性,如声音来自其他呼吸系统疾病的人,算法就可学到该类疾病的声音特征。

新闻报道中的音源也被采用

测试器地址:

https://cvd.lti.cmu.edu/cvd/

发稿前访问该网站,提示因为在更新和维护的原因暂时关闭,相关负责人表示,有望在本周末再次上线。

剑桥大学:还仅仅是收集数据

和卡内基梅隆大学类似,剑桥大学也推出了用声音检测 COVID-19 的项目。但稍有不同的是,剑桥大学仅仅还是只是收集数据,还不提供检测的结果。

项目网页的提示:


贡献声音,助力科学,保证安全

系统收集数据的方式相差不大,需要填写基本资料和医疗信息,并通过手机麦克风采集语音信息作为训练样本。

同样地,系统也会调查用户的身体健康情况,比如是否发烧、是否感染过等信息。需录制的项目有呼气声、咳嗽声和阅读文本的声音。

需要录制的声音内容

项目负责人 Cecilia Mascolo 教授解释说,由于该项研究的大型数据集非常少,为了提供更好的算法以用于早期检测,需要收集到足够多的数据量。

他还表示到,数据量累计之后,即便没有足够冠状病毒阳性病例,还可以找到与其他呼吸道疾病有关的信息。

该项目的最终目标是,开发出可自动检测疾病的机器学习算法,以可推广使用的检测 App 来呈现。

项目地址:

https://www.covid-19-sounds.org/zh/index.html

语音取证,能够精准识别吗?

两个项目彼此独立,但使用的方式和原理拥有着一些共性。而对于项目的具体原理,双方却都没有给出太多信息。

卡内基梅隆大学的研究团队,曾长期致力于语音取证技术。他们认为人的声音,受到器官机构状况和健康程度的影响,能揭示生理,心理甚至医学数据。

受肺炎病毒感染的患者,肺部会发生一些病变,其呼吸模式等参数会受到影响,导致发出的声音出现一些异常特征,对算法而言是一个能够抓取的特点。

医生正在检查肺部 CT 

剑桥大学的团队,也是由多位专家、博士组成。在项目介绍中他们表示到,新冠肺炎作为一种呼吸系统疾病,感染疾病的人发出的声音会存在一些特征,包括声音,呼吸间隔和咳嗽声等。

虽然这种方式很新颖,但两个项目都处于初期阶段,在 BBC 的一篇报道中,还使用了「Teething problems」(出牙痛,指代初期困难)来表明此方案的困难。

不过在之前的研究中,用声音来诊断疾病的案例中,出现了一些成功的案例。

比如,成立于 2014 年的 ResApp Health,就专注使用机器学习算法来分析咳嗽声,来诊断和测量各种慢性和急性疾病的严重程度。目前取得了一些成果,可对哮喘,肺炎和毛细支气管炎等疾病进行判断。

目前应用已经成熟并投入了使用

另一个叫 Sonde 的公司,在去年还获得了一项语音诊断的美国专利。他们开发的一个平台,通过感测和分析语音中的细微变化,可从讲话中判断患者的健康状况,辅助医生进行诊断抑郁症、痴呆症等病症。

用声音诊断 COVID-19 的项目,相比已经成熟的研究,除了时间紧迫之外,关于疾病的声音数据也少之又少,所以难度和挑战也不小。

存在争议,是否有效还待验证

对于两个项目来说,研究没有经过 FDA 或 CDC 的批准,还不能用于正规的医学诊断。

现阶段的最大目的在于,呼吁更多人(包括确诊者和正常人)贡献自己的声音数据,以推动该研究项目的进展,进而去帮助对新冠等流行病的控制。

手机使用检测程序时的界面

关于这些研究,也出现了是否会有效的争议。比如不同地区疫情的程度不同,会不会带来模型的分析偏见。而简单的语音录制,虽然方便但收集的语音信息,是否达到了科学分析的要求。

现在看来,关于系统的专业性和准确度,还需要等待后续的验证。在此之前,没人知道前方的道路,但另一方面,这正是科学探索的魅力所在。

+1
0

好文章,需要你的鼓励

参与评论
评论千万条,友善第一条
后参与讨论
提交评论0/1000

下一篇

在西方主流媒体的风向里,孙正义曾经一度被认为是比埃隆·马斯克,更有可能影响下一波互联网潮流的人。

2020-04-10

36氪APP让一部分人先看到未来
36氪
鲸准
氪空间

推送和解读前沿、有料的科技创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业