通过语音检测新冠？新方式还有待验证

超神经HyperAI·2020-04-10 08:59

CMU 和剑桥先后提出语言诊断新思路

编者按：本文来自微信公众号“HyperAI超神经”（ID:HyperAI），作者：神经小刀，36氪经授权发布。

内容概览：近期海外的疫情愈发严重，检测不力成为了一个亟待解决的问题。日前，卡内基梅隆大学的研究人员，以及剑桥大学的研究人员，分别利用声音探测器的方式，将 AI 用在了检测诊断的辅助程序之中。

关键词：语音处理辅助测试新冠检测

新冠肺炎疫情在海外迎来了爆发之势，而检测手段的繁琐和设备的短缺，也成了疫情防控过程中的拦路虎。

许多媒体都报道，检测不力是多国无法有效追踪疫情，导致病例迅速激增的一个原因。

近日两所知名的高校，卡内基梅隆大学（CMU）和剑桥大学，不约而同地使用了一种新的方式：通过 AI 系统分析声音信息，来检测被 COVID-19 感染的风险。

CMU：几分钟就可给出结果

在卡内基梅隆大学给出的测试器 COVID Voice Detector 中，需要完成几种声音的录制，仅需几分钟即可得到感染风险的结果。

进入网站注册后，需要进入个人情况的填写。其中涉及的信息包括人种，年龄，健康状况，是否确诊或确诊过等信息。

需要填入身体健康状况的信息

上述信息填写完毕后，需要录制咳嗽、英文元音的发音，数字和字母表朗读等语音信息。

而模型经过了确诊者和正常测试者的一些数据的训练，可以对新输入的声音进行分类的匹配。

最终会返回一个分数，表明所录制的声音，和收集到的 COVID-19 患者数据相比，感染特征相符合的程度。

最终呈现出来的结果

为了让系统的判断尽可能准确，必须拥有足够多的训练数据，而且还要涵盖多元化的信息，研究人员正在倡议更多的志愿者参与进来。

此外，他们称系统具备可扩展性，如声音来自其他呼吸系统疾病的人，算法就可学到该类疾病的声音特征。

新闻报道中的音源也被采用

测试器地址：

https://cvd.lti.cmu.edu/cvd/

发稿前访问该网站，提示因为在更新和维护的原因暂时关闭，相关负责人表示，有望在本周末再次上线。

剑桥大学：还仅仅是收集数据

和卡内基梅隆大学类似，剑桥大学也推出了用声音检测 COVID-19 的项目。但稍有不同的是，剑桥大学仅仅还是只是收集数据，还不提供检测的结果。

项目网页的提示：

贡献声音，助力科学，保证安全

系统收集数据的方式相差不大，需要填写基本资料和医疗信息，并通过手机麦克风采集语音信息作为训练样本。

同样地，系统也会调查用户的身体健康情况，比如是否发烧、是否感染过等信息。需录制的项目有呼气声、咳嗽声和阅读文本的声音。

需要录制的声音内容

项目负责人 Cecilia Mascolo 教授解释说，由于该项研究的大型数据集非常少，为了提供更好的算法以用于早期检测，需要收集到足够多的数据量。

他还表示到，数据量累计之后，即便没有足够冠状病毒阳性病例，还可以找到与其他呼吸道疾病有关的信息。

该项目的最终目标是，开发出可自动检测疾病的机器学习算法，以可推广使用的检测 App 来呈现。

项目地址：

https://www.covid-19-sounds.org/zh/index.html

语音取证，能够精准识别吗？

两个项目彼此独立，但使用的方式和原理拥有着一些共性。而对于项目的具体原理，双方却都没有给出太多信息。

卡内基梅隆大学的研究团队，曾长期致力于语音取证技术。他们认为人的声音，受到器官机构状况和健康程度的影响，能揭示生理，心理甚至医学数据。

受肺炎病毒感染的患者，肺部会发生一些病变，其呼吸模式等参数会受到影响，导致发出的声音出现一些异常特征，对算法而言是一个能够抓取的特点。

医生正在检查肺部 CT

剑桥大学的团队，也是由多位专家、博士组成。在项目介绍中他们表示到，新冠肺炎作为一种呼吸系统疾病，感染疾病的人发出的声音会存在一些特征，包括声音，呼吸间隔和咳嗽声等。

虽然这种方式很新颖，但两个项目都处于初期阶段，在 BBC 的一篇报道中，还使用了「Teething problems」（出牙痛，指代初期困难）来表明此方案的困难。

不过在之前的研究中，用声音来诊断疾病的案例中，出现了一些成功的案例。

比如，成立于 2014 年的 ResApp Health，就专注使用机器学习算法来分析咳嗽声，来诊断和测量各种慢性和急性疾病的严重程度。目前取得了一些成果，可对哮喘，肺炎和毛细支气管炎等疾病进行判断。

目前应用已经成熟并投入了使用

另一个叫 Sonde 的公司，在去年还获得了一项语音诊断的美国专利。他们开发的一个平台，通过感测和分析语音中的细微变化，可从讲话中判断患者的健康状况，辅助医生进行诊断抑郁症、痴呆症等病症。

用声音诊断 COVID-19 的项目，相比已经成熟的研究，除了时间紧迫之外，关于疾病的声音数据也少之又少，所以难度和挑战也不小。

存在争议，是否有效还待验证

对于两个项目来说，研究没有经过 FDA 或 CDC 的批准，还不能用于正规的医学诊断。

现阶段的最大目的在于，呼吁更多人（包括确诊者和正常人）贡献自己的声音数据，以推动该研究项目的进展，进而去帮助对新冠等流行病的控制。

手机使用检测程序时的界面

关于这些研究，也出现了是否会有效的争议。比如不同地区疫情的程度不同，会不会带来模型的分析偏见。而简单的语音录制，虽然方便但收集的语音信息，是否达到了科学分析的要求。

现在看来，关于系统的专业性和准确度，还需要等待后续的验证。在此之前，没人知道前方的道路，但另一方面，这正是科学探索的魅力所在。

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

通过语音检测新冠？新方式还有待验证

CMU：几分钟就可给出结果

剑桥大学：还仅仅是收集数据

语音取证，能够精准识别吗？

存在争议，是否有效还待验证

最近内容

提及的项目

测试+

风

下一篇