麻省理工科研团队研发新型人工智能模型,可通过睡眠呼吸检测诊断帕金森 | 科技导报

人工智能
后台-插件-广告管理-内容页头部广告(手机)
麻省理工科研团队研发新型人工智能模型,可通过睡眠呼吸检测诊断帕金森 | 科技导报

美国麻省理工学院电子工程与计算机科学系的Dina Katabi教授带领团队设计了一种AI模型,能够实现利用夜间睡眠的呼吸信号来诊断帕金森症,并检测其严重程度。

帕金森病是一种常见的神经系统退行性疾病,目前我国帕金森病的平均患病年龄为60岁,患者已超300万人,近年来,研究显示该病已逐渐呈现年轻化的趋势,青年型帕金森病患者约占总发病人数5%-10%。

与庞大的患病人群相比,普通民众对该病的认知却十分有限。很多人对帕金森病的印象还停留在“手抖”、“行动迟缓”等临床表现上,但实际上,出现明显症状时,患者就已经处于病理发展到后期了。因此,早发现就能为患者赢得宝贵的治疗时间。

8月22日,美国麻省理工学院电子工程与计算机科学系的Dina Katabi教授和她的团队在Nature Medicine上发表了一项研究,该研究以“Artificial intelligence-enabled detection and assessment of Parkinson’s disease using nocturnal breathing signals”为题,介绍了一种人工智能模型,其可通过读取人睡眠时的呼吸模式来检测帕金森病

麻省理工科研团队研发新型人工智能模型,可通过睡眠呼吸检测诊断帕金森 | 科技导报

相关论文(图片来源:Nature Medicine)

该人工智能模型得以研发成功采用了哪些理论基础和技术手段?应用前景如何?《科技导报》新媒体就此专访了论文一作麻省理工学院电气工程与计算机科学系助理研究员杨宇喆,第二作者麻省理工学院电气工程与计算机科学系博士后研究员袁园,两位也是本文的通讯作者。

您可否简要介绍下能够通过夜间呼吸监测帕金森的人工模型这一科研成果?

杨宇喆:我们的研究,一句话概括来说是设计了一种AI模型,能够实现利用夜间睡眠的呼吸信号来诊断帕金森症(Parkinson's disease,PD),并检测其严重程度。

我们的工作也首次证明了睡眠呼吸信号是帕金森疾病的一个数字生物标志物(digital biomarker)。我们进一步通过无线信号检测呼吸的原理,实现了能够在患者家里部署、且无任何身体接触的疾病诊断、严重程度检测,和长期病情跟踪的系统。

它突破了哪些核心难题?或者说它最大的意义和价值是什么?

杨宇喆:研究背景上讲,目前没有用于诊断帕金森病或跟踪其进展的有效生物标志物。帕金森病是一种复杂的神经退行性疾病,也是世界上第二常见的神经退行性疾病,影响着约1%-2%的65岁及以上老人。

随着全球人口老龄化,帕金森病发病率还将大幅增加。目前,全世界有超过600万人患有帕金森病,每年还有约60000名新患者确诊。患者大脑中产生多巴胺的神经元丧失,影响运动和认知,导致出现震颤、肌肉僵硬、意识模糊和痴呆等症状。

然而,帕金森病难以诊断,因为帕金森病的诊断主要依赖于震颤、肌肉僵硬和行动迟缓等运动症状的出现,但这些症状通常在患病数年后才出现,此时患者已经产生了不可逆的神经损伤

多年来,研究人员一直在研究使用脑脊液和神经影像学检测帕金森病的潜力,但这些方法是侵入性的,价格昂贵,而且需要去专业的医疗中心才能进行检测。这使得它们不适合用来进行频繁检测,也就无法提供早期诊断或持续跟踪疾病进展。

我们这项研究证实了帕金森病与夜间呼吸症状之间存在密切联系,表明基于人工智能的呼吸模式检测模型能够发现帕金森病,评估其严重程度并跟踪疾病进展

由于呼吸信号可以通过在家中安装无线信号设备,通过无线信号检测呼吸的原理采集得到,我们能够实现在患者家里部署、且无任何身体接触的疾病诊断、严重程度检测,和长期病情跟踪的系统。将这些呼吸信号反馈到神经网络,无需患者自己和护理人员的操作,就能评估帕金森病。

此外,帕金森症是一个及其缓慢发展的神经退行性疾病,加之由于目前缺乏对病症变化程度敏感的标记物,其临床试验的持续时间和成本都非常昂贵(其药物开发平均成本和时间分别是13亿美元和13年),这限制了许多制药公司开发帕金森病药物或疗法的兴趣。

因此,我们希望我们这种基于人工智能的生物标志物能够提供早期诊断,并能提供长期且敏感的病情程度变化追踪,这将有可能会助于缩短临床试验时间,降低成本,从而促进药物开发。

根据相关报道,除了能够诊断和监测帕金森病,该人工智能模型“还首次证明了睡眠呼吸信号是帕金森病的一个数字生物标志物”。请问这一发现将对帕金森的诊治带来什么样的影响?

杨宇喆:之前提到,目前临床的帕金森病诊断方式,主要还是依赖于临床运动症状的出现。但这些症状通常在患病数年甚至数十年后才出现,此时患者往往已经产生了不可逆的神经损伤(例如50%-80%的多巴胺能神经元)。

目前临床的评估帕金森病严重程度的最常用方法,则是通过一个叫做“世界运动障碍学会帕金森病综合评价量表”(MDS-UPDRS)的问卷实现。这需要由经过专业培训的医生根据主观标准对患者症状进行分类评估和打分,而这种检测则往往非常低频(一年仅2-3次)。

而我们这项研究证实了帕金森病与夜间呼吸症状之间存在密切联系,表明基于人工智能的呼吸模式检测模型能够发现帕金森病,评估其严重程度并跟踪疾病进展。由于呼吸信号可以通过在家中安装无线信号设备,通过无线信号检测呼吸的原理采集得到,我们能够实现在患者家里部署、且无任何身体接触的疾病诊断、严重程度检测,和长期病情跟踪的系统。将这些呼吸信号反馈到神经网络,无需患者自己和护理人员的操作,就能评估帕金森病。

团队为什么选择夜间睡眠呼吸信号来作为检测帕金森的切入点?

杨宇喆:实际上,早在1817年,詹姆斯·帕金森医生(帕金森病正是以他的名字命名)就发现了帕金森病与呼吸之间的关系。这提示了我们,有可能在不观察运动症状的情况下通过检测呼吸来诊断帕金森病。

此外,也有研究表明,帕金森病患者在出现运动症状之前数年就已经出现了呼吸系统症状,例如呼吸肌无力、睡眠呼吸障碍、以及控制呼吸的大脑区域退化等。

这让我们想到了,呼吸系统症状有可能用于帕金森病的诊断。于是我们提出设计AI模型,利用夜间的呼吸信号来尝试诊断PD、监测严重程度,以及连续跟踪其疾病进展。最终的结果也首次证明,睡眠呼吸信号是帕金森疾病的一个强有力的数字生物标志物(digital biomarker)。

相比于其他标志物,睡眠呼吸信号在诊治帕金森时具有哪些优劣势?

杨宇喆:其他现有方法,比如研究脑脊液、血液,或者神经影像等等。大部分是侵入式检测,并且需要去医院检测。有研究表明,帕金森病患者在出现运动症状之前数年就已经出现了呼吸系统症状,同时睡眠呼吸信号可以用不同的设备很轻易采集到,比如无线射频信号等等。因此,使用睡眠呼吸信号进行诊治,既可能进行早期诊断,同时也可以非接触、非侵入、简单便捷地在家中进行检测和长时间的跟踪。

团队展开这一研究的初衷是什么?用了多久完成?

杨宇喆:研究的初衷是探索使用远程监控技术和睡眠呼吸信号去预测一些生理信号,以及进行帕金森病的早期检测和疾病严重程度的预测和跟踪。这项研究从最开始做到稿件接受,总共耗时三年。

在研究过程中,团队经历了一些困难?又是如何克服的?

杨宇喆:第一个障碍来自于医学背景的缺失,但这个可以通过大量阅读文献来解决。我记得刚开始做的时候我们也只有一个模糊的想法,也是通过不断阅读文献,反复推敲想法,实验验证,以及和不同医院的领域专家们聊天来寻找可能探索的方向,最终慢慢找到探究呼吸和帕金森症这个目标的。

其次,由于我们是数据驱动的医学研究,数据本身是最为关键的。为了能拿到足够量且分布足够多样化的数据,我们在项目开始的半年里经常奔波于各大医院找合作者聊天,展示、讨论当前最好的结果并希望能拿到更多的数据。

袁园:的确,数据是非常关键的部分,这项研究是与罗切斯特大学医学中心、梅奥诊所、马萨诸塞州总医院和波士顿大学健康与康复学院合作进行采集数据,MIT也采集了一部分对照组数据。为了有更多的数据训练AI模型,也从公开的美国国家睡眠研究资源获得一部分数据(PGS data,呼吸信号全部是breathing belt采集的)。因此主要数据来源于breathing belt和无线设备两种不同设备。

Breathing belt的数据集由于每个人只采集1-2个晚上,因此包含的睡眠呼吸数据中帕金森患者比例非常少;无线设备的数据集由于每个人可以很容易采集多个晚上的数据,因此包含的睡眠呼吸数据中帕金森的比例和对照组的比例相当。所以训练模型的时候面临着数据集之间modality(模态)的差异以及数据集内部distribution(分布)的差异。团队花了很多时间去尝试不同的算法和提升实验结果,最后能把所有的数据混在一起训练出在所有数据集上表现都比较好的模型。

杨宇喆:此外,虽然我们发表在医学期刊,但AI系统的算法设计也是非常关键的,这是由于医学数据分布本身会为AI算法带来挑战——大部分数据来自于健康人群,患病者则是少数,这带来了数据不平衡的难题;其次,不同医院由于采集设备的不一致,收集的信号数据可能会存在一定的差异,这对模型的泛化性也提出了挑战。

我们发现目前的机器学习算法并没有很好的考虑到这些真实数据上的挑战,于是我们也花了大量时间去提升相对应的算法,最终拿到了明显的结果提升,而相应的算法创新也被发表在了AI/ML的顶级会议ICML 2021 [1] 和ECCV 2022 [2] 上,感兴趣的小伙伴也欢迎关注。

您可否介绍下,当前最常用的诊治帕金森病的临床手段有哪些?

杨宇喆:帕金森病作为一种进行性疾病,通常会以轻微的症状开始,比如手部或头部震颤。它会影响神经系统,会逐渐导致肌肉僵硬、运动缓慢、平衡受损。随着时间推移,面部表情会逐渐消失。也有些帕金森患者在经历僵硬和震颤之前会出现睡眠问题、便秘、嗅觉丧失等等。

当前,医生通常通过检查患者的病史和症状,并通过一些血液检测或其他检测去排除其他会产生类似症状的疾病,以及通过一些药物反应来最终获得准确的诊断。

与这些手段相比,团队这次研发AI模型的最大优势是什么?

袁园:实际上这些运动症状通常在患病数年后才出现,此时患者已经产生了不可逆的神经损伤。有研究表明,帕金森病患者在出现运动症状之前数年就已经出现了呼吸系统症状,例如呼吸肌功能减弱、睡眠呼吸障碍、以及控制呼吸的脑干区域退化等。我们的AI模型正是基于睡眠呼吸信号进行检测,因此能更早地发现患病的可能性,从而使患者更早地开始治疗和阻止疾病的进展。

关于此次的研发成果,您认为是否还有值得优化的地方?

杨宇喆:首先,我们的系统用一晚的呼吸数据的检测结果是特异性和灵敏度分别达到80%左右(若用多个晚上准确率会更高)。这意味着仅使用我们的系统,依旧存在相当的假阳/假阴的诊断结果。这就意味着模型本身表现仍需要提高,以达到能被直接部署使用的精度。

其次,我们采集的数据依旧较为有限,没有很好的包括世界上的所有人群。我们希望能继续搜集相关的数据用于AI系统的训练,能够包含不同人群、种族、性别等其他因素,而这也是使得模型能够更加鲁棒和可靠的关键

袁园:在数据方面,虽然我们的系统测试了7687人,包括757名帕金森患者,总共超过120000小时的睡眠数据,并且这些数据包含了不同的种族、年龄、性别,但是早期检测的实验主要是测试患者被诊断为帕金森综合症的6年前的呼吸数据。如果有更多和更早的数据,比如12年前甚至更早,或者早期不同阶段的数据,也许能对早期诊断有更丰富的研究。

在模型方面,我们需要进一步探索一下自监督学习,或者transformer等时间序列信号的特征学习方法,以及更加鲁棒的模型泛化的算法。

国际上是否有同类型的AI模型,与他们相比,你们这次研发的人工智能模型的优劣势是什么?

杨宇喆:国际上目前没有用AI模型研究睡眠呼吸和帕金森综合症的工作,我们无论是在研究规模还是研究发现及创新上可以说都是有突破性进展的。

这种人工智能模型的应用范围能否拓展到其它疾病的诊治当中?

杨宇喆:据我们的文献调研结果,目前暂时还没有了解到相关工作深入研究其他神经退行性疾病(如阿兹海默症,Alzheimer's disease)和夜间呼吸症状的关系,所以不能妄下定论。但以往的文献也或多或少对这些神经退行性疾病伴随有临床上的夜间呼吸紊乱等症状有过分析和报道。

我们对我们的AI系统是否能够分辨不同的神经退行性疾病做了验证。虽然样本较少,但结果显示在控制人群变量来自同一数据集时,其能以AUC=0.895的准确率区别帕金森症(n=57)和阿兹海默症患者(n=91)。这说明AI系统是学到了和帕金森症相关的特征,而非广泛的神经退行性疾病相关的特征。

要彻底回答这个问题,则需要搜集大量其他神经系统疾病数据,训练并详细测试AI系统的表现,才能得出可靠的结论。

袁园:我们相信这种人工智能模型非常有可能拓展到其他神经系统疾病,比如阿尔兹海默症。但是在得出到底是否可能的明确结论之前,还需要采集更多相关的数据,以及进行更多的研究和实验。

据报道,该模型诊断帕金森时的能力在held-out测试集和外部测试集上的曲线下面积(AUC)分别高达0.90和0.85,请问这一数字后续还能否继续提升?现阶段,该模型是否存在不足之处?主要有哪些方面?

袁园:如果能持续收集到更多患者和志愿者的数据(比如不同年龄、种族、性别、受教育程度、患病年限等等)来训练模型,相信模型的性能和鲁棒性都会有更进一步地提升。

这种人工智能模型的应用前景如何?

袁园:我们提出的这个可以长期监测睡眠呼吸信号并且作出诊断的系统和模型,相比于以前出现症状之后定期去医院检查,能更早诊断帕金森病,也能更客观测量疾病严重程度,有很广阔和有价值的应用前景。

杨宇喆:我们希望能继续搜集相关的数据用于AI系统的训练,能够包含不同人群、种族、性别等其他因素,而这也是使得模型能够更加鲁棒和可靠的关键。我们同时也计划继续在不同患者家中部署AI系统,获取长期的病情监测数据,能够给临床医师进行实时远程数据反馈,期待能实现无接触式的远程医疗的可能。

您预计何时能够实现商业化应用,并广泛应用于临床诊治当中?

袁园:虽然很有前景,但是它仍处于早期发展阶段,在大规模商业化应用之前,还需要和更多医疗机构合作,采集更大规模的数据进行更全面的实验验证。

您可否谈谈团队下一阶段的研究计划与目标是什么?

杨宇喆:首先是探寻睡眠呼吸信号的可拓展性,这方面会围绕睡眠呼吸信号做一些不同方向的研究,也包括不同疾病的研究,如阿尔兹海默症等。

其次是寻找更多远程监测的方法,以及将整个系统完整部署实现长时间连续的病情监测和反馈。

袁园:我们团队的成员接下来会继续围绕睡眠呼吸信号做一些不同方向的研究,也包括不同疾病的研究。我这边主要会集中在睡眠呼吸和阿尔兹海默症的研究上。

参考文献:

[1] Y. Yang, K. Zha, Y. Chen, H. Wang, D. Katabi. “Delving into Deep Imbalanced Regression.” ICML, 2021.

[2] Y. Yang, H. Wang, D. Katabi. “On Multi-Domain Long-Tailed Recognition, Imbalanced Domain Generalization and Beyond.” ECCV, 2022.

学者简介

杨宇喆,麻省理工学院电气工程与计算机科学系(MIT EECS)博士生,师从Dina Katabi 教授,研究方向为机器学习和医疗AI。本科毕业于北京大学信息科学技术学院。研究工作发表于Nature Medicine、Science Translational Medicine、ICML、CVPR、NeurIPS、ICLR等顶级期刊和会议,并被多个主流媒体如MIT Technology Review,Forbes,BBC,The Washington Post等报道。曾获得MathWorks博士奖学金,国家奖学金,IEEE ComSoc国际学生竞赛第一名等荣誉。

袁园,麻省理工学院计算机科学与人工智能实验室(MIT CSAIL)博士后,导师Dina Katabi教授,研究方向为计算机视觉、机器学习和AI for healthcare。博士毕业于香港科技大学电子与计算机工程系,博士期间在卡内基梅隆大学机器人系做过一年访问学者。研究工作发表于Nature Medicine、CVPR、NeurIPS、ICLR、ICCV等顶级期刊和会议并被多个主流媒体如Forbes、BBC、The Washington Post等报道。

Dina Katabi,麻省理工学院电气工程与计算机科学系Thuan (1990) and Nicole Pham教授,MIT Jameel Clinic首席研究员,无线网络和移动计算中心主任,麦克阿瑟天才奖得主,美国国家工程院院士,美国艺术与科学院院士。研究方向为医疗人工智能、数字健康、机器学习、计算机视觉、无线和移动系统。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。