人工智能可提前三年识别出具有高胰腺癌风险的人群

人工智能
后台-插件-广告管理-内容页头部广告(手机)

编辑推荐:胰腺癌被称为“癌中之王”,其发病率在不断上升。早期诊断胰腺癌是一项重大挑战,因为这种疾病通常在晚期才被发现。大约80%的胰腺癌患者被确诊时已为局部晚期或远处转移性疾病,能够长期生存的患者极为罕见(5年生存率仅为2 - 9%)。但是,出现早期疾病的患者可以通过手术、化疗和放疗的结合来治愈。因此,更全面地了解胰腺癌的危险因素并在早期阶段就进行检测,能够很大程度上提高患者生存率并降低总死亡率。

据哈佛大学医学院,哥本哈根大学的研究人员与波士顿退伍军人医疗保健系统、美国丹娜·法伯癌症研究所和哈佛大学陈曾熙公共卫生学院合作进行的一项新研究,他们已开发出一种人工智能工具,仅通过患者的病历就能在确诊前三年识别出具有高胰腺癌风险的人群。

https://www.nature.com/articles/s41591-023-02332-5#Sec2

研究结果以《A deep learning algorithm to predict risk of pancreatic cancer from disease trajectories》为题5月8日发表在《自然医学》杂志上。研究人员称,研究结果表明,利用人工智能的人群筛查在发现疾病高风险人群方面可能很有价值,并且可以加快发现一种经常在晚期才能确诊的疾病,通常这种疾病的治疗效果较差,结果也很糟糕。

胰腺癌是一种侵袭性疾病,通常出现较晚,预后较差,需要早期就要发现。

在这项研究中,研究人员将人工智能方法应用于丹麦600万患者(24000例胰腺癌病例)(据丹麦国家患者登记处(DNPR))和美国的300万患者(3900例)(据美国退伍军人事务部(US- VA))的临床数据。研究人员根据临床历史中的疾病代码序列训练了机器学习模型,并测试了对于增量时间窗口内癌症发生的预测。对于36个月内发生的癌症,最佳DNPR模型的表现为受试者工作特征(AUROC)曲线下面积= 0.88,当排除癌症诊断前3个月内的疾病事件时,其表现降至AUROC (3m) = 0.83,对于1000名50岁以上的最高风险患者,其预估的相对风险为59。应用于US-VA的丹麦模型交叉数据表现较差(AUROC = 0.71),需要再次训练才能提高表现(AUROC = 0.78, AUROC (3m) = 0.76)。

这些数据结果提高了为高风险患者设计现实监测方案的能力,通过早期发现这种侵袭性癌症,可有利于延长寿命并提高生活质量。

“临床医生每天面临的最重要的决定之一是谁患某种疾病的风险高,谁将从进一步的测试中受益,这也意味着更具侵入性和更昂贵的程序,这些程序本身就有风险,”该研究的高级研究员克里斯·桑德说,他是HMS布拉瓦尼克研究所系统生物学系的教师。“一种人工智能工具可以瞄准那些患胰腺癌风险最高的人,这些人从进一步的测试中获益最多,这对改善临床决策有很大的帮助。”

桑德补充说,大规模应用这种方法可以加快胰腺癌的检测,导致早期治疗,改善结果并延长患者的寿命。哥本哈根大学诺和诺德基金会蛋白质研究中心疾病系统生物学教授、研究主任、该研究的联合高级研究员Søren Brunak说:“许多类型的癌症,尤其是那些难以识别和早期治疗的癌症,对患者、家庭和整个医疗保健系统造成了不成比例的损失。”“基于人工智能的筛查是改变胰腺癌发展轨迹的一个机会,胰腺癌是一种侵袭性疾病,众所周知,很难及早诊断,也很难在成功率最高的时候及时治疗。”

在这项新研究中,人工智能算法在两个独立的数据集上进行了训练,这些数据集总计来自丹麦和美国的900万例患者记录。研究人员“要求”人工智能模型根据记录中的数据寻找蛛丝马迹。基于疾病编码及其发生时间的组合,该模型能够预测哪些患者将来可能患上胰腺癌。值得注意的是,许多症状和疾病代码与胰腺没有直接关系或源于胰腺。

研究人员测试了不同版本的人工智能模型,以检测在不同时间尺度(6个月、1年、2年和3年)内疾病发展风险升高的人的能力。总的来说,每个版本的人工智能算法在预测谁会患胰腺癌方面都比目前对全人群疾病发病率的估计要准确得多——疾病发病率的定义是一种疾病在特定时期内在人群中发生的频率。研究人员说,他们相信该模型在预测疾病发生方面至少与目前的基因测序测试一样准确,而目前的基因测序测试通常只适用于数据集中的一小部分患者。

癌症筛查

对某些常见癌症的筛查,如乳腺癌、宫颈癌和前列腺癌,依赖于相对简单而高效的技术——乳房x光检查、巴氏涂片检查和血液检查。这些筛查方法通过确保在最可治疗的阶段早期发现和干预,改变了这些疾病的结果。

相比之下,胰腺癌的筛查和检测更加困难和昂贵。医生主要关注家族史和基因突变的存在,这些虽然是未来风险的重要指标,但往往会遗漏很多患者。人工智能工具的一个特别优势是,它可以用于任何和所有有健康记录和病史的患者,而不仅仅是那些已知的家族史或遗传易感性的患者。研究人员补充说,这一点尤其重要,因为许多高风险患者甚至可能不知道自己的遗传易感性或家族史。

在没有症状和没有明确迹象表明某人患胰腺癌的高风险的情况下,临床医生可能会谨慎地推荐更复杂和更昂贵的检查,如CT扫描、核磁共振或内窥镜超声。当使用这些检查并发现可疑病变时,患者必须接受活检。该器官位于腹部深处,难以接近,容易刺激和发炎。它的易怒为它赢得了“愤怒器官”的绰号。研究人员表示,一种识别胰腺癌风险最高人群的人工智能工具将确保临床医生对正确的人群进行测试,同时为其他人省去不必要的测试和额外的程序。

大约44%被诊断为胰腺癌早期阶段的患者在诊断后存活五年,但只有12%的病例被诊断为早期。研究人员估计,那些肿瘤生长超出原发部位的患者的存活率下降到2%到9%。

桑德说:“尽管手术技术、化疗和免疫疗法取得了显著进步,但生存率仍然很低。”“因此,除了复杂的治疗方法外,显然还需要更好的筛查,更有针对性的测试和早期诊断,而这正是基于人工智能的方法作为这一连续体的第一个关键步骤的地方。”

癌症预测

在目前的研究中,研究人员设计了几个版本的人工智能模型,并根据丹麦国家卫生系统41年来620万名患者的健康记录对它们进行了培训。在这些患者中,23,985人随着时间的推移患上了胰腺癌。在训练过程中,算法根据疾病轨迹识别出指示未来胰腺癌风险的模式,即患者是否具有随着时间的推移以特定顺序发生的某些条件。

例如,胆结石、贫血、2型糖尿病和其他gi相关问题的诊断预示着在评估后的3年内患胰腺癌的风险更高。不足为奇的是,胰腺的炎症在更短的两年内强烈地预示着未来的胰腺癌。研究人员警告说,这些诊断本身不应被视为指示性或导致未来胰腺癌的原因。然而,随着时间的推移,它们发生的模式和顺序为基于人工智能的监测模型提供了线索,并可能促使医生更密切地监测高风险人群或进行相应的检测。

接下来,研究人员在一组以前从未遇到过的全新患者记录上测试了表现最好的算法——美国退伍军人健康管理局的数据集,该数据集包含近300万条记录,跨越21年,包含3864名被诊断患有胰腺癌的患者。该工具在美国数据集上的预测准确性略低。这很可能是因为美国的数据集是在较短的时间内收集的,并且包含了一些不同的患者人群概况-丹麦数据集中的整个丹麦人口与退伍军人事务数据集中的现任和前任军事人员。当该算法在美国数据集上从零开始重新训练时,其预测准确性得到了提高。研究人员表示,这强调了两点:首先,确保人工智能模型在高质量和丰富的数据上进行训练。其次,需要访问国内和国际上汇总的临床记录的大型代表性数据集。在缺乏这种全球有效模型的情况下,应根据当地卫生数据对人工智能模型进行训练,以确保其训练反映当地人口的特点。

来源:AAAS

免责声明:康加号致力于健康常识传播,内容根据公开资料编辑,版权归原作者;如有侵权请在线留言删除。文章旨在介绍健康科学进展,不能作为治疗方案;如需精准健康指导,请至正规医院诊疗。

后台-插件-广告管理-内容页尾部广告(手机)
标签:

评论留言

我要留言

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。