European Radiology:人工智能前列腺癌检测的多中心、多扫描仪验证研究
时间:2025-04-04 12:09:15 热度:37.1℃ 作者:网络
磁共振成像(MRI)是活检前评估和前列腺癌(PCa)早期检测的重要工具。它能实现及时干预和提供更有效的治疗方案,显著改善患者预后。
前列腺影像报告和数据系统(PI - RADS)评分系统的发展取得了一定进展,但不同中心在癌症检测性能上存在差异。放射科医生培训水平的不同、扫描仪技术和成像协议的变化,对癌症检测结果的一致性和准确性有显著影响。
基于深度学习的计算机辅助检测(DL - CAD)软件在提高临床显著性 PCa(csPCa,通常定义为分级组(GG)≥2)检测准确性方面受到越来越多的关注。用于 PCa 检测的 DL - CAD 系统性能已接近专家放射科医生。通过辅助放射科医生进行更精确的图像分析,这些系统还有助于减少侵入性活检的需求,最终改善患者护理。然而,目前的研究大多局限于回顾性、单中心、单扫描仪的数据,无法评估模型的泛化能力。Sushentsev 等人的系统评价对基于 MRI 的全自动和半自动人工智能算法鉴别 csPCa 的性能进行了比较,在通过质量筛选的 17 项研究中,14 项(82%)是在单一中心进行的,且使用的是单一供应商的数据。为了将这些技术应用于临床实践,在多中心、多供应商数据上进行性能评估对于评估其泛化能力至关重要。
最近,发表在European Radiology 上的一篇文章将一种在来自英国不同医院的独立数据集上验证的新型 AI 解决方案与原始多学科团队(MDT)支持的放射科医生解读结果进行了比较,为该技术的进一步临床应用提供了参考依据。
一款具有欧洲合格认证(CE)标志的深度学习(DL)计算机辅助检测(CAD)医疗设备(Pi),利用 PROSTATEx 数据集和来自五家英国医院(793 名患者)的回顾性数据进行训练,以检测格里森分级组(GG)≥2 的癌症。独立验证数据集来自六个地点的两家制造商的六台机器(252 名患者)。研究纳入的数据为 2018 年 8 月至 2022 年 10 月期间进行的 MRI 扫描数据。对于 MRI 结果为阴性且未进行活检的患者,假定为阴性(90.4% 的患者前列腺特异性抗原密度 < 0.15 ng/mL²)。使用受试者工作特征(ROC)分析来比较使用 5 类可疑评分的放射科医生的诊断结果。
验证集中 GG≥2 的患病率为 31%。按患者评估,Pi 与放射科医生的表现相当(将 10% 的性能差异视为可接受),曲线下面积(AUC)分别为 0.91 和 0.95。在预先设定的 3.5 风险阈值下,AI 软件的灵敏度为 95%,特异度为 67%;而依据前列腺影像报告和数据系统 / 李克特评分≥3 的放射科医生检测 GG≥2 癌症的灵敏度为 99%,特异度为 73%。在患者层面,AI 在每个站点的表现都很好(AUC≥0.83),且不受扫描仪使用年限和场强的影响。
图 FROCs公式参数化人工智能模型和专家的病变水平,显示人工智能模型的假阳性病变平均数量高于放射科医生,灵敏度高于70%
真实世界数据测试表明,Pi 在检测 GG≥2 的 PCa 方面与 MDT 支持的放射科医生的表现相当,并且能够推广应用于多个站点、不同扫描仪供应商和型号。
原文出处:
Francesco Giganti,Nadia Moreira da Silva,Michael Yeung,et al.AI-powered prostate cancer detection: a multi-centre, multi-scanner validation study.DOI:10.1007/s00330-024-11323-0