BCJ:在丹麦5000例DLBCL患者中验证13个预后模型
时间:2023-11-18 21:27:56 热度:37.1℃ 作者:网络
验证DLBCL预后模型
弥漫性大 B 细胞淋巴瘤 (DLBCL)中已经开发了许多临床预后模型对患者进行风险分层,1993年发表的国际预后指数 (IPI)是新诊断 DLBCL 中最广泛使用的预后工具,也是当今临床试验中选择患者和风险分层的主要工具。然而由于治疗方案随时间发生变化,IPI的预后价值有所下降,存在优化模型的需求。
后续开发的IPI 样模型与 IPI 相比,在利妥昔单抗时代具有优越区分能力,其中最常报道的 IPI 样模型是R‐IPI和NCCN‐IPI。多项研究已在 DLBCL 患者中验证了不同预后模型,但它们也存在一些问题,例如大多数研究患者数量有限、仅少数预后模型对比、缺乏外部验证和校准度(calibration,观察结果和预测之间的一致性,外部验证预测模型时推荐使用)分析,或患者较多但来自无法反映真实人群的临床试验。
丹麦学者开展一项基于人群的研究,旨在通过在真实世界 DLBCL 人群中进行验证来确定最准确的预后模型。他们报告了13个预后模型的辨别能力和校准度,并确定了当前模型可作为开发 DLBCL 模型时的参考,并可能用于临床试验中的患者选择。研究结果近日发表于《Blood Cancer Journal》。
研究方法
该研究通过全国范围的丹麦淋巴瘤登记处(LYFO)纳入DLBCL患者,患者需符合以下入选标准:(1)年龄≥18岁;(2)2000年1月至2021年6月期间新诊断为DLBCL;(3)接受至少一个周期的R-CHOP或类似药物治疗;(4) 存在所有临床/实验室变量来计算所有模型中的预后指数。排除原发性中枢神经系统 (CNS) 淋巴瘤患者,同时将全身性疾病伴随 CNS 受累的患者纳入研究。
如果模型变量在 LYFO 中可用,则评价为 DLBCL 患者开发的临床预后模型;共比较了13个临床模型,但未纳入包括β-2微球蛋白 (β2M) 的模型,因为该实验室标志物经常缺乏。
研究结果
在入选期间 LYFO 登记的8644例 DLBCL 患者中,6075例 DLBCL 患者接受了利妥昔单抗为基础的治疗,并被认为是本研究的潜在候选者。5126例符合入选标准并用于最终分析(图1)。
表1总结了基线患者特征。中位年龄为68岁,71.0%大于60岁。男性略占优势 (57.3%),III期和 IV 期疾病患者略占优势 (68.1%)。
预后模型
作者从11项研究中确定了13个临床模型和2个实验室模型。除 IPI 和年龄校正的 IPI(aaIPI) 外,所有模型均为接受利妥昔单抗为基础方案的患者开发。表2总结了每个模型中包含的变量。
表3和表4根据4个风险组 (n=8) 和3个风险组 (n=5) 区分的模型,提供了每个风险组和本队列中患者的计算和分布情况。用于开发当前模型的原始人群的患者数量介于88-2031例,其中样本量最大的为IPI,其次是DLBCL-PI和NCCN-IPI,分别有2031、1803和1650例患者。5个模型是在大于500例患者的人群中开发。3个风险组模型的所有研究患者均少于400例(介于88-365)。
模型中包含的变量
分析模型中最常用的变量是 IPI 变量,包括 Ann Arbor 分期 (9/13)、ECOG PS(9/13)、LDH(9/13)、年龄 (6/13) 和结外部位 (5/13)(表2)。与 IPI 相反,三个模型通过高危定位而非受累部位的绝对数量对结外受累进行分层。此外,有个体模型使用了4个实验室变量(血红蛋白、血小板 [PLT] 计数和淋巴细胞绝对计数 [ALC]),而4个模型使用了白蛋白。此外不同研究使用了年龄、LDH、血红蛋白、PLT、ALC和白蛋白的不同临界值(表2)。
变量通常为二分性,而年龄和 LDH 在NCCN-IPI、改良 NCCN-IPI 和 Kyoto 预后指数 (KPI) 中分为多组。
模型一致性
根据本分析中使用的预后模型,将所有患者归类为不同风险组。原始模型和当前研究中根据风险类别列出的患者分布见表3和表4。
本研究患者中,IPI 将26.2%的患者分为低危组,而21.3%为高危组;aaIPI、R-IPI和 NCCN-IPI 低危组为19.8、6.4%、8.1%,高危组为19.4%、49.1%和13.9%。
当使用 IPI 作为参考模型并与其他具有4个风险组的模型进行比较时,显示出与aaIPI(加权κ=0.76)、NCCN-IPI、改良NCCN-IPI、DLBCL-PI和年龄校正 DLBCL-PI(aaDLBCL-PI) 的实质性一致性(加权κ介于0.61-0.80)。当使用 NCCN-IPI 作为参考模型时,其与 IPI 和改良 NCCN-IPI 显示出实质性一致性。NCCN-IPI vs. KPI(加权κ=0.35)和改良的3因素模型(加权κ = 0.37)之间一致性一般(加权κ介于0.21-0.40)的不同分组患者数量最多。当将具有三个风险类别的模型与 R-IPI 作为参考模型进行比较时,它们显示出较差(加权κ<0.00)至轻微的一致性(加权κ=0-0.20),只有 ALC/R-IPI 显示出与 R-IPI 稍好的一致性(加权κ=0.24)。
生存
总生存期(OS):研究人群的中位随访时间为58.2个月,最长随访时间为244.7个月。死亡2190例 (42.7%)。整个研究人群的中位生存期为135.1个月。
每个模型纳入参数的单变量分析均显示,评价的预后模型中所有纳入变量具有预后意义。由于部分模型使用了实验室变量(例如血红蛋白、PLT、ALC、白蛋白),部分模型中包含相同变量的不同临界值,作者比较了不同临界值下实验室生物标志物的风险比 (HR)。然后在多变量分析中应用产生最高 HR 的临界值。在多因素分析中进一步将5个 IPI/NCCN-IPI 变量与4个实验室变量(血红蛋白<120 g/L、PLT<100 ×109/L、ALC<0.84 × 109/L、白蛋白<35g/L)合并,结果未观察到多变量分析中纳入的模型之间存在显著相关性(共线性)。在 IPI 参数的多变量分析中,仅结外部位的数量不显著,而当将5个 NCCN-IPI 参数与4个实验室变量相结合时,所有参数均保留预后意义,结外部位具有边际显著性。
图2为所有13个模型的Kaplan–Meier曲线。此外作者计算了所有模型的3年和5年 OS 率,如表3和4所示。改良NCCN-IPI、NCCN-IPI和 DLBCL-PI 各自高危组的5年 OS 估计值分别为31.7%、33.4%和38.5%,IPI和 R-IPI 组分别为43.6%和53.9%。在各自的低危组中,DLBCL-PI、改良 NCCN-IPI 和 NCCN-IPI 的5年 OS 分别为89.5%、92.8%和97.1%,而 IPI 的5年 OS 估计值较低(85.8%),但 R-IPI 较高(97.5%)。
中位 PFS 为129.5个月,最大 PFS 为244.7个月。Kaplan–Meier和校准曲线与 OS 相似。
模型拟合、辨别和校准度:
赤池信息量准则 (Akaike Information Criterion,AIC,是拟合/模型质量的一种指标,AIC越小模型越好)方面,NCCN-IPI(34002)、改良NCCN-IPI(34039) 和 DLBCL-PI(34100) 的AIC最低,aaIPI(34748) 以及实验室模型AIC最高(表5),IPI和 R-IPI 的 AIC 值居中 (34340,34380)。贝叶斯信息准则(Bayesian Information Criterion,BIC)具有与 AIC 相似的结果(表5)。
一致性概率估计 (Concordance probability estimate,CPE)值方面,NCCN-IPI(0.670)、改良NCCN-IPI(0.664) 和DLBCL-PI(0.660) 最高,Matsumoto模型 (0.580)、aaIPI(0.585) 和两种实验室模型 (0.577,0.584) 的 CPE 最低(表5)。
c 指数最高的模型为DLBCL-PI、NCCN-IPI和改良NCCN-IPI,分别为0.700、0.693和0.684。当将这些模型与作为参考模型的 NCCN-IPI 进行比较时,NCCN-IPI和 DLBCL-PI 之间无统计学差异,但 NCCN-IPI 在统计学上比改良 NCCN-IPI 具有更好的鉴别能力。此外,NCCN-IPI的性能显著优于 IPI 和R-IPI,后者c 指数分别为0.673和0.643。其他具有3个风险组的模型在判别能力方面明显劣于NCCN-IPI,其 c 指数低于 R-IPI(图3)。
此外,当计算 AUC 时,DLBCL-PI、NCCN-IPI和改良 NCCN-IPI 最高(分别为0.661、0.657和0.651)。而3个风险组模型和 aaIPI 中AUC 值最低。
5年生存率的校准曲线见图3。c指数最高的模型校准曲线接近45度线,表明校准度良好。
总结
本研究的目的是验证和比较不同的 IPI 样模型,以确定新诊断DLBCL 患者中具有最高生存预测准确性的模型。共纳入5126例接受免疫化疗的 DLBCL 患者,这些患者具有13种不同预后模型所需的可用数据。结果所有模型都可以预测生存率,但 NCCN-IPI 始终提供高水平的准确性;且高危组的5年总生存率 (33.4%) 与 NCCN-IPI 的原始验证研究相似。此外,包含白蛋白的模型中仅一个表现相似,但在区分度方面未优于NCCN-IPI(c指数0.693)。仅有3个风险组且无年龄作为危险因素的模型在拟合、辨别和校准方面不佳。
基于这项比较13个预后模型的大型回顾性登记研究,显示 NCCN-IPI 和 DLBCL-PI 的模型质量和鉴别能力优于其他模型,而 aaIPI 表现不佳,应慎用。由于临床特征对预后的显著累加效应,应批判性分析具有当前可用标志物的基于实验室的模型。该分析支持NCCN-IPI,建议在开发 DLBCL 模型时将该模型及IPI作为参考模型,作者也建议在新诊断的 DLBCL 患者中将NCCN-IPI作为参考模型与IPI一起报告,直至获得更准确的、经验证的 DLBCL 预后模型。未来的发展和对疾病病理学的更好理解,将有望使用广泛的数据创建基于预后重要的临床、分子和遗传因素的模型,以促进治疗决策。
参考文献
Jelicic J,et al. Prognostic indices in diffuse large B-cell lymphoma: a population-based comparison and validation study of multiple models.Blood Cancer J . 2023 Oct 13;13(1):157. doi: 10.1038/s41408-023-00930-7.