Diabetologia:利用生物标志物和患者的电子数据推导和验证机器学习风险评分,以预测糖尿病肾病的进展
时间:2021-10-04 23:01:35 热度:37.1℃ 作者:网络
目的:预测糖尿病肾病(DKD)的进展对改善预后至关重要。我们试图验证一种结合电子健康记录(EHR)和生物标志物的机器学习预后风险评分(KidneyIntelX™)。
方法:这是一项观察性队列研究,研究对象是来自两个EHR相关生物库的DKD的患者。训练随机森林模型,将其性能(AUC、阳性和阴性预测值[PPV/NPV]和净重分类指数[NRI])与临床模型和肾病进行比较:改善全球结局(KDIGO)类别预测eGFR下降≥5 ml/min /年、持续下降≥40%或5年内肾衰竭的复合结局。
结果:在1146例患者中,中位年龄为63岁,51%为女性,基线eGFR为54 ml min - 1[1.73 m] - 2,尿白蛋白/肌酐比值(uACR)为6.9 mg/mmol,随访4.3年,21%有复合终点。在衍生交叉验证(n= 686)中,KidneyIntelX的AUC为0.77 (95% CI 0.74, 0.79)。在验证中(n=4 6 0), AUC为0.77 (95% CI 0.76, 0.79)。相比之下,临床模型的衍生AUC为0.62 (95% CI 0.61, 0.63),验证AUC为0.61 (95% CI 0.60, 0.63)。使用衍生临界值,KidneyIntelX将46%、37%和17%的验证队列分别分为低、中、高危组,以确定复合肾脏终点。根据KDIGO分类,高危组肾功能进行性下降的PPV为61%,高危组为40% (p< 0.001)。在使用KidneyIntelX评分为低风险的患者中,只有10%的患者出现进展(即NPV为90%)。高危组的NRIevent为41% (p<0.05) 。
图1 显示相对特征重要性的Shapley加法解释(SHAP)图。SHAP汇总图根据特征的重要性排序。每个图都是由训练数据集的单个点组成的,较高的值为深紫色,较低的值为黄色。如果中线一侧的点更多紫色或黄色,这表明数值分别在增加或减少,使预测朝着那个方向移动。例如,较高的收缩压与复合肾脏结局的高风险相关。
图2 (A) KidneyIntelX预测派生集合中的风险,(B)KidneyIntelX预测验证集合中的风险,以及(C)根据派生和验证集合中复合肾脏终点的风险来预测DKD患者的KidneyIntelX得分分布。(a,b)事件用橙色圆点(进展)表示,代表5年内的复合肾脏终点。无事件用蓝点表示(无进展),表示在随访期内没有复合肾事件。(C)点代表累积发病率:蓝色,低风险10%(6%,14%);粉红色,中度风险22%(16%,28%);红色,高风险61%(50%,71%)
图3 KidneyIntelX的测试特点和综合临床模型
图4 KidneyIntelX风险分层的Kaplan-Meier曲线显示,在衍生(A)和验证(B)集合中,EGFR持续下降40%或肾衰竭的终点。衍生出的用于验证的风险界限为:低风险0.061129-0.061129,中等风险0.061129-0.30209,高风险0.30209-1。在衍生集合中,45%为低风险,40%为中度风险,15%为高风险。在验证组中,46%为低风险,37%为中度风险,17%为高风险。高危与低危的HR在推导时为18.3(95%CI 10.1,33.1),在验证时为14.7(95%CI 7.8,27.6)。高危与中危的HR在推导时为5.7(95%CI 3.7,8.7),在验证时为6.0(95%CI 3.5,10.0)。高风险与低风险和中风险合并的HR在推导时为9.2(95%CI 6.2,13.6),在验证时为9.1(95%CI 5.8,14.4
结论:与KDIGO和临床模型相比,KidneyIntelX改善了早期DKD患者肾脏预后的预测。
原文出处:
Chan L, Nadkarni GN, Fleming F,et al,Derivation and validation of a machine learning risk score using biomarker and electronic patient data to predict progression of diabetic kidney disease.Diabetologia 2021 Jul;64(7)