SVN | 华山郁金泰:基于机器学习的模型预测未来10年的心血管疾病风险
时间:2023-05-06 11:25:34 热度:37.1℃ 作者:网络
作为全球死亡的主要原因,心血管疾病(CVD)每年造成超过1730万人死亡,估计到2030年发病率将增加到2360万人。以前的CVD预测算法是利用主要基于临床经验知识检索的风险因素建立的。本研究试图在一个全面的变量空间中确定预测因素,然后采用机器学习(ML)算法来开发一个新的心血管疾病风险预测模型。
本研究从英国生物库的纵向人口队列中,纳入了473611名年龄在37至73岁之间的无心血管疾病参与者。研究人员采用一个基于ML的数据驱动管道,从涵盖全面的健康相关因素的645个候选变量中确定预测因素,并评估了多个ML分类器,以建立一个关于10年发生心血管疾病的风险预测模型。该模型通过离开一个中心的交叉验证得到了验证。
结果在12.2年的中位随访期间,31466名参与者在基线访问后的10年内发生了CVD。建立了一个新的英国生物库心血管疾病风险预测(UKCRP)模型,该模型由10个预测因素组成,包括年龄、性别、胆固醇和血压的药物治疗、胆固醇比率(总/高密度脂蛋白)、收缩压、以前的心绞痛或心脏病、服用药物的数量、胱抑素C、胸痛和吸烟包年数。本研究的模型获得了满意的鉴别性能,接收者操作特征曲线下面积(AUC)为0.762±0.010,超过了现有的多个临床模型,而且它的校准效果很好,Brier评分为0.057±0.006。此外,UKCRP对心肌梗死(AUC 0.774±0.011)和缺血性卒中(AUC 0.730±0.020)可以获得相当的性能,但对出血性卒中(AUC 0.644±0.026)性能较差。
综上,基于ML的分类模型可以从潜在的高危CVD参与者中学习表达性的表征,这些参与者可能从早期的临床决策中受益。
参考文献:
Development of machine learning-based models to predict 10-year risk of cardiovascular disease: a prospective cohort study. Stroke and Vascular Neurology 2023;svn-2023-002332. doi: 10.1136/svn-2023-002332