1.2.2 预测模型数据来源分类

临床预测模型区别于普通模型的要点之一在于验证,就是将构建的模型代入某数据集进行预测,以评价其表现。根据数据集的不同,预测模型又有如下不同的分型,如图1-10和图1-11所示。

图1-10 预测模型按照数据集分型图解

图1-11 各型预测模型解读

Type1a:仅仅在训练集中构建临床预测模型。大家是否发现,这与我们前面所谓的风险因素发现模型高度相似?

Type1b:在训练集中进行建模,然后利用重抽样的方法,在训练集中抽取样本进行验证。

Type2a:将研究数据集随机拆分为训练集和验证集,然后用训练集建模,用验证集进行验证。

Type2b:将研究数据集进行非随机拆分为训练集和验证集,然后用训练集建模,用验证集进行验证。如在某医院,搜集前2年的数据作为训练集,搜集后1年的数据用于验证。

Type3:用不同的数据集进行建模和验证,如用某医院的数据建模,用另外一家医院的数据进行验证。

Type4:仅进行验证。如别人已经构建了一个临床预测模型并且发表了文章,你用该模型在自家医院进行验证。

另从撰写角度,围绕某个临床主题,预测模型撰写的过程如下:①人无我有,即目前尚无临床预测模型,新建一个用于预测;②人有我优,即别人发表了一个临床预测模型,你可以对该模型进行改良和优化;③人有我验,即对别人发表的预测模型,你可以用自己的数据进行验证;④人多我比,即已经有多个临床预测模型,你可以用自己的数据,对多个模型的表现进行比较。