- 统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
- (美)布鲁斯·拉特纳
- 444字
- 2021-09-26 16:16:08
10.17.2 基于十分位组的平滑预测与实际值散点图:4变量EDA模型与3变量EDA模型对比
4变量模型的基于十分位组平滑预测与实际值散点图见图10.19,可以看到点子聚集在45°线周围,除了有两个异常点。首先,有两对十分位组(6和7,8和9),其中两个十分位组是靠在一起的。这两个相邻的点对表明在每一对里,十分位组的预测是不同的,但它们应该具有一样大的应答率。其次,最下方(bot)的十分位组很靠近这条直线,但是次序不对,而且位置处在这两对之间。由于回应模型在应用时,通常要排除最下方的3~4个十分位组,它们与45°线的距离,以及它们次序不是评估预测质量时要重点考量的要素。
图10.19 4变量(MOS_OPEN、MOS_DUM、CH_FTY_1和CH_FTY_2)EDA模型基于十分位的平滑预测与实际值散点图
所以说,整体上讲,这个散点图是相当不错的,相关系数rsm.actual,sm.predicted:decilegroup是0.989。
对比基于十分位的3变量EDA模型与4变量EDA模型平滑实际值散点图的相关系数,可以看到后一个模型的点更紧密地聚集在45°线周围。4变量EDA模型的相关系数比3变量EDA模型略大1.76%(=(0.989-0.972)/0.972)。所以这两种模型在十分位分组方面具有类似的预测质量。