- 统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
- (美)布鲁斯·拉特纳
- 226字
- 2021-09-26 16:16:05
10.15.3 基于得分组的平滑预测与实际值散点图:EDA模型与非EDA模型对比
我们为非EDA模型制作了基于得分组的EDA(FD2_OPEN、MOS_OPEN),见图10.16。在图上看到点的分布明显没有集中在45°线附近。得分组II,III,V和VI都离这条线很远,这些平滑点的相关系数rsm.actual,sm.predicted:scoregroup是0.635。
图10.16 非EDA(FD2_OPEN、MOS_OPEN)模型的得分组平滑预测与实际值散点图
基于得分组的EDA模型和非EDA模型的相关系数比较表明EDA模型可以让平滑点更紧凑地分布在45°线周围,其相关系数明显大于非EDA模型:大了33.5%(=(0.848-0.635)/0.635),表明这个EDA模型有较好的预测质量。