- 统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
- (美)布鲁斯·拉特纳
- 455字
- 2021-09-26 16:16:08
10.18 本章小结
本章介绍了回应建模的重要方法LRM,我们展示了用这个方法如何完成对二值回应变量的分析,在分析中,我们可以得到各个应答率,并用这些概率计算出十分位上的应答率。这个应答率在回应模型的数据库应用方面有广泛需要。此外,我们展示了有60多年历史的逻辑斯谛回归分析和建模方法的耐用性和实用性,在EDA/数据挖掘领域,它至今都是一个很好的工具。
我们通过用SAS程序构建和评估LRM,展示了LRM的基本方法。通过在一个小型数据集合上的工作,我们指出并最终澄清了实际和预测的反应变量之间经常令人烦恼的关系:前者采用两个名义值,通常是1-0代表是-否,而后者采用logit值,这是一个介于-7和+7的连续数。
之后,我们介绍了一个案例,用于引入一系列数据挖掘技术,包括EDA范式和定制的逻辑斯谛回归建模。这些方法包含重要性这个概念(不是指显著性),以及预测变量、预测变量子集合概念和被广泛使用的平滑散点图。我们通过这个案例讨论了数据引导的EDA模型和非EDA模型的优劣。EDA模型具有更好的预测质量,所以是优选模型。在第44章,我们会提供生成平滑logit值和平滑概率散点图的SAS子程序代码。