- 统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
- (美)布鲁斯·拉特纳
- 268字
- 2021-09-26 16:15:43
6.6 本章小结
我介绍了一种新的统计数据挖掘方法——SRD法,并将其加入好的建模做法的简单性和可取性范式之中。这个方法用到了两个基本统计工具,对称化和排序变量,使得重新表述的变量获得了更好的预测能力。首先,我详细罗列了斯蒂文的量度范围,为新的对称化重述变量提供了一个概念框架。然后,我在一个近似区间量度上定义了新的SRD变量,并简短回顾了最简单的EDA方法——茎叶图和箱线图,这两者对于讨论SRD方法都是必不可少的。最后我给出了这种新方法的两个例子,表明对称化处理后的变量确实比原来的变量具有更好的预测能力。我认为这两个例子可以作为建模工作者应用SRD的起步点。