- 统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
- (美)布鲁斯·拉特纳
- 532字
- 2021-09-26 16:15:56
10.6.1 幂阶梯法
向上幂阶梯法是指通过将幂次提高到p(大于1),以重述一个变量。(记住,一个变量的一次方还是它自己,即X1=X,Y1=Y)。最常见的幂次p是2和3。有时候会用到更高的幂次,或者2~3之间的幂次,比如1.33。具体做法是从p=1起步,逐步提高幂次,得出如下X和Y经过重述的变量:
起步X1:X2,X3,X4,X5,……
起步Y1:Y2,Y3,Y4,Y5,……
一些变量在升幂之后取了特殊的名称,在幂次为2和3时分别称作X平方和X立方,类似地,Y变量也分别称为Y平方和Y立方。
向下幂阶梯法是指通过将幂次下降到p(小于1),以重述一个变量。最常见的幂次p是1/2,0,-1/2,和-1。有时候也会用到更小的幂次或者0~1之间的幂次,比如0.33。对于负的幂次,重述后的变量带有负号(即乘以-1),这样做具有理论意义,但这不在本章的讨论范围内。相应地,从p=1起步,数据挖掘工程师逐步降低幂次,得出X和Y经过重述的变量如下:
起步X1:X1/2,X0,X-1/2,X-1,……
起步Y1:Y1/2,Y0,Y-1/2,Y-1,……
通过降幂重述后的变量有特殊的名称。对于p=1/2,-1/2,和-1,分别称作X平方根、X的负倒数平方根和X倒数。类似地,对于Y变量,分别称作Y平方根、Y的负倒数平方根和Y倒数。对于p=0,采用常用对数[1]。所以,X0=log X,Y0=log Y。
[1] p=0时的重述不是一个数学定义,而是按照习惯方式定义的。