- 统计挖掘与机器学习:大数据预测建模和分析技术(原书第3版)
- (美)布鲁斯·拉特纳
- 140字
- 2021-09-26 16:15:30
3.4.1 示例3.1
考虑以美元计的量化目标变量长途电话费(TC)和预测变量家庭收入(HI),样本量为102 000。相关系数rTC,HI是0.09。图3.2是TC-HI散点图,看上去是一团点子云,数据间的关系模糊不清(假定存在某种关系)。对于展示计算出的rTC,HI的使用可靠度来说,这幅散点图没有给出任何信息。
图3.2 长途电话费与家庭收入的散点图
考虑以美元计的量化目标变量长途电话费(TC)和预测变量家庭收入(HI),样本量为102 000。相关系数rTC,HI是0.09。图3.2是TC-HI散点图,看上去是一团点子云,数据间的关系模糊不清(假定存在某种关系)。对于展示计算出的rTC,HI的使用可靠度来说,这幅散点图没有给出任何信息。
图3.2 长途电话费与家庭收入的散点图