- Python大数据分析算法与实例
- 邓立国
- 170字
- 2022-07-27 19:35:00
2.4 数据主成分分析
在实际问题中,我们经常会遇到研究多个变量的问题,而且在多数情况下,多个变量之间常常存在一定的相关性。由于变量个数较多,再加上变量之间的相关性,势必增加了分析问题的复杂性。如何把多个变量综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息,又互不相关,并且在新的综合变量的基础上可以进一步统计分析,就需要进行主成分分析。
在实际问题中,我们经常会遇到研究多个变量的问题,而且在多数情况下,多个变量之间常常存在一定的相关性。由于变量个数较多,再加上变量之间的相关性,势必增加了分析问题的复杂性。如何把多个变量综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息,又互不相关,并且在新的综合变量的基础上可以进一步统计分析,就需要进行主成分分析。