7.4 PCA基础

PCA将p个变量X1,X2,…,Xp转化为p个变量PC1,PC2,…,PCp的线性组合(PC表示主成分),使得原始变量集合的大部分信息被数量更少的新变量表达,而这些新变量之间是互不相关的,即

其中aij是常数,称为PC系数。

注意,为表示的方便起见,所有X假定经过标准化处理。而且,这些PC和aij有很多代数和解释性特征。