[尝试回答一下]
这是数据标准化的问题, 因为每个变量的度量的尺度是不一样的, 如果不进行标准化, 求出来的主成分上的方差就会因为度量单位的大小而受到影响, 那结果可能就会完全失真了, 这样就失去了意义.
标准化之后, 所有的变量都以到均值距离为几个标准差作为衡量, 这样以来, 原来变量的协方差矩阵S就变成了相关矩阵R, 这样以来, 在计算变量的方差, 贡献等所有问题时都不会受度量尺度的影响.
这也就是为什么统计上用马氏距离Mahalobonis Distance代替一般的欧氏距离, 把协方差矩阵的逆乘在中间, 就是为了得到纯粹的标准化了的一元距离,从而得到多元距离.