主成分分析是一种降维方法,将用于说明同一个问题的多个变量减少为几个代理变量。
这就有个问题了。
比如,用于说明农业可持续发展这一问题,可以有好多变量。人均耕地面积、单位面积化肥量、单位面积产出、等等好多变量都可以说明农业的发展情况,并且这些变量有一个特点,就是数值越大,表明农业发展情况越好。说明农业发展问题的还有一个变量:自然灾害面积,自然灾害面积当然是越小越好。
这就有问题了,其他的变量都是越大越好,而自然灾害面积是越小越好。
在选择原始变量时,是不是要考虑原始变量的变化方向?不一致的话,能否用于主成分分析呢?