悠游的快乐 发表于 2015-3-20 16:36 
可以用主成分分析,用31个市某一年的20个经济指标进行分析,找出其中特征值较高的指标,就是对经济影响较大 ...
PCA是不适用的,因为目的很明确:要对中国城市的经济发展状况做分析,目的是找到影响中国经济发展状况的因素(或因素集)。“影响中国经济发展状况”,发展是有强烈时间因素。如果用主成分分析,抹掉年份和省份的区别。举一个最极端的例子,发达的省份和贫困的省份,各自每年的GDP都呈白噪声分布,没有任何的趋势和发展而言,就是随机分布,那么同样,你用PCA也可以得到一个结论,但这结论显然无法满足需求。其二,用PCA做主成分分析或者因子分析,最终得到是描述性的隐变量,而不是一个具体的原始变量,所以,为了解决楼主的问题,强烈建议使用回归而不是PCA。数据挖掘做到极致,是对问题的理解,而不是简单的数据套用算法和方法,大家共勉~~~