1.为什么进行数据标准化:数据标准化主要是因为你在构建一些指标时,由于一级指标或者二级指标的单位不一样,为了排除单位的异质性带来的误差需要进行标准化,比如一些二级指标单位1为100(数据范围为0-100),一些二级指标单位1为7(数据范围为1-7)。数据标准化有不同的方法,常用的为极值标准化法。
2.进行数据标准化有什么用途:比如在做数据实证分析时,你构建的指标由好几个一级指标或者二级指标构成,而采用简单的相加或平均的方法存在误差,这个时候可以对数据采用数据标准化,然后用SPSS软件进行主成分析法确定各个指标的权重,最后根据权重来计算你构建的指标。
3.WGI数据我之前也用过,但是没注意各个二级指标的范围为多少。WGI里包含话语权和问责(Voice and Accountability)、政治稳定性与非暴乱(Political Stability and Absence of Violence/ Terrorism)、政府有效性(Government Effectiveness)、管制质量(Regulatory Quality)、法治程度(Rule of Law)、腐败控制(Control of Corruption)六个指标 ,一般简单的相加是不行的。因为我之前计算的是国家之间的WGI差距,所以不用考虑标准化的问题,用的是方差法。你如果要进行总值,估计也得分析权重再计算。