全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅
1394 5
2020-03-16
悬赏 100 个论坛币 未解决
为什么要进行数据标准化,有什么依据吗?WGI制度的六个维度进行标准化后可以直接相加构成综合制度指标吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-3-16 22:02:06
1.为什么进行数据标准化:数据标准化主要是因为你在构建一些指标时,由于一级指标或者二级指标的单位不一样,为了排除单位的异质性带来的误差需要进行标准化,比如一些二级指标单位1为100(数据范围为0-100),一些二级指标单位1为7(数据范围为1-7)。数据标准化有不同的方法,常用的为极值标准化法。
2.进行数据标准化有什么用途:比如在做数据实证分析时,你构建的指标由好几个一级指标或者二级指标构成,而采用简单的相加或平均的方法存在误差,这个时候可以对数据采用数据标准化,然后用SPSS软件进行主成分析法确定各个指标的权重,最后根据权重来计算你构建的指标。
3.WGI数据我之前也用过,但是没注意各个二级指标的范围为多少。WGI里包含话语权和问责(Voice and Accountability)、政治稳定性与非暴乱(Political Stability and Absence of Violence/ Terrorism)、政府有效性(Government Effectiveness)、管制质量(Regulatory Quality)、法治程度(Rule of Law)、腐败控制(Control of Corruption)六个指标 ,一般简单的相加是不行的。因为我之前计算的是国家之间的WGI差距,所以不用考虑标准化的问题,用的是方差法。你如果要进行总值,估计也得分析权重再计算。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-3-18 18:10:49
https://www.cnblogs.com/simpleDi/p/9918306.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-3-19 14:49:27
暖爱一生 发表于 2020-3-16 22:02
1.为什么进行数据标准化:数据标准化主要是因为你在构建一些指标时,由于一级指标或者二级指标的单位不一样 ...
我的模型中含有 人口 出口金额 货运量 因为变量单位不同是否需要标准化,如果标准化,是否每个变量都要标准化
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-3-22 09:17:59
标准化分字段、表名、还有数据字典标准化等工作,数据字典转换的如 源系统男女编码有1,2,还有3,4,国标是0,1代表男女,那就要统一根据国标进行标准化。字段,表名,源系统肯定五花八门的命名,数仓必须要有自己的统一规范,比如统一拼用音简称,或者英文。
这些就是数仓的清洗加工,只有进行标准化工作后,上层应用才方便应用数据,不然建数仓、建数据中台,为了什么.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-3-22 09:28:15
huapeizou9 发表于 2020-3-19 14:49
我的模型中含有 人口 出口金额 货运量 因为变量单位不同是否需要标准化,如果标准化,是否每个变量都要标 ...
都需要标准化,这是数据治理必须的步骤。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群