全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
3809 10
2019-01-28
如题,我在城市经济竞争力分析,得到两个公因子,第一个是经济总量因子,与因子1 相关系数最大的一些指标都是关于经济的,类似于:地区生产总值,社会消费品零售总额之类的,而安徽省的几个城市几乎和因子1相关的数据几乎都比浙江省的低,但是,最后得分反而是安徽省城市在因子1上面得分高呢,简直匪夷所思。我搜了下,百度知道上也有人提出这个问题,但是没人解答。求助大神们的帮忙,研究生论文的最后阶段了。


为什么做因子分析最终经济因子得分北京很低 5我用SPSS做31个省28个指标的因子得分,用主成分法提取了5个公共因子,然后用最大方差发旋转了因子载荷矩阵,最后得到因子得分中,我的因子一是表示经济,因为与因子1 相关系数最大的一些指标都是关于经济的,类似于:地区生产总值,社会消费品零售总额之类的。但是,最终看因子1 的得分,北京在最后几名,而西藏,宁夏等地的却排在前面。我实在是搞不懂为什么,导师也完全没时间仔细看的我问题是什么原因,所以就向各位统计大神请教,帮帮我把,毕业论文快要答辩了。=。=

PS:我觉得数据没有问题,都是从年鉴上摘下来的,我检查了3遍了,而且和经济因子载荷最大的那几个原始指标中,北京的数据不低啊,但是西藏基本都是倒数第一或第二。是在搞不懂。求两个大神用SAS和matlab都做了一遍,结果是一样的、






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-1-29 09:24:30
由于你具体数据和运行结果没有贴上来,因此无法针对具体结果具体分析,建议上传一下详细过程。另外,感觉你这个因子分析结果可能偏离了实际,你可以先看看Bartlett和KMO值,是不是各变量独立性比较强?适不适合做因子分析?还有要注意一下是不是有反向因子?如果有反向因子,就得改变一下符号了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-29 09:43:18
花间邪派 发表于 2019-1-29 09:24
由于你具体数据和运行结果没有贴上来,因此无法针对具体结果具体分析,建议上传一下详细过程。另外,感觉你 ...
Bartlett和KMO都是符合要求的,可以进行因子分析,也没有反向因子,我也不知道为什么结果会偏离实际,但是上海,杭州,苏州等城市排名就符合实际的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-29 09:52:21
我把过程贴一下吧,
这个是我旋转后因子载荷矩阵:        元件
        1        2
Zscore: 地区生产总值        0.873        0.451
Zscore: 人均生产总值        0.249        0.824
Zscore; 全社会就业人员        0.911        0.289
Zscore: 城镇居民人均可支配收入        0.307        0.919
Zscore: 农村居民人均可支配收入(元)        0.081        0.95
Zscore; 地方财政收入        0.948        0.263
Zscore; 地方财政支出        0.957        0.201
Zscore: 固定资产投资        0.669        0.443
Zscore; 全社会消费品零售总额        0.881        0.45
Zscore; 金融机构年末本外币存款        0.951        0.277
Zscore; 金融机构年末本外币贷款        0.926        0.364
Zscore: 实际使用外资金额        0.929        0.274
Zscore; 进出口总额        0.844        0.367
Zscore; 对外贸易依存度        0.436        0.682
Zscore; 国内旅游总收入        0.782        0.557
Zscore: 第三产业占GDP比重        0.571        0.629
Zscore: 三产就业人数比例        0.695        0.202
Zscore; 专利申请授权量        0.748        0.608
Zscore; 人均教育财政支出        0.586        0.735
擷取方法:主體元件分析。
轉軸方法:具有 Kaiser 正規化的最大變異法。
a. 在 3 疊代中收斂循環。

所以第一个公因子命名为经济总量因子没问题吧。

但是第一个公因子得分就有点奇怪了。
城市        F1        排名        F2        排名        F        排名
杭州市        0.766        2        1.131        4        0.894        3
宁波市        0.117        6        1.108        5        0.465        5
嘉兴市        -0.623        23        0.820        7        -0.116        10
湖州市        -0.777         25        0.527         10        -0.319         20
绍兴市        -0.646         24        0.832         6        -0.127         11
舟山市        -1.098         26        1.264         2        -0.269         16
金华市        -0.498         21        0.497         11        -0.149         12
台州市        -0.401         19        0.275         13        -0.163         13
南京市        0.650         3        0.678         9        0.660         4
无锡市        -0.184         12        1.172         3        0.292         6
常州市        -0.467         20        0.702         8        -0.057         9
苏州市        0.529         5        1.698         1        0.940         2
南通市        -0.035         9        -0.066         15        -0.046         8
盐城市        0.042         7        -0.882         21        -0.282         17
扬州市        -0.286         15        -0.214         16        -0.260         15
镇江市        -0.526         22        0.291         12        -0.239         14
泰州市        -0.287         16        -0.374         17        -0.318         18
上海市        4.396         1        0.097         14        2.886         1
合肥市        0.554         4        -0.659         18        0.128         7
滁州市        -0.052         10        -1.697         26        -0.630         24
马鞍山市        -0.395         18        -0.733         19        -0.514         21
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-29 10:28:04
F1得分计算式是所有标准化变量的线性表达式,也就是说有的系数是正的有的系数是负的,如果某个变量系数是负的,则这个变量取值越大因子得分越低。我觉得这个和你的公因子个数有关系,你的第一个公因子,虽说在经济总量上的载荷很高,但是像三产就业人数比例、专利申请授权量等变量上载荷也很大,所以我觉得你把第一个公因子命名为经济总量因子可能不是特别恰当,因为这个因子应该还包括了其他的东西。建议你试试指定公因子个数,比如3个或4个,你再看看从专业的角度好不好解释?个人建议,仅供参考。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-29 11:17:10
花间邪派 发表于 2019-1-29 10:28
F1得分计算式是所有标准化变量的线性表达式,也就是说有的系数是正的有的系数是负的,如果某个变量系数是负 ...
我懂你意思了,那我这个不知道要如何命名诶,可以指定公因子个数吗?本来SPSS这边的话直接跳出来是2个的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群