全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 经管代码库
17344 18
2015-04-07
    申明:本帖转自SPSS版块:https://bbs.pinggu.org/thread-3131314-1-1.html,谢谢bakoll的汇总及其它坛友的贡献。

全国30个省市的8项经济指标如下:


要求:先对数据做标准化处理,然后基于标准化数据进行以下操作(坛主备注:其实做因子分析/主成分分析事先可以不用对原始变量进行标准化,SPSS软件会自动标准化)。

1、给出原始变量的相关系数矩阵;

2、用主成分法求公因子,公因子的提取按照默认提取(即特征值大于1),给出公因子的方差贡献度表;

3、给出共同度表,并进行解释;

4、给出因子载荷矩阵,据之分析提取的公因子的实际意义。如果不好解释,请用因子旋转(采用正交旋转中最大方差法)给出旋转后的因子载荷矩阵,然后分析旋转之后的公因子,要求给各个公因子赋予实际含义;

5、先利用提取的每个公因子分别对各省市进行排名并作简单分析。最后构造一个综合因子,计算各省市的综合因子的分值,并进行排序并作简单分析。


     

1、输入数据,依次点选分析——描述统计——描述,将变量x1x8选入右边变量下面,点选“将标准化得分另存为变量”,点确定即可的标准化的数据。依次点选分析——降维——因子分析,打开因子分析窗口,将标准化的8个变量选入右边变量下面,点选描述à相关矩阵下选中系数及KMOBartlett的检验,点继续,确定,就可得出8个变量的相关系数矩阵如下图。


由表中数据可以看出大部分数据的绝对值都在0.3以上,说明变量间有较强的相关性。


由上图看出,sig.值为0,所以拒绝相关系数为0(变量相互独立)的原假设,即说明变量间存在相关性。

2、依次点选在因子分析窗口点选抽取——方法:主成分;分析:相关性矩阵;输出:未旋转的因子解,碎石图;抽取:基于特征值(特征值大于1);继续,确定,输出结果如下3个图。


      上表中第一列为特征值(主成分的方差),第二列为各个主成分的贡献率,第三列为累积贡献率,由上表看出前3个主成分的累计贡献率就达到了89.599%>85%,所以选取主成分个数为3。选y1为第一主成分,y2为第二主成分,y3为第三主成分。且这三个主成分的方差和占全部方差的89.599%,即基本上保留了原来指标的信息。这样由原来的8个指标变为了3个指标。


       由上图看出,成分数为3时,特征值的变化曲线趋于平缓,所以由碎石图也可大致确定出主成分个数为3。与按累计贡献率确定的主成分个数是一致的。

3、共同度结果如下:


      上表给出了该次分析从每个原始变量中提取的信息。由上表数据可以看出,主成分包含了各个原始变量的80%以上的信息。

4、在因子分析窗口,旋转——输出:载荷阵。输出结果如下:


       由上表数据第一列表明:第一主成分与各个变量之间的相关性;第二列表明:第二主成分与各个变量之间的相关性;第三列表明:第三主成分与各个变量之间的相关性。可以得出:x1x3x8主要由第一主成分解释,x4x5主要由第二主成分解释,x6主要由第三主成分解释。但是x2是由第一主成分还是第二主成分解释不好确定,x7是由三个主成分中的哪个解释也不好确定。

      下面作因子旋转后的因子载荷阵。

      在因子分析窗口,抽取à输出:旋转的因子解,继续;旋转à方法:最大方差法,继续;确定。输出结果如下2图;


      由上表数据可以得出:x1x3x5x8主要由第一主成分解释,x2x4主要由第二主成分解释,x6x7主要由第三主成分解释。与第一因子关系密切的变量主要是投入(投资:固定资产投资)与产出(产值:国内生产总值、工业总产值)方面的变量,货物周转又是投入产出的中介过程,可以命名为投入产出因子;与第二因子关系密切的都是反映民众生活水平的变量,可以命名为消费能力因子;与第三因子关系密切的是价格指数方面的变量,可以命名为价格指数因子。

     


       由上表可以看出:第二列数据表明,各个主成分的贡献率与旋转前的有变化,但是3个主成分的累积贡献率相同都是89.599%

5、在因子分析窗口,得分à因子得分保存为变量f1f2f3;方法:回归。再按三个主成分降序排列:数据à排序个案:将f1选入排序依据,排列顺序:降序。同理得出按f2f3排序的结果。结果如下;

最后,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的综合得分f。即f=(0.40089*f1+0.277*f2+0.2174*f3)/0.89599,f得分在转换à计算变量中的出。最后再按f得分排序。排序结果如下:


新建 Microsoft Excel 工作表.xls (19 KB)


       有了对各个公因子的合理的解释,结合各个城市在三个公因子的得分和综合得分,就可对各城市的经济发展水平进行评价了。在投入产出因子f1上得分最高的6个城市是山东、江苏、广东、河北、四川。其中山东得分为2.11763,江苏得分为2.03281,高于其他城市,说明山东、江苏的工业的投入产出能力最高,工业发展相对较快,从而推动城市发展;而青海、宁夏、海南、西藏的投入产出能力较差,可能由于地理位置的缘故工业发展相对落后。上海、广东、北京、天津在消费能力因子f2上的得分较高,说明它们的消费能力较高,人们的收入也较高,从而生活质量较好,城市发展较快;而河南、河北得分较低,它们的消费能力较低,从而说明人们的收入也相对较低,生活质量相对差一点,城市发展较慢。云南、贵州、湖北、新疆在价格指数因子f3上的得分较高,说明在这些城市物价相对较高,可能以些非本地产的东西由于运输的不方便,使得这些物价相对较高,而广东、安徽、天津、海南的价格指数较低,说明,在这些城市,交通相对便捷,运输方便,或者本地产的东西较多基本满足需求,使得物价相对较低,但从侧面也可看出这些城市与其他城市的联系可能较少,不利于自己的总和发展,从而也说明了这些城市的发展相对较慢。由综合因子f的分就可综合评价城市的经济发展水平,综合得分的前3名上海、山东、江苏,得分最低的3个城市安徽、宁夏、海南。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-4-20 22:08:53
自己顶一个。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-12 15:12:06
好帖,感谢分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-2 19:26:15
xddlovejiao1314 发表于 2015-4-20 22:08
自己顶一个。
楼主,请问是不是只要在“抽取”中的“方法”选择的是主成分,就是主成分分析法,主成分分析与因子分析有什么区别呢。最近在写论文一直不清楚这个概念,先谢谢了~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-2 19:29:47
Giraffe. 发表于 2015-12-2 19:26
楼主,请问是不是只要在“抽取”中的“方法”选择的是主成分,就是主成分分析法,主成分分析与因子分析有 ...
因子分析(Factor analysis)就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。主成分分析是因子分析的一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-12-2 19:34:45
xddlovejiao1314 发表于 2015-12-2 19:29
因子分析(Factor analysis)就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原 ...
所以我说的是对的吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群