全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
75074 24
2014-06-29
数据源:

  

公司

  

销售净利率

  

(X1)

资产净利率

  

(X2)

净资产收益率

  

(X3)

销售毛利率

  

(X4)

歌华有线

  

五粮液  

  

用友软件

  

太太药业

  

浙江阳光

  

烟台万华

  

方正科技

  

红河光明

  

贵州茅台

  

中铁二局

  

红星发展

  

伊利股份

  

青岛海尔

  

湖北宜化

  

雅戈尔  

  

福建南纸

43.31

  

17.11

  

21.11

  

29.55

  

11.00

  

17.63

  

2.73

  

29.11

  

20.29

  

3.99

  

22.65

  

4.43

  

5.40

  

7.06

  

19.82

  

7.26

7.39

  

12.13

  

6.03

  

8.62

  

8.41

  

13.86

  

4.22

  

5.44

  

9.48

  

4.64

  

11.13

  

7.30

  

8.90

  

2.79

  

10.53

  

2.99

8.73

  

17.29

  

7.00

  

10.13

  

11.83

  

15.41

  

17.16

  

6.09

  

12.97

  

9.35

  

14.3

  

14.36

  

12.53

  

5.24

  

18.55

  

6.99

54.89

  

44.25

  

89.37

  

73

  

25.22

  

36.44

  

9.96

  

56.26

  

82.23

  

13.04

  

50.51

  

29.04

  

65.5

  

19.79

  

42.04

  

22.72




数据标准化处理后,进行主成分分析,得到一系列表


                        解释的总方差

                初始特征值                        提取平方和载入

成份        合计        方差的 %        累积 %        合计        方差的 %        累积 %

1        1.897        47.429        47.429        1.897        47.429        47.429

2        1.550        38.740        86.169        1.550        38.740        86.169

3        .393        9.826        95.995                       

4        .160        4.005        100.000                       

提取方法:主成份分析。


提取出两个主成分f1,f2,主成分载荷矩阵如下:

        成份矩阵(a)

        成份

        1        2

Zscore(x1)        .731        -.513

Zscore(x2)        .818        .503

Zscore(x3)        .359        .897

Zscore(x4)        .752        -.477

提取方法 :主成份。

a. 已提取了 2 个成份。


将主成分载荷矩阵每列(以第一列为例)的系数

0.730886

0.817845

0.359033

0.751797

除以其相应的特征根(1.89716914093361)的开根(1.37737763192728)后得到主成分系数向量:

0.530636

0.59377

0.260664

0.545818

则f1=0.530636*zx1+0.59377*zx2+0.260664*zx3+0.545818*zx4,带入第一个标准化后的数据(以歌华有线为例),计算得1.23183373990056,即主成分f1的值。

问题:这样计算有问题么?我在google,检索:“利用spss主成分分析 filetype:doc”,下载名为“主成分分析与因子分析详细的异同和SPSS软件”的文章,上文采用的数据即来自该文章。

按照该文章计算,f1(歌华有线)=

1.23,和我计算的也是一样的。

但是,问题:

spss在数据源窗口中按照主成分分析后,会自动计算FACT1_1,其f1(歌华有线)=0

.89433210502036。和我计算得不一样。请教大家,怎么回事儿?SPSS自动计算得到的FACT1_1,是按照什么公式(步骤)计算的呢?


另外,我计算主成分分析,得到低维的变量,以方便在后面作为BP神经网络的输入端(减少输入),训练模型后用于预测。那么再请教一下,训练好之后,我用一个元组的变量来预测。按照之前的步骤,首先要进行标准化,然后按照主成分得分公式,计算得到f1,f2...的值,带入模型,就可以预测出应变量的值了。

但是,问题:

我这样总体分析思路对么?如果对,如何才能将一个元组里的多个变量值,标准化?




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-6-30 17:39:44
你的问题,有点看不懂
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-30 18:46:40
陈博容 发表于 2014-6-30 17:39
你的问题,有点看不懂
看来是我表述的问题了....不过现在已经解决了一个问题,spss自动计算出来的FACT1_1,是因子得分,和主成分得分是完全不一样的概念。我之前一直以为数据窗口计算出来的就是主成分得分。谢谢啦~~
不过,现在还有一个问题没解决:
假设我有2000组数据(时间单位:天),每组数据共有30个变量指标,和1个黄金价格变量。我想用pca+bp神经网络用来衡量每天黄金价格。因为变量指标数目太多,所以我先用pca降维,假设降成了5个主成分,那么根据2000组的5个主成分得分,以及相应的黄金价格,能训练出模型了。
然后我用一组预测数据(假设为今天的这30个变量指标的现实数据)去预测今天的黄金价格,依旧还是要首先把这30个变量指标标准化,按照主成分得分的计算,化成5个主成分。
但是,只有一组数据貌似是没法标准化的吧?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-30 21:57:59
谢谢大家的关注哈~~现在有点儿想明白了。把训练数据、预测数据放在一起进行标准化就可以了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-7-1 11:15:03
因子分析有很多方法,目前流行的是用主成分分析方法进行因子分析。因子分析是一种技术,主成分是一种计算方法~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-28 14:58:40
陈博容 发表于 2014-7-1 11:15
因子分析有很多方法,目前流行的是用主成分分析方法进行因子分析。因子分析是一种技术,主成分是一种计算方 ...
学习中,每次回帖、谢谢!辛苦了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群