全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
8211 3
2007-05-19

请教各位高手:用sas怎么做主成分回归?谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2007-12-18 11:22:00

INSIGHT计算X’X的特征值和特征向量:

进入INSIGHT之后,点击Analyse->Multivariate(YX);

选择x1, x2, x3, 再点击“Y(注意!不是点击“X)

点击Output, 选择“Principal Component Analysis, 点击“Principal Component Options;

选择“Eigenvectors,在左边一列选择中选择“all”然后一路点击“OK”即可获得一些表格,其中有个Eigenvectors(CORR)表:第三列便是对应于最小的特征值的特征向量

 

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2007-12-19 21:26:00

做主成分回归一般分两步进行:

1.对X提取主成分,这个步骤其实就是对X做主成分分析;

2.做回归分析。因变量是y,自变量是从第一步中提取的主成分。

下面用SAS举例说明:


data a;
input y x1-x3;
cards;
8500 0.059 1000 13.27
……………………
6000 -0.045 1000 10.12
;
run;

/*下面对X做主成分,根据实际提取了2个主成分,并把结果存在数据集comp中*/
proc princomp out=comp n=2;
var x1-x3;
run;

/*下面是做回归分析:y=prin1 prin2 ; 可以先用proc print data=comp;run;打印comp来查看其数据结构*/
proc print data=comp;run;
proc reg data=comp;
model y=prin1 prin2;run;


把此例的结果也打印给你了:
                                                        Analysis of Variance

                                                               Sum of           Mean
                           Source                   DF        Squares         Square    F Value    Pr > F

                           Model                     2      590780796      295390398      14.40    <.0001
                           Error                    33      676765991       20508060
                           Corrected Total          35     1267546787


                                        Root MSE           4528.58260    R-Square     0.4661
                                        Dependent Mean     9422.02778    Adj R-Sq     0.4337
                                        Coeff Var            48.06378


                                                        Parameter Estimates

                                                     Parameter       Standard
                                Variable     DF       Estimate          Error    t Value    Pr > |t|

                                Intercept     1     9422.02778      754.76377      12.48      <.0001
                                Prin1         1    -2907.18605      631.20386      -4.61      <.0001
                                Prin2         1     2219.04222      805.24700       2.76      0.0095

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2007-12-26 00:32:00

《实用统计方法与SAS系统》高惠璇  本坛可以下到

P108有例子:

data ghx;
label x1='国内生产总值' x2='存储量' x3='总消费量' y='进口总额';/*单位均为10亿法郎*/
input x1-x3 y;
cards;
149.3 4.2 108.1 15.9
161.2 4.1 114.8 16.4
171.5 3.1 123.2 19.0
175.5 3.1 126.9 19.1
180.8 1.1 132.1 18.8
190.7 2.2 137.7 20.4
202.1 2.1 146.0 22.7
212.4 5.6 154.1 26.5
226.1 5.0 162.3 28.1
231.9 5.1 164.3 27.6
239.0 0.7 167.6 26.3
;
proc reg outest=a;
model y=x1-x3/pcomit=1,2/*删除后面1-2个最不重要的主分量后进行主分量回归*/
outvif;
proc print label noobs;
title '王笑权版权所有,复制者将遭受法律允许的最严厉制裁';
run;

结果看上去复制上来太乱了

简单点

1  方程  y=-9.1301+0.07278x1+0.60922x2+0.10626x3

对应的方差膨胀因子  0.25083   1.00085  0.25038

可见效果非常理想    

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群