全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
2010-7-24 11:41:31
7# kiddy_q


存在多个变量的情况下,应该做偏相关检验
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 11:44:24
P值是能拒接原假设的最小显著性水平。性关系系数是表明两个变量的性关系程度的。
10# kiddy_q
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:17:43
菜鸟说一句,错了请各位大虾批评。比如变量为:y, x1, x2。
相关系数的公式计算y和x1的关系,其中根本不涉及x2的数据;可是回归计算中的系数计算却会涉及到x2的数据,因而两者存在显著差别。
假如y和x1,x2分别正相关,那么做回归计算x1系数的时候,x2会来分润和稀释这个相关性,导致回归中x1的系数不如单独计算的相关系数醒目。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:19:05
至于样本数量,在不引起总体变化的情况下,样本越大就越接近总体,可靠性越好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:26:03
用你的数据搞了一下,建议结果如下:

Source        SS        df       MS                Number of obs        =      16
                                F(  4,    11)        =   17.18
Model        .024766576        4  .006191644                Prob > F        =  0.0001
Residual        .003963868        11  .000360352                R-squared        =  0.8620
                                Adj R-squared        =  0.8119
Total        .028730443        15  .001915363                Root MSE        =  .01898

                                       
item1        Coef.        Std. Err.      t        P>t        [95% Conf.        Interval]
                                       
na        -.4540557        .2103215    -2.16        0.054        -.9169702        .0088588
item4        -.0433938        .016853    -2.57        0.026        -.080487        -.0063005
item5        .0023748        .0006626     3.58        0.004        .0009163        .0038333
item6        .3832896        .1182281     3.24        0.008        .1230714        .6435079
_cons        .4724177        .108321     4.36        0.001        .2340048        .7108305
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:27:01
如果2、3不是你的核心变量,那么把他们都去掉,效果还不错。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:32:23
如果你很想要2,结果如下:

Source        SS        df       MS                Number of obs        =      16
                                F(  3,    12)        =   16.99
Model        .023254134        3  .007751378                Prob > F        =  0.0001
Residual        .00547631        12  .000456359                R-squared        =  0.8094
                                Adj R-squared        =  0.7617
Total        .028730443        15  .001915363                Root MSE        =  .02136

                                       
item1        Coef.        Std. Err.      t        P>t        [95% Conf.        Interval]
                                       
na        -.6696417        .2063741    -3.24        0.007        -1.119292        -.2199911
item2        .1080853        .0358902     3.01        0.011        .0298873        .1862832
item4        -.0390382        .0186031    -2.10        0.058        -.0795709        .0014944
_cons        .7815594        .0404899    19.30        0.000        .6933395        .8697793
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:34:33
如果你很想要3,结果如下:
      Source |       SS       df       MS              Number of obs =      16
-------------+------------------------------           F(  3,    12) =   15.60
       Model |  .022866596     3  .007622199           Prob > F      =  0.0002
    Residual |  .005863847    12  .000488654           R-squared     =  0.7959
-------------+------------------------------           Adj R-squared =  0.7449
       Total |  .028730443    15  .001915363           Root MSE      =  .02211

------------------------------------------------------------------------------
       item1 |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
       item3 |  -.6708899   .2158867    -3.11   0.009    -1.141267   -.2005132
       item5 |   .0019341   .0007952     2.43   0.032     .0002014    .0036668
       item6 |   .3468903    .124147     2.79   0.016     .0763973    .6173833
       _cons |   .4087064   .1045654     3.91   0.002     .1808779    .6365349
------------------------------------------------------------------------------
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:46:24
要先剔除不显著的变量再看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 12:55:40
路过学习,谢谢各位大虾!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 15:51:28
譬如在春天的时候,花儿开了,动物也发情了。你要是做相关分析,你会发现,动物发情和花儿开了有很强的相关系数;但是你要是以“动物发情”为因变量,“春天来了”和“花儿开了”作自变量的回归分析,你会发现花儿开了的回归系数并不显著,为什么呢?因为在排除了“春天来了”的因素之后,动物发情和花儿开了本身并没有什么联系。
总之,回归系数就是度量在排除了其他因素之后的变量之间的关系。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 16:03:30
学习了!。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 19:25:59
一起做回归,变量之间互相影响,自然会是这样的,建议你做回归时选择逐步回归法
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 20:13:22
并不是都能做回归的,你的应该是多元线性回归,要考虑变量的可行性,也就是变量的实际经济意义,其次回归之间应该考虑变量之间是否存在多重共线性和异方差等等,不能只看变量之间的相关性,这只是一个初步的判断,具体的回归模型的建立,还要需要计量方法,再次和数据也有关系,数据有没有进行处理和真实性等等。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 21:18:46
第一:可能存在多共线性
第二:样本太少

建议:1。增加样本 2.做model selection可以尽量避免多共线性(当然,如果你是纯粹做predictive model 存在共线性没有问题)3.考虑用其他方法去分析数据(估计楼主是搞工程之类的吧,这样的数据这样的搞法已经见怪不怪了,经典的一个不懂统计分析的在搞统计分析)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 22:06:22
p<0.05 说明自变量对因变量的影响是显著的,而相关性的大小是与1比较的,相关系数越接近1,则说明正的相关性越强,相关系数越接近-1,则说明负的相关性越强。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 22:17:02
你的问题是什么啊?就是要分析这些数据做什么用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 22:18:19
感觉问题不是数据多少的问题,而是分析数据的思路有点乱。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-24 23:45:02
太深了,不懂,我是专科而已。。。。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-25 12:27:25
41# yangnay 虽然这个比喻有点寒。。。不过还是挺能说明问题的好像,有点明白了,哈哈
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-25 12:40:09
46# 如此执著
是这样,平时工作说要运用数据分析的方法去寻找原因,用得最多的就是回归分析和相关性分析,但是部门里没人是学统计的,也都没这个经验,做好分析也就是单纯看看p值和r值,也不考虑其他很多因素的,所以总觉得有很多不规范的东西和不正确的结论。 我想问下,r值看相关性的话,我知道是看它的绝对值有多接近于1,但是用什么界限去衡量相关不相关呢?界定很模糊的感觉啊。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-25 12:41:32
44# yuu851
真希望有人带带我啊。。。。单位里没人会,5555,俺都自学的。。。学得半调子。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-25 12:53:38
45# Isscaliu
你说的没错 ,我不是学这个的,单位里也没人学这个,单位里到处宣传着要用数据分析来帮助解决问题,控制流程,但是其实都是只知道些皮毛,然后忽悠其他也不懂得人的, 现在俺是质量部门的,不专业一下不行啊。。。一点点学了。 杯具的是,平时工作都没带,都没人指导,自己整了半天,也不知道对的错的。。。总觉得这样下去害了自己啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-7-25 13:18:25
48# 如此执著
55555,从来没被那么批评过。。。惭愧死了,想再去高考了。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群