全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
7577 10
2010-06-27
悬赏 1 个论坛币 未解决
各位大侠,请教:

原来有一组数据,比如
A
129
130
131
134
正常用means计算标准差,比如是1;

有一个加权的变量,对应如
A         B
129     5
130     15
131     16
134      7
用means加上weight做SD,结果变大了,比如为3;

理论上,应该数据越多SD应该相对变小,为什么SD反而变大了三倍了。是不是算错了,有什么其他的方法可以计算这种加权后的标准差吗,理想的SD加权后应该不变或变小一点啊。谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-6-27 16:56:36
data crackman;
input a b @;
cards;
129      5
130     15
131     16
134      7
;
run;
proc means data=crackman;
var a ;
/*
weight b;
*/
run;

标准差是描述数据之间的变异程度的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-27 22:23:43
rogerfoxzhang 发表于 2010-6-27 16:24
各位大侠,请教:

原来有一组数据,比如
A
129
130
131
134
正常用means计算标准差,比如是1;

有一个加权的变量,对应如
A         B
129     5
130     15
131     16
134      7
用means加上weight做SD,结果变大了,比如为3;

理论上,应该数据越多SD应该相对变小,为什么SD反而变大了三倍了。是不是算错了,有什么其他的方法可以计算这种加权后的标准差吗,理想的SD加权后应该不变或变小一点啊。谢谢!
"理论上,应该数据越多SD应该相对变小,为什么SD反而变大了三倍了". ---Put the weighting aside,  this is talking about the variance of mean estimator, NOT about the variance of the random variable. Your understanding is wrong.



data t1;
  do i =1 to 100;
     x=normal(123);
     g=1;
     output;
  end;
do i =1 to 10000;
     x=normal(123);
     g=2;
     output;
  end;
  run;

  proc means data=t1;
  class g;
  var x;
  run;




                                        The MEANS Procedure

                                       Analysis Variable : x

              g    N Obs        N            Mean         Std Dev
   ------------------------------------------------------------------
              1      100      100      -0.0930159       0.9626726

              2    10000    10000      -0.0211541       1.0004539
   ------------------------------------------------------------------
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-28 05:55:45
我用的就是一楼的方法,但是事实是加权了变量之后,SD变大了3倍,并且与文献报道的也大了3倍。而如果不考虑加权,则与文献报道相同。我在想是不是加权后的SD还要再除以某个变量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-28 09:54:56
说明你理论本身就没有学好
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-6-28 13:11:24
怎么可能变大啊,晕了,不赋予权重时,每个变量离均值的差异程度前面的系数是1,而当赋予权重时,这个系数是小于1的啊!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群