悬赏数据缺失问题怎么计算平均值时候不计入缺失数据的行数?请看附件样本数据。
我打算计算使用proc means 或者 proc sql 都行,但是感觉计算出的结果小于预期很多,可能跟缺失数据的行数有关。 请帮忙指点,金币不是问题。 谢谢。
比如 group_name = A, B, C, D, E 在2021年如果A, C都没有数显示. 那么计算一年的平均数时候,就需要用B,D,E的数除以3而不是5。我是直接把缺失数据部分替换成0,不知道这样会不会影响计算平均数。 要不然得出的平均数小于预期。 如果某一行所有group_name 都是缺失,那么可以算成是0。但凡有一个组不是缺失,最后只计算有数据的组的数在某一年的平均数。
比如:
proc means data=sample_data n nmiss mean nolabels;
class survey_year;
by group_name;
var var1 var2 var3 var4 var5 var 6;
run;
proc sql;
create table sample_summary as
select group_name, survey_year, avg(var1) as avg_var1, avg(var2) as avg_var2, avg(var3) as avg_var3, avg(var4) as avg_var4, avg(var5) as avg_var5, avg(var6) as avg_var6
from sample_data
group by group_name, survey_year
order by 1, 2;
quit;