以下的编程需要一些基本的统计知识,如ANOVA, GLM. 征求这个分析的统计方法为先,code在其后,谢谢大家了!
/*以下数据集含病人的家庭背景信息,血压,服药情况和是否是健康俱乐部会员,变量有:id(20人), gender, birth_year,race, membership(健康俱乐部会员),bp(血压值), 病人有否服药(Y/N)drug_date: 开始用药的时间; drug_type: IN/MET/TBE三种药(没服药的缺失)*/ 
data trial1;
input id gender $ birth_year race $ member $ bp drug $ drug_year drug_type $;
cards;
1 M 1985 Asian Y 134 Y 3.5 IN
2 F 1984 White N 125 N 0 .
3 F 1963 Black N 143 Y 2.1 MET
4 M 1972 White N 153 Y 2.2 TBE
5 F 1989 Asian Y 132 Y 3.6 IN
7 M 1978 Asian Y 135 N 0 .
8 F 1958 White Y 142 N 0 .
9 M 1968 Black Y 135 Y 3.8 MET
10 M 1978 White N 136 Y 4.2 IN
11 F 1989 Asian Y 138 Y 2.4 TBE
12 M 1986 Black N 143 N 0 .
13 F 1987 Asian Y 132 N 0 .
14 F 1976 White N 158 Y 2.1 IN
15 M 1969 Black N 145 Y 3 TBE
16 M 1980 Asian N 152 Y 2 MET
17 F 1985 Black Y 134 N 0 . 
18 M 1970 White Y 125 N 0 . 
19 F 1975 Asian N 135 Y 1.5 IN
20 M 1973 Black N 142 Y 2.9 MET
;
run;
1. 如何分别比较是否加入健康俱乐部(member),是否服药(drug), 服药种类(drug_type) ,用药时长(drug_time), 这四个因素有没有带来病人血压值bp上的差异?(用ANOVA怎么样? 求code)
2. 看看其他因素,比如性别,种族,年龄,有没有和问题2中变量一起带来病人血压值bp上的差异? (是不是需要用proc glm,求code)
征求这两个分析的意见为先,如果有高手,就教教我怎么把sas code也同步实现了?