首先,我不用R,所以最后一道题帮不了你,但三个模型我可以给你。
a. Y=β0+β1D1+∑βiXi+残差
Y工资,D1“吸食大麻多过5次”的虚拟变量,是=1,否=0。Xi为其它的控制变量。
b. Y=β0+βiX1+β2X1D1+∑βiXi+残差
Y工资,X1吸食大麻次数,D1性别虚拟变量,男=1,女=0,Xi为其他的控制变量。
c. Y=β0+β1D1+β2D2+β3D3+∑βiXi+残差
Y工资,D1重度吸食虚拟变量,是=1,否=0,D2中度吸食虚拟变量,是=1,否=0,D3轻度吸食虚拟变量,是=1,否=0。Xi为其它的控制变量。
d. 两个假设:
H0,食用大麻组的工资均值与不食用大麻组的均值相同。
H1,食用大麻组的工资均值与不食用大麻组的均值不同。
H2,食用大麻组的工资均值比不食用大麻组的均值低。
一般用H0和H1,双尾t检验。
如果你先验判断大麻对工资的影响是负的,那么可以用H0和H2,并最终做一组单尾t检验。