求高手给出尽量详细的做题思路(回归方程中的空格是希腊字母Beta)
401KSUBS. DTA为美国 1991年收入与项目参与调查( Surveyof Income and Program Participation,SIPP)中的部分数据。其变量主要包含有关净金融资产(nettfa)、家庭收入(inc)是否有资格参与401(K)项目的二值变量(e401k),以及其他一些变量的信息(变量解释详见数据集中的 Label说明)。试回答以下问题1、检验假设平均 nettfa并不会因为是否可以参加 401(K)而有所不同(利用双侧对立假设)。估计的差异金额是多大?2、分别估计以下两个模型:(1)nettfa=0+1inc+2inc^2+3age+4e401k+(2)nettfa=0+1inc+2inc^2+3age+4e401k+5e401k+6e401k(age-41)+7e401k(age-41)+比较两个模型的估计结果,401(K)资格在 41岁处的估计效果与其他年龄段的估计差异是否很大,请解释之3、现在,从模型中去掉交叉项,再加入五个家庭虚拟变量: fsize1、fsize2、fsize3、fsize4、fsize5。如果家庭有五名或以上的成员,则fsize5=1,其他fsize中,i代表家庭中的成员个数。将家庭大小虚拟变量加到模型中以估计第二问的第(1)方程;记得要选择一个基组,在1%的水平下,家庭虚拟变量是否显著?