夏目贵志 发表于 2015-10-17 22:43 
你得知道写程序的人他想通过这个程序干什么。然后根据这个目的自己算出相当于e(df_r)的值。
嗯,是这样:
目标是看一个遗传位点SNP与结局变量group(1=有病,0=没病)之间的关系.
已知exposure是暴露因素,SNP与exposure强相关。
本来是做2sls回归的,但是因变量是二分类变量,因此用ivregress 做不了,所以单独自己来算。先算第一阶段回归的预测值,再用预测值来进行第二阶段的logistic回归。
但是这样得到的标准误差有偏差,也就是估计的sd,因此有人建议用上面的程序进行调整这个sd。
请问这样清楚了吗?
请牛人帮忙解答下。