我目前正在分析一套spss横断面数据,应为是不等概率抽样,所以最后根据以前的普查数据 对每一个case 生成了一个 “年龄-性别-城乡” 的权重变量。
我想问的问题是:1如果做整个抽样的样本的logistics 分析,应当加权后再进行logistics ,才能得到对总体参数的正确估计吧?
2如果对抽得的样本的亚组进行分析,比如想在男,女两个亚组中分别进行logistics分析,上面的说的那个“年龄-性别-城乡”权重是不是就用不成了?就要重新计算生成一个“年龄-城乡”权重,然后再进行logistics分析?
3 如果我想对不同年龄组的患病率比较, 那个“年龄-性别-城乡”权重是不是也用不成? 是不是要重新计算一个“性别-城乡”权重?
4对自变量的缺失值除了用均数和中位数填充外,有没有更简单易行的操作?