请教各位,现在我想尝试一个实例数据
数据分析,数据是因果领域很出名的lalonde(DW-PSID)数据集,treat变量有185个取值1,另外2490个取值0。以treat变量为因变量对数据集中的10个协变量做logistic回归,会出现警告信息,代码和警告信息如下:
library(qte)
rm(list = ls())
data(lalonde)
myglm <- glm(treat~age+education+black+hispanic+ married+nodegree+re74+ re75+ u74+ u75, data = lalonde.psid, family = binomial("logit"))
##Warning message:
glm.fit:拟合機率算出来是数值零或一
请问这种logistic回归的警告如何消除? 看了一下博客和论坛里的logistic回归相关说明,有些人说是因为数据过于不平衡,treat取值中0太多,1太少导致,但是我看使用这个数据集的相关参考文献中他们就是对这种不平衡数据做了Logistic回归,为什么他们没有出现这种问题? (我后来也试了类似于bayesglm这种修正的logistic回归函数,警告信息依然存在)
因为后续的方法需要用到倾向得分的估计,也就是这个logitic回归的拟合值,因此需要一个合适的求解方法,求大佬解惑,十分感谢!