全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4026 3
2012-11-01
请问各位高手。就是在logistic回归分析中将全部的哑变量全部放入回归模型中药去掉常数项,否则线性相关,请问为什么啊,请问有什么理论依据呢 有资料吗 ?  我没查到资料有点困惑,谢谢各位了啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-11-1 23:59:51
1 从模型参数解释来说明

首先明白logistic回归模型(logit(p)=ln(p/(1-p))=alpha+beta1*x1+beta2*x2)中alpha(常数项)及beta的专业意义
alpha表示x1,x2取值为0时(本底或者参照)某事件Y(比如中奖、患病)发生的概率
beta1(假设x1是0-1变量)表示x1=1时Y发生的概率与x1=0时Y发生概率的比值(OR1=exp(beta1))
beta2的解释与beta1类似

考虑哑变量的情况
比如血型对是否患某病的影响
血型是名义变量有4种取值(A,B,O,AB)
哑变量取值形式
A   1 0 0 0
B   0 1 0 0
O   0 0 1 0
AB  0 0 0 1

则logistic回归模型为
logit(p)=b1A+b2B+b3O+b4AB
b1的意义是某研究对象血型为A时患某病的概率(与beta1的意义不同)
b2-b4的解释与b1类同

logistic回归最终是想要的是OR值而不是患某病的概率
无常数项的logistic回归模型得不到OR值
所以模型要有一个参照(比如以O型为参照)才能得到OR值
实际数据分析时
当有哑变量纳入模型时
可能含有常数项的logistic回归模型比较常用(可以得到OR值)

有关模型中参数的详细解释可以参考
张家放  医用多元统计方法  2002

***********************;
言归正传

2   
为什么常数项与全哑变量是线性相关
这个可以看线性代数中线性相关的内容
我也不能给出通俗的解释
也希望达人能得到比较易懂的解释




***********************************;

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-11-3 11:12:33
Any regression text book will have explanation for it.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-11-5 08:57:41
bobguy 发表于 2012-11-3 11:12
Any regression text book will have explanation for it.
谢谢bobguy.

是想:
如何将线数中的线性相关与线性回归中的共线性结合在一起通俗的解释
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群