全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
1885 7
2015-09-26
我现在在做一个project研究alloy composition的实验结果,实验结果是一个binary variable PASS/FAIL。
现在我做了一个logit model,所有factor均是numerical variable。
现在我有一些问题想不明白。应为当任意一个factor为零的时候,possibility of PASS 应该是0,那么这时的log(p/1-p)就趋向于负无穷大,那么intercept就应该是负无穷大的一个值,但是这又是不可能的。
当然所有variable的定义域都是正数,不包括0。从这个角度来说也可以解释为在定义的那一段范围logit model可以使用。
我想请教一下,是否有更好的一些模型可以用来解释这个问题?比如randomforest 或者 SVM,又该如何解释上面我的问题。
谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-9-26 10:45:18
实际估计中被解释变量不是log(p/1-p),而是用的极大似然估计,楼主可以找本计量书看看,一般都在书的最后几章介绍离散选择模型的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-29 03:10:23
statax 发表于 2015-9-26 10:45
实际估计中被解释变量不是log(p/1-p),而是用的极大似然估计,楼主可以找本计量书看看,一般都在书的最后 ...
可以解释的清楚一点的嘛?首先被解释变量你说的是probability?还是linear result。前者是logisticmodel估计的possibility of event,而linear result也就是 log(odds)就是极大似然估计计算的。最后的我学的是统计,我不认为计量的书会比较好,但discriminant 的选择过程多是用bayesian method 而且我之前用的时候这个model在SAS中好像不会给系数的estimation。如果可以能否详细解释一下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-29 10:02:33
“所有factor均是numerical variable。
现在我有一些问题想不明白。应为当任意一个factor为零的时候,possibility of PASS 应该是0,那么这时的log(p/1-p)就趋向于负无穷大,那么intercept就应该是负无穷大的一个值”
--------------------------------------------------------

极大似然估计是直接估计y=f(beta*x), x 为你说的factor向量,f的函数形式为1/(1+exp(-beta*x)),所以任意factor为零时,不会影响估计。log(p/1-p)为对数似然比值,这个值与任意factor为零没什么关系,因为理论上p不会等于0或1。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-30 01:55:15
statax 发表于 2015-9-29 10:02
“所有factor均是numerical variable。
现在我有一些问题想不明白。应为当任意一个factor为零的时候,poss ...
我想你还是没有明白我的问题,我现在肯定的是当任意一个factor即xi为0的时候,the possibility for events is 0
。所以我才会有上诉的疑问,认为logit model在这种情况下并不能很好的诠释我的数据。而不是说极大似然估计的问题,最后你说的理论上p值不为0或1的问题,也正是我疑问的一个关键。所以我才会问是否有其他的模型可以解决这个问题。或者说不用考虑这个问题,因为定义域的限制不会取到0。既然你说的了discreminant的选择模型,我不是很熟悉,如果可以我想问一下这个模型可以解决我的问题吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-30 09:01:59
hunxuexiaomeinv 发表于 2015-9-30 01:55
我想你还是没有明白我的问题,我现在肯定的是当任意一个factor即xi为0的时候,the possibility for event ...
y=f(beta*x),f的函数形式为1/(1+exp(-beta*x)), 解释变量beta*x形式为beta0+beta1*factor1+....betak*factork, 显然,当某个factor为零时,y的概率不是零。即使只有一个factor,只要有常数项beta0,y的取值也不是0吧。
你说:“我现在肯定的是当任意一个factor即xi为0的时候,the possibility for events is 0”-------从何说起?

另外,可能你的问题在于没有区分实际取值和概率的关系。比如,抛一枚硬币,正反面朝上的概率都是0.5,现在你抛了三次,结果都是反面朝上,你不能说,取正的概率是0,因为正面从来没出现过。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群