全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 统计软件培训班VIP答疑区
4761 2
2011-09-30
现在在做binary logistic regression,因变量是1,0。自变量全部都是dummy variables

举例说明:

背景:通过虚拟抽样调查的方法得到来自城乡的300个家庭的数据,包括四个变量。第一个是虚拟编码的变量,描述每个家庭是否拥有彩色电视机,编码2表示拥有,编码0表示没有,变量名为OWN。第二个变量是家庭的年收入,以千元为测量单位,变量
名为INCOME, 也设置为虚拟变量,年收入1万以下为1,1万到2万为2,2万到3万为3,大于3万为基底。第三个变量为家庭居住地区类型的虚拟变量,分别编码1和0代表城市和农村两种情况,变量名为URBAN.第四个变量是家庭成员的年龄range,变量名为AGE, 也设置为虚拟变量,16-23以下为1,24-35为2,36-50为3,51-70为4,70以上为基底。

研究目的;分析家庭收入水平和地区,家庭类型对于拥有彩色电视机的影响作用。
因变量;OWN
自变量:INCOME,URBAN,AGE.

因为都是虚拟变量,请问如何求income, urban,age 的各自的概率呢?
我知道如果不是虚拟变量,可以用1/(1+exp^z)来计算,但是因为我现在的模型里面是虚拟变量,请问老师我该如何计算 income, urban, age的每个变量各自的概率呢?

谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-10-11 18:08:30
第一,首先您说的“自变量全部都是dummy variables”的表述不是很合理,一般用0、1表示的二分类变量称为虚拟变量,您的自变量income、age应叫分类变量,而不是虚拟变量。
第二,针对您的问题:一般在做binary logistic regression时并不关心他们各自的概率情况,而是相对概率,也就是相对于您称之为基底的分类(如:age中的70以上为基底这个分类)的相对概率,在该方法中,主要关注比数比的值。相关具体信息请参考该方法
由于假期缘故,让您的问题搁置这么久,敬请原谅!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-10-12 07:42:36
谢谢老师解答。我第一次做这种问卷分析,所以问的很外行,真的很不好意思。

请问老师,如果我就是想求概率,而不是相对概率,是否可以根据书本上的概率分布的公式求呢?谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群