全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
40695 35
2011-05-22
请问大侠:性别、年龄、职业、学历等定性变量和定序变量为自变量能做回归分析吗,如何处理数据?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-5-29 17:31:12
这个是可以做回归分析的,你定义虚拟变量就行的。如果是两个(如性别)那么定义为0和1即可,但是方程中如果全是定性或者定序变量,建议楼主用方差分析!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-29 18:35:08
可以做回归分析,只不过自变量的数据是不连续的双值变量(也称“虚拟变量”),即这个变量只有两个值,0和1(“是”和“非”)。这种数据主要是用来衡量质的变化。

如何处理数据:
1)性别:性别只有男和女两个值。所以可设置一个变量a来表示性别,a=1表示女,a=0表示男。
2)职业、学历等要稍微复杂一点,因为它们的分类情况不止两种:
  如学历,若分为小学,初中,高中,大学四个层次。就需要设置4个自变量b1,b2,b3,b4。
  b1=1小学;b1=0其它。
  b2=1初中;b2=0其它。
  b3=1高中;b3=0其它。
  b4=1大学;b4=0其它。
  而不是只用一个变量表示,如b1=1,2,3,4。因为这中间的差距不是等距的关系。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-29 19:35:08
可以做
引入虚拟变量
虚拟变量又称虚设变量、名义变量或哑变量,用以反映质的属性的一个人工变量,是量化了的质变量,通常取值为0或1。引入哑变量可使线形回归模型变得更复杂,但对问题描述更简明,一个方程能达到俩个方程的作用,而且接近现实。   例如,反映文程度的虚拟变量可取为:1:本科学历;0:非本科学历
在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:  
1)如果有m种互斥的属性类型,在模型中引入(m-1)个虚拟变量,否则会导致多重共线性。称作虚拟变量陷阱。 例如,性别有2个互斥的属性,引用2-1=1个虚拟变量;再如,文化程度分小学、初中、高中、大学、研究生5类,引用4个虚拟变量。   
2)关于定型变量中哪个取0哪个取1是任意的,不影响检验结果。  
3)若定型变量取值为0,所对应的类别称为基础类别。  
4)对于多于两个类别的定型变量可采用设一个虚拟变量,而对于不同类别采取赋值不同的方法处理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-29 22:08:45
自己对这个也不是特别的清楚,来这里正好看到楼上几位的回复,又懂了不少,谢谢楼上的朋友啊,(*^__^*)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-5-30 08:48:27
定义虚拟变量后,可以考虑用logit回归,做影响因素分析。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群