全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2423 1
2018-07-09
逻辑回归中对于哑变量的自由度,和非哑变量的自由度如何定义的?
例如下图中的education 为一个哑变量,其取值有三种情况:colleague graduate  high school ,但是其自由度为2  
delinq 是一个定量变量,但是他的自由度是1 ,这是为啥?小白求解。
分类水平信息
分类

设计变量

Education

college

0

0

 

graduate

1

0

 

high school

0

1

Reason

business

1

0

 

car

0

0

 

house

0

1

Ploan

0

0

1

1

 






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-7-11 09:12:00
先理解一下自由度的含义吧,百度百科的解释是,在统计学中,自由度(degree of freedom, df)指的是计算某一统计量时,取值不受限制的变量个数。通常df=n-k。其中n为样本数量,k为被限制的条件数或变量个数,或计算某一统计量时用到其它独立统计量的个数。数学上,自由度是一个随机向量的维度数,也就是一个向量能被完整描述所需的最少单位向量数。你这个例子中教育的取值是3种,事实上你任取其中两个取值产生两个哑变量,当两个哑变量全=0时,就是第三种取值,这就是自由度为2
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群