现有5个行业,我设立了4个哑元变量来表示,然后进入模型进行线性回归,不知道这样是否合理?
因为几个行业之间没有级别的差距,自己认为不能通过设一个变量,通过不同数值进行表示。
大虾们,帮忙,小弟谢过!
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
回楼上的,哑元变量是可以进入线性回归模型的,这个在国内、外很多文章中都有用过。
虽然自变量的二值特征不能满足线性回归模型的假设,但是目前很多模型都是无法对所有假设都满足的,能做到的也只是尽量去满足。