全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
17466 15
2012-02-06
我想研究一些变量对某银行行用卡持卡人是否使用某项功能的影响情况,选用binary logistic方法,在预处理时遇到一些问题:
1、是否需要对数据进行归一化,转化为在[0,1]之间的数据
2.、logistic是否邀请将数据进行标准化呢,即均值为0,方差为1
3、为了研究方便,我把年龄和收入都进行了离散化,分为了五个档次(他们是有序的):1-5,在做回归的时候,是要将他们设置为分类变量,转化为0.1,还是直接放入协变量进行建模呢?

此外,在选择变量进入方式的时候,怎么考虑方式呢,谢谢大家了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-2-6 12:31:12
Logit处理不是标准化,可以参考下公式;
年龄和收入我觉得可以直接作为变量,但是要假定不同的数值见的距离相同,否则其意义不好解释,如10-20为“1”,20-60为“2”,这个好像有点不太好说。总之,看你的需要。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-6 12:32:52
没有一定要求进行归一化处理,后面的个人觉得还是设置为分类变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-6 14:42:59
luling2010 发表于 2012-2-6 12:32
没有一定要求进行归一化处理,后面的个人觉得还是设置为分类变量
嗯,不用归一化,那一定要进行标准化么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-6 14:48:12
年龄为有序的,需要考试各个顺序的影响,另有排序选择模型可用
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-2-6 14:53:06
chenye45676848 发表于 2012-2-6 14:48
年龄为有序的,需要考试各个顺序的影响,另有排序选择模型可用
其实收入也是有顺序的,就不能使用将其转化为分类变量来做么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群