全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2409 3
2011-07-15
现在有个作业,要用一个data set的数据建个预测模型。
这个数据集里的数据都是有些问题要处理的,其中有些aggregate variables,比如inonemin_mean和inonemin_range.
想请问一下,这些变量要怎么处理一下呢?有没有一个什么标准来判断这些变量是不是要放到模型里呢?
谢谢大家
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-7-15 11:32:43
说详细一点,这样才知道你要干嘛。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-7-15 11:52:59
是啊,你什么样的数据,需要建立什么类型的模型等等
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-7-16 02:55:26
谢谢上面两位的回复,
具体说就是有一个包含172个变量和一个target variable的数据集,要用这个建个模型来预测以后30-60天里顾客对目标变量的喜好。
这172个变量里面有些aggregate variables,比如attempt_mean和attempt_range两个变量的label都是attempted calls.
再比如drop_blk_mean和drop_blk_range的label都是drop/block calls.
作业中有一题是问how to deal with aggregated variables using summary statistics. 然后列个表标出所有的aggregate variable, 列出这些变量那些要包括在最终模型中,那些排除在外,排除的理由是什么。
不知道这样说有没有清楚一点,请大家帮帮忙吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群