全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4797 4
2012-10-23
最近在做一个决策树模型,目标找出最合适的顾客。顾客总数大约在180万左右,但是模型中的已知有购买行为(目标)的顾客只有4000多人。
两者相差较悬殊,因此采取对180万人进行抽样后建模。
用9.3的em进行分层抽样(目标顾客全抽,除目标顾客抽16000人)和建模。
模型的结果,似乎就是针对这20000人进行的。
那么sas在建模的时候是否会考虑到,抽样时造成的各指标之间权重的问题(我想应该没有)?该如何做呢?
在这种目标顾客占整体数量较小的情况下,一般怎么处理?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-10-23 13:44:40
最好能推荐下相关文献资料,谢谢啦~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-23 14:07:08
过度抽样,人为加大训练样本中目标用户的比率,通常比率不要太低就行,保证模型能够提取购买用户的特征;
用测试样本,通过增益图或者提升图来判别模型的优劣;
模型训练完成后,对剩余用户进行打分,得分高的用户认为是有购买倾向高的用户。



































二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-10-28 23:39:54
二楼说的很有道理!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-18 17:47:48
寻找响应高的用户做销售!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群