全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1234 1
2013-12-26
坏样本过少,需要增加坏样本浓度,取截至到13年12月为止的数据,坏样本的比例为2%,为了增加浓度,各取10万用户。
在这样的权重下建模,我验证集和测试集都在这个时间段内,但当我落地应用到14年的数据时,坏样本的比例会发生变化,在之前情况下的样本权重,怎么应对与后续不同不同比例的总体数据?

求教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-29 22:10:59
样本分布不同需要对样本样本数据进行预处理,不知你是建立什么模型,如果是方差分析比较均值之类的正好不同分组来分析,但感觉你是取得观测值,个人想法用14年的乘以一个以前年度浓度均值与14浓度均值比来转化一下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群