全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
5334 12
2013-10-28
请教各位:有5000个抽样调查得来的case,每个case都给出了权重。我要研究收入问题,但是有些case存在收入数据的缺失,于是删除掉了这些收入缺失的case。这样剩下有效的case是4000个,这时还可以用最初每个case的权重吗?多谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-10-30 10:01:40
不可以了吧。缺失的数据不一定非得删掉,缺省值可用剩余那些求平均做一个估计,这样就可以用原来的权重了吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-30 10:37:34
青苹果19 发表于 2013-10-30 10:01
不可以了吧。缺失的数据不一定非得删掉,缺省值可用剩余那些求平均做一个估计,这样就可以用原来的权重了吧
感觉用剩余的做估计不太靠谱啊。你知道有什么书里面详细介绍权重吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-30 10:45:14
你刚才说了剩余4000个数据,用4000个数据估计1000个,应该还可以吧。权重这块就不清楚了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-30 11:08:14
青苹果19 发表于 2013-10-30 10:45
你刚才说了剩余4000个数据,用4000个数据估计1000个,应该还可以吧。权重这块就不清楚了
那为什么说删除掉一些数据之后就不能用原来的权重了呢?如果不能用原来的权重了,该如何对新的数据加权呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-10-30 13:50:33
zhangyiyiw 发表于 2013-10-30 11:08
那为什么说删除掉一些数据之后就不能用原来的权重了呢?如果不能用原来的权重了,该如何对新的数据加权呢 ...
你删掉数据后,他们占的比例就不一样了啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群