全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1257 3
2013-12-30
在做分析中,收集上来的第一手数据一般都是要进行清理才能做统计分析的。我现在有一些变量的干净数据,我想用模拟的方法分析一下如果数据不干净的话对统计分析的影响。我首先从干净的数据中按比例抽取了一部分数据,把剩下的数据用模拟的方法做成未清理的数据,求问各位大神,这应该怎么做呀?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-12-30 17:41:49
描述不够具体噢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-30 18:14:22
污染的数据也有多种污染源的,不同的污染源造成的结果可能不同。
关键是你要怎样污染它。这个不比清洗数据容易的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-31 08:53:46
kuangsir6 发表于 2013-12-30 18:14
污染的数据也有多种污染源的,不同的污染源造成的结果可能不同。
关键是你要怎样污染它。这个不比清洗数据 ...
我知道可能有以下五六种污染源,也大概知道每种污染源在污染中所占的比例呀。可以给一些建议么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群