全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1319 4
2019-02-22
悬赏 100 个论坛币 未解决
最近分析的数据缺失值较多,而且分布在不同列。有些列的数据无关紧要所以我不想删除因此无法使用dropna(axis=0)。我只想删除或填补特定列的缺失值请问该如何实现?如果填补数据使用哪种方法比较好呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-2-22 06:45:06
简单的方法就是用平均值代替呗, 如何处理 missing data 本身就是一个很重要的研究方向
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-22 09:07:03
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-23 18:38:02
你这问的太广泛了,不过csdn上有很多方法,你完全可以去找适应你的方案
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-28 14:49:38
data["columnName"].fillna(0) # 用0填充某一列的缺失值
data[data["columnName"].notnull()]  # 按照某一列的缺失值筛选
一般用上一个值、平均值、0、-99999  要根据实际情况判断
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群