全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
3077 1
2017-01-13
缺失值处理用到的主要工具为 Numpy 库和 Pandas库中的有关函数,要导入 Numpy 和 Pandas:
复制代码


在 Python 中,特殊的常量 None 通常被理解为缺失值的一种,我们构建了一个包含有 None 的 Numpy 数组 vals1:

复制代码
array([1, None, 3, 4], dtype=object)
复制代码
dtype = object10 loops, best of 3: 78.2 ms per loopdtype = int100 loops, best of 3: 3.06 ms per loop
复制代码
1.png
可以看到,当我们的数组中存在缺失值 None 时,我们无法完成简单的求和运算,并且会出现程序报错。
运用 Numpy 库,我们可以用另一种方式生成缺失值,即使用 np.nan
复制代码
dtype('float64')
复制代码
nan
复制代码
nan
可以发现,np.nan 虽然也不能参与简单的计算,但不会出现程序报错的情况,我们得到的结果将为 nan
同时,Numpy 库还专门为我们准备了用于处理 nan 值的特殊函数 nansumnanmin 以及 nanmax 等:
复制代码
(nan, nan, nan)
复制代码
(8.0, 1.0, 4.0)
在 Pandas 序列中,不论我们生成的缺失值是 None 还是 nan,都会被转化为 NaN 的形式:
复制代码
2.png

以上内容转自 数析学院,原文内容较多,这里只是一部分,感兴趣的同学可以直接查看原文




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-1-16 10:53:15
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群