全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1320 1
2017-02-10
向大家介绍数据集合并方法中的连接(concat)与追加(append),首先做一些准备工作:


1.导入 Pandas 库与 Numpy 库:


复制代码


2.定义一个
make_df 函数,以便生成示例数据框:


复制代码


1.png

3.定义一个 display 类,方便我们更清晰地展示输出的结果:


复制代码

下面我们进入正题。


之前谈及过一些数组连接的方法,例如运用 Numpy 中的 concatenate 函数,我们可以将多组列表连接为一个数组:

复制代码
array([1, 2, 3, 4, 5, 6, 7, 8, 9])
同时,对于一个多层级的列表,我们也可以通过调整 axis 参数的值,在指定的维度上对其进行连接:
复制代码
array([[1, 2, 1, 2],       [3, 4, 3, 4]])
类似地,对于 Pandas 序列,Pandas 库中同样提供了连接函数,我们可以运用 Pandas 中的 concat 函数将两个序列进行连接:
复制代码
2.png
接下来,我们运用之前定义的数据框生成函数构建几个示例数据框,看看连接函数 concat 对数据框的处理效果:
复制代码
3.png 运用我们之前定义的 display 类,我们同时将两个数据框及其连接后的结果展示在一行上。可以看到, concat 函数默认地将第二个数据框连接在了第一个数据框下方。
有时候,我们可能需要对两个数据框进行横向的连接,如下所示,我们可以通过调整 concat 函数的参数 axis 来实现:
复制代码
4.png
以上内容转自 数析学院 ,原文后续还有关于索引值在合并过程中的处理,需要学习的同学可以直接查看原文



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-2-13 11:14:51
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群