全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 python论坛
1710 2
2020-02-11
     我用pandas库建立了两个DataFrame:df1和df2,内容如下。df1.key是df2.key的一个子集,且df1.key的取值有重复。

截屏2020-02-1112.59.32.png

     现在需要按df1和df2的key,将df2的内容合并到df1中,建立一个8919行3列的DataFrame:df3。

     我使用的命令:df3 = pd.merge(df1, df2, on='key', how='inner'),但是结果却是一个427226行3列的DataFrame...如下:

截屏2020-02-1113.14.52.png

     想问下为什么会这样?如果要实现上述的合并(建立一个8919行3列的DataFrame),应该怎么写命令呢?
     谢谢!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2020-2-16 11:39:04
how应该用left吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2020-3-2 16:17:13
最好发一个df.head()出来看看数据是什么情况的。
很有可能你的df2.key也是有重复的就会导致这样的情况。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群