全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 悬赏大厅
1043 6
2022-06-24
悬赏 5 个论坛币 未解决
现在有10个dataframe,命名为data_1-data_10,每个dataframe的列名为[code1, code2, code3, code4, a, b, c],想把每个表的a列根据code匹配在一起,思路是先按code1匹配,如果code1重复或缺失,则按code2匹配,如果code2重复或缺失,则按code3匹配……以此类推,最终得到的效果是[code1, code2, code3, code4, a_1, a_2,..., a_10]。
假如直至code4依然无法匹配到前表,则作为新行进入最终表格(即最后的merge效果为outer)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-6-24 19:06:45
双重循环,差不多可以实现匹配功能
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-6-26 18:08:57
olympic 发表于 2022-6-24 19:06
双重循环,差不多可以实现匹配功能
谢谢,请问可以更详细地讲解一下吗?我只是个初学者
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-2 11:12:56
可以考虑pandas的merge()方法内连接或pd.concat()
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-2 22:10:49
yembin 发表于 2022-7-2 11:12
可以考虑pandas的merge()方法内连接或pd.concat()
merge会出现很多同名列……太累赘了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-14 11:34:48
可以试试:
1.先把所有文件合并在一起。 pd.concat
2. 然后开始合并,Code1, Code2, Code3, Code4  

3. 看看你的a_1, a_2 ....是否需要整合起来
4. 如果 concat, merge, join 能满足最好,

5. 满足不了,研究一下 iloc,pivot_table

4. Python 处理数据还是很方便的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群