全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
501 0
2022-10-12

所以我有这个CSV,我想做以下事情:


原始数据:


在此输入图像描述


解析数据:


在此输入图像描述


所以,换句话说,如果列有逗号,那么我想创建一个只有一个值的新列,并删除具有多个值的列。


例如:N2有I1,I3和I4。因此,新数据获得3列,仅包含一个值。


我想以这样的方式使它变得动态,以便反映所有的排列。就像N3的情况一样,它有2个位置和2个项目。


我正在尝试使用python的pandas来做到这一点。一些帮助将不胜感激。

解决办法:df['Place'] = df['Place'].str.split(',')

df['Item'] = df['Item'].str.split(',')


exploded = pd.DataFrame([

a + [p, t] for *a, P, T in df.values

for p in P for t in T

], columns=df.columns)

并输出:


Name Place Item

0 N1 P1 I1

1 N2 P2 I1

2 N2 P2 I3

3 N2 P2 I4

4 N3 P2 I2

5 N3 P2 I5

6 N3 P3 I2

7 N3 P3 I5


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群