全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1650 5
2022-07-16
想根据第二列中出现的词,删除第一列中对应字符,如何做到呢?
复制代码
举例如下:在第一行中,我想根据第二列的“小明”删除第一列中对应字符,也就是剩下“今天不去,小美找小红。”。在第二行中,我想根据“小明”、“小白”删除第一列中对应,也就是剩下“今天不去,小美找小红。”。第三行保持不变。
请问如何可以做到呢?


注:代码被吞了,重新写在下方:import pandas as pd

df1 = pd.DataFrame([['今天小明不去,小美找小红。','小明','今天'],['今天小白不去,小美找小红。','小明,小白','天'],['今天小紫不去,小美找小红。','','明天']],index = [1,2,3],columns=['A','B','C'])




注:很抱歉没有找到Python对应板块,因此在STATA下发帖

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-7-16 17:41:53
import pandas as pd  
  
df1 = pd.Datafr ame([['今天小明不去,小美找小红。', '小明', '今天'], ['今天小白不去,小美找小红。', '小明,小白', '天'], ['今天小紫不去,小美找小红。', '', '明天']],  
  index=[1, 2, 3], columns=['A', 'B', 'C'])  
  
for index, row in df1.iterrows():  
    params, content = str(row['B']).split(','), str(row['A'])  
    for param in params:  
        if param and content and param in content:  
            content = content.replace(param, '')  
    df1.at[index, 'A'] = content

逐行遍历,简单替换就行

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-17 11:24:11
kanson 发表于 2022-7-16 17:41
import pandas as pd  
  
df1 = pd.Datafr ame([['今天小明不去,小美找小红。', '小明', '今天'], ['今天 ...
谢谢!
此处,借花献佛分享另外一种方法:
df["A"] = df.apply(lambda x: re.sub(r"|".join(x['B'].split(',')), "", x["A"]), axis=1)

再次感谢您的回答
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-7-17 21:34:56
wtst 发表于 2022-7-17 11:24
谢谢!
此处,借花献佛分享另外一种方法:
df["A"] = df.apply(lambda x: re.sub(r"|".join(x['B'].spl ...
正则+lambda,perfect!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-12-25 15:21:27
多谢楼主
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群