你可以使用Python的pandas库来处理这个问题。以下是一个示例代码:
```python
import pandas as pd
# 创建原始数据的DataFrame
data = {'变量1': ['a', 'e'],
'变量2': ['b', 'f'],
'变量3': ['c', 'g'],
'变量4': ['d', 'h'],
'变量5': ['公司名1;公司名2;公司名3', '公司名4;公司名5']}
df = pd.DataFrame(data)
# 使用str.split将'变量5'列中的字符串按照分号拆分成列表,然后用explode展开这个列表
df['变量5'] = df['变量5'].str.split(';')
df = df.explode('变量5')
# 显示处理后的数据
print(df)
```
这段代码会创建一个包含原始数据的DataFrame。接下来它会对'变量5'列中的字符串进行拆分,并将结果展开,以生成一个新的行对于每个公司名的结果。
当你运行这个代码时,你将会得到类似下面这样的输出:
```
变量1 变量2 变量3 变量4 变量5
0 a b c d 公司名1
0 a b c d 公司名2
0 a b c d 公司名3
1 e f g h 公司名4
1 e f g h 公司名5
```
然后你可以重置索引,以消除行前面的重复数字:
```python
df.reset_index(drop=True, inplace=True)
print(df)
```
这样你就可以得到没有重复索引的数据了。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用