数据清洗 - Stata专版

737

收藏 2024-08-10

求助大家，我有个数据是这样子的：

变量1  变量2  变量3  变量4       变量5
   a       b       c       d       公司名1；公司名2；公司名3（不一定是几个，可能是一个，可能是多个）
   e       f       g       h       公司名4；公司名5

大概就是这样的一个数据形式，我是希望把公司按照分号拆开，然后变量1-4相应地复制下来

变量1  变量2  变量3  变量4       变量5
   a       b       c       d       公司名1
   a       b       c       d       公司名2
   a       b       c       d       公司名3
   e       f       g       h    公司名4

   e       f       g       h    公司名5

求问需要什么样的代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

qgmyysj

2024-8-12 14:45:16

用excel比较简单吧

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

科研吗喽

2024-8-14 08:57:57

qgmyysj 发表于 2024-8-12 14:45
用excel比较简单吧

数据太大了没法导出到excel

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

gigh

2024-8-14 16:01:24

可以用split函數還有用forvalues功能，假設前四個變量不會變(var1 var2 var3 var4) 公司變量為var5，看上面的說明以；字符切割
先將變量切割後，將切割好的ˊ資料重整為需求的欄位。 forvalues的數字需依照實際切割完的變數量進行調整

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

赵安豆

2024-8-15 08:34:33

你可以使用Python的pandas库来处理这个问题。以下是一个示例代码：

```python
import pandas as pd

# 创建原始数据的DataFrame
data = {'变量1': ['a', 'e'],
      '变量2': ['b', 'f'],
      '变量3': ['c', 'g'],
      '变量4': ['d', 'h'],
      '变量5': ['公司名1；公司名2；公司名3', '公司名4；公司名5']}

df = pd.DataFrame(data)

# 使用str.split将'变量5'列中的字符串按照分号拆分成列表，然后用explode展开这个列表
df['变量5'] = df['变量5'].str.split('；')
df = df.explode('变量5')

# 显示处理后的数据
print(df)
```

这段代码会创建一个包含原始数据的DataFrame。接下来它会对'变量5'列中的字符串进行拆分，并将结果展开，以生成一个新的行对于每个公司名的结果。

当你运行这个代码时，你将会得到类似下面这样的输出：

```
变量1 变量2 变量3 变量4    变量5
0    a    b    c    d  公司名1
0    a    b    c    d  公司名2
0    a    b    c    d  公司名3
1    e    f    g    h  公司名4
1    e    f    g    h  公司名5
```

然后你可以重置索引，以消除行前面的重复数字：

```python
df.reset_index(drop=True, inplace=True)
print(df)
```
这样你就可以得到没有重复索引的数据了。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

科研吗喽

2024-8-15 09:02:24

gigh 发表于 2024-8-14 16:01
可以用split函數還有用forvalues功能，假設前四個變量不會變(var1 var2 var3 var4) 公司變量為var5，看上 ...

非常感谢您，很有用！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群