全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
737 5
2024-08-10
求助大家,我有个数据是这样子的:

变量1  变量2  变量3  变量4          变量5
     a          b        c         d        公司名1;公司名2;公司名3(不一定是几个,可能是一个,可能是多个)
     e          f         g         h        公司名4;公司名5


大概就是这样的一个数据形式,我是希望把公司按照分号拆开,然后变量1-4相应地复制下来

变量1  变量2  变量3  变量4          变量5
     a          b        c         d        公司名1
     a          b        c         d        公司名2
     a          b        c         d        公司名3
     e          f         g         h       公司名4

     e          f         g         h       公司名5


求问需要什么样的代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-8-12 14:45:16
用excel比较简单吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-8-14 08:57:57
qgmyysj 发表于 2024-8-12 14:45
用excel比较简单吧
数据太大了没法导出到excel
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-8-14 16:01:24
可以用split函數 還有用forvalues功能,假設前四個變量不會變(var1 var2 var3 var4) 公司變量為var5,看上面的說明以 ;字符切割
先將變量切割後,將切割好的ˊ資料重整為需求的欄位。 forvalues的數字需依照實際切割完的變數量進行調整

复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-8-15 08:34:33
你可以使用Python的pandas库来处理这个问题。以下是一个示例代码:

```python
import pandas as pd

# 创建原始数据的DataFrame
data = {'变量1': ['a', 'e'],
        '变量2': ['b', 'f'],
        '变量3': ['c', 'g'],
        '变量4': ['d', 'h'],
        '变量5': ['公司名1;公司名2;公司名3', '公司名4;公司名5']}

df = pd.DataFrame(data)

# 使用str.split将'变量5'列中的字符串按照分号拆分成列表,然后用explode展开这个列表
df['变量5'] = df['变量5'].str.split(';')
df = df.explode('变量5')

# 显示处理后的数据
print(df)
```

这段代码会创建一个包含原始数据的DataFrame。接下来它会对'变量5'列中的字符串进行拆分,并将结果展开,以生成一个新的行对于每个公司名的结果。

当你运行这个代码时,你将会得到类似下面这样的输出:

```
    变量1 变量2 变量3 变量4       变量5
0      a     b     c     d  公司名1
0      a     b     c     d  公司名2
0      a     b     c     d  公司名3
1      e     f     g     h  公司名4
1      e     f     g     h  公司名5
```

然后你可以重置索引,以消除行前面的重复数字:

```python
df.reset_index(drop=True, inplace=True)
print(df)
```
这样你就可以得到没有重复索引的数据了。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-8-15 09:02:24
gigh 发表于 2024-8-14 16:01
可以用split函數 還有用forvalues功能,假設前四個變量不會變(var1 var2 var3 var4) 公司變量為var5,看上 ...
非常感谢您,很有用!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群