全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1089 3
2024-08-16
请教各位大佬,可能是个有点复杂的问题。我的数据中有以下几个变量:year newzlid 专利类型 发明设计人 申请人 match。year的值都是一样的;match是对申请人变量操作得来的。现在我想做一个year-match-申请人-专利信息的数据集,意思就是,对于同一个“year-match-申请人”,可能有多个专利信息,我希望这些专利信息可以横向合并。


例如:
year        match    申请人    newzlid    专利类型     发明设计人
2024        M1          A            ZL1          类型1         设计人1
2024        M1          A            ZL2          类型2         设计人2
2024        M1          B            ZL3          类型1         设计人3
2024        M2          A            ZL4          类型1         设计人4








最后得到类似于这样的结果:
2024        M1        A        ZL1        类型1        设计人1        ZL2        类型2        设计人2
2024        M1        B        ZL3        类型1        设计人3        NaN        NaN        NaN
2024        M2        A        ZL4        类型1        设计人4        NaN        NaN        NaN


这在stata中可以直接操作吗?如果不能,Python中的代码应该怎么写?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-8-21 19:16:05
可以看下stata的merge代码;python的话可以问问chatgpt
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-8-25 11:14:44
bys year match 申请人:gen id=_n
reshape wide 专利类型   发明设计人  newzlid ,i(year match 申请人) j(id)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-8-28 11:06:50
qianchen 发表于 2024-8-25 11:14
bys year match 申请人:gen id=_n
reshape wide 专利类型   发明设计人  newzlid ,i(year match 申请人)  ...
理论上是可以,但是数据量太大了,stata一直报错
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群