全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2450 19
2022-01-22
复制代码


上面的数据,因为每一个公司代码(第一列)对应的变量 “分类”包含的内容不同,比如第一个公司代码,有5个分类,第二个公司代码,只有4个分类,而且分类还和第一个公司不一样。我想把他变形成下面的理想样子
公司代码  分类1(5015) 分类2(5020) 分类3(0) 分类4(5025) 分类5(5099) 分类6(5025)
"000001"  639                3871                  7737       2283                   895                 0

最后一列分类6其实是补齐的,因为这家代码公司下,根本没有这个类别的数据,所以补上了变量,并填上了0


使用命令reshap无法完成任务,gather和spread之类的一样不行


reshape wide 取值1 取值2,i( code ) j( 分类 )
(note: j = 0 5005 5010 5015 5020 5025 5030 5050 5060 5099)
values of variable 分类 not unique within code
    Your data are currently long.  You are performing a reshape wide.  You specified i(code) and
    j(分类).  There are observations within i(code) with the same value of j(分类).  In the long
    data, variables i() and j() together must uniquely identify the observations.

         long                                wide
        +---------------+                   +------------------+
        | i   j   a   b |                   | i   a1 a2  b1 b2 |
        |---------------| <--- reshape ---> |------------------|
        | 1   1   1   2 |                   | 1   1   3   2  4 |
        | 1   2   3   4 |                   | 2   5   7   6  8 |
        | 2   1   5   6 |                   +------------------+
        | 2   2   7   8 |
        +---------------+
    Type reshape error for a list of the problem variables.






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-1-22 17:34:07
你的数据本身也存在问题
如:
"000016" 5020  1353     .
"000016" 5015   209     .
"000016" 5020  1130     .
"000016" 5025    21     .
"000016" 5020    34     .
"000016"    0  2947     .
"000016" 5099    15     .
"000016" 5010    31     .
"000016" 5010    14     .

同一个code,同一个分类,有两行
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-1-22 20:33:43
蓝色 发表于 2022-1-22 17:34
你的数据本身也存在问题
如:
"000016" 5020  1353     .
噢噢噢,刚刚发现,确实如此,我检查一下先
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-1-22 20:52:25
复制代码


刚刚调整了数据
reshape wide 人数 比例 ,i( A股股票代码_A_StkCd ) j( 学历类型 )s
结果还是:
values of variable 学历类型 not unique within A股股票代码_A_StkCd

发生了什么啊到底

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-1-23 08:45:30
蓝色 发表于 2022-1-22 17:34
你的数据本身也存在问题
如:
"000016" 5020  1353     .
类似数据已经调整,出现问题的原因不是重复数据,而是每个个体下面,变量不完全一样。这个怎么解决呢…… stata似乎只解决平衡数据……
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-1-23 16:21:56
bbsflyingsnow 发表于 2022-1-22 20:52
刚刚调整了数据
reshape wide 人数 比例 ,i( A股股票代码_A_StkCd ) j( 学历类型 )s
结果还是:
请用两家有代表性的企业 (A股股票代码_A_StkCd) 资料,写出你要的结果?目前看不出你要什么结果?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群