reshape解决不了

2584

收藏 2022-01-22

复制代码

上面的数据，因为每一个公司代码（第一列）对应的变量 “分类”包含的内容不同，比如第一个公司代码，有5个分类，第二个公司代码，只有4个分类，而且分类还和第一个公司不一样。我想把他变形成下面的理想样子
公司代码  分类1（5015）分类2（5020）分类3（0）分类4（5025）分类5（5099）分类6（5025）
"000001"  639             3871                7737    2283                895                0

最后一列分类6其实是补齐的，因为这家代码公司下，根本没有这个类别的数据，所以补上了变量，并填上了0

使用命令reshap无法完成任务，gather和spread之类的一样不行

reshape wide 取值1 取值2,i( code ) j( 分类 )
(note: j = 0 5005 5010 5015 5020 5025 5030 5050 5060 5099)
values of variable 分类 not unique within code
Your data are currently long.  You are performing a reshape wide.  You specified i(code) and
j(分类).  There are observations within i(code) with the same value of j(分类).  In the long
data, variables i() and j() together must uniquely identify the observations.

      long                               wide
      +---------------+                +------------------+
      | i j a b |                | i a1 a2  b1 b2 |
      |---------------| <--- reshape ---> |------------------|
      | 1 1 1 2 |                | 1 1 3 2  4 |
      | 1 2 3 4 |                | 2 5 7 6  8 |
      | 2 1 5 6 |                +------------------+
      | 2 2 7 8 |
      +---------------+
Type reshape error for a list of the problem variables.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

蓝色

2022-1-22 17:34:07

你的数据本身也存在问题
如：
"000016" 5020  1353    .
"000016" 5015 209    .
"000016" 5020  1130    .
"000016" 5025 21    .
"000016" 5020 34    .
"000016" 0  2947    .
"000016" 5099 15    .
"000016" 5010 31    .
"000016" 5010 14    .

同一个code，同一个分类，有两行

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-22 20:33:43

蓝色发表于 2022-1-22 17:34
你的数据本身也存在问题
如：
"000016" 5020 1353 .

噢噢噢，刚刚发现，确实如此，我检查一下先

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-22 20:52:25

复制代码

刚刚调整了数据
reshape wide 人数比例 ,i( A股股票代码_A_StkCd ) j( 学历类型 )s
结果还是：
values of variable 学历类型 not unique within A股股票代码_A_StkCd

发生了什么啊到底

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-23 08:45:30

蓝色发表于 2022-1-22 17:34
你的数据本身也存在问题
如：
"000016" 5020 1353 .

类似数据已经调整，出现问题的原因不是重复数据，而是每个个体下面，变量不完全一样。这个怎么解决呢…… stata似乎只解决平衡数据……

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2022-1-23 16:21:56

bbsflyingsnow 发表于 2022-1-22 20:52
刚刚调整了数据
reshape wide 人数比例 ,i( A股股票代码_A_StkCd ) j( 学历类型 )s
结果还是：

请用两家有代表性的企业 (A股股票代码_A_StkCd) 资料，写出你要的结果？目前看不出你要什么结果？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

bbsflyingsnow

2022-1-23 17:19:14

我想把他变形成下面的理想样子
公司代码博士及研究生    本科    大专    中专及以下  硕士    合计       在职员工  大专以下博士  学士  职工总数
"000001"    639             3871    2283    895             0       7737          0       0          0    0       0
"000002"    0                8899    2439       0                1595 0             13402 429    40    0       0
"000004"       0                   0             0          0             15       0                0       0          4    54    284

也就是说，学历类型虽然每个公司名称不一样，但是我都会列为变量名，有数据的公司填数据，没有的补充为0. 比如职工总数=在职员工=合计，但是三家公司用了三个变量表达一个含义，但是这三个变量我都列上，有数据就填，没有数据就补为0.这样后期我把同类项汇总就可以计算一个总数了。现在的问题是，系统改不成上面的样子，reshape不了，因为每家公司下面的学历类型不一样……

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-23 17:19:35

黃河泉发表于 2022-1-23 16:21
请用两家有代表性的企业 (A股股票代码_A_StkCd) 资料，写出你要的结果？目前看不出你要什么结果？

谢谢您帮忙看看

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

qianchen

2022-1-23 19:14:55

clear
input str6 code int 类别代码 str72 学历 int 次类别代码 long 人数 double 比例
"000001" 5000 "博士及硕士研究生" 5015 639    .
"000001" 5000 "本科"                5020  3871    .
"000001" 9000 "合计"                   .  7737    1
"000001" 5000 "大专"                5025  2283    .
"000001" 5000 "中专及以下"       5099 895    .
"000002" 5000 "大专"                5025  2439  .182
"000002" 5000 "本科"                5020  8899  .664
"000002" 5000 "硕士"                5015  1595  .119
"000002" 9000 "在职员工"             . 13402    1
"000002" 5000 "大专以下"          5099 429  .032
"000002" 5000 "博士"                5010 40  .003
"000004" 5000 "学士"                5020 54    .
"000004" 5000 "博士"                5010    4    .
"000004" 9000 "职工总数"             . 284    .
"000004" 5000 "硕士"                5015 15    .
"000005" 5000 "大专以上"          5020    . .52
"000005" 9000 "职工总数"             . 885    .
"000006" 9000 "职工总数"             . 134    .
"000006" 5000 "大专以上学历"    5025 127    .
"000007" 9000 "职工总数"             .  1087    .
"000007" 5000 "大专以下"          5099 833 .7663
"000007" 5000 "大专以上"          5020 254 .2337
"000008" 9000 "职工总数"             . 24    .
"000008" 5000 "其他学历"          5099    6 .25
"000008" 5000 "博士以上学历"    5010    1 .0417
"000008" 5000 "大学本科以上学历" 5020    9  .375
"000008" 5000 "大学专科以上学历" 5025    8 .3333
"000009" 5000 "本科"                5020 570  .134
"000009" 5000 "其他"                5099  1990 .4678
"000009" 5000 "中专"                5030 750 .1763
"000009" 5000 "硕士"                5015 80 .0188
"000009" 9000 "职工总数"             .  4254    .
"000009" 5000 "大专"                5025 855  .201
"000009" 5000 "博士"                5010    9 .0021
"000010" 9000 "职工总数"             . 30    .
"000010" 5000 "大专以上学历"    5025 27    .
"000011" 5000 "大中专以上"       5030  1176    .
"000011" 9000 "职工总数"             .  1958    .
"000012" 5000 "大中专以上文化" 5030  3783 .5453
"000012" 9000 "在职员工"             .  6938    1
"000012" 5000 "其他学历"          5099  3155 .4547
"000014" 9000 "职工总数"             . 101    .
"000016" 5000 "本科以上学历"    5020  1353    .
"000016" 5000 "硕士"                5015 209    .
"000016" 5000 "学士"                5020  1130    .
"000016" 5000 "专科"                5025 21    .
"000016" 5000 "本科"                5020 34    .
"000016" 9000 "职工总数"             .  2947    .
"000016" 5000 "中专及以下"       5099 15    .
"000016" 5000 "硕士以上"          5010 31    .
"000016" 5000 "博士"                5010 14    .
"000017" 9000 "职工总数"             . 480    .
"000017" 5000 "本科"                5020 32    .
"000017" 5000 "硕士以上"          5010    6    .
"000017" 5000 "大专"                5025 60    .
"000019" 9000 "职工总数"             . 507    .
"000019" 5000 "高中及以下学历" 5099 297 .5858
"000019" 5000 "研究生及以上学历" 5015 17 .0335
"000019" 5000 "中专"                5030 45 .0888
"000019" 5000 "大学专科"          5025 79 .1558
"000019" 5000 "大学本科"          5020 69 .1361
"000020" 5000 "大专"                5025 57 .13
"000020" 5000 "其他"                5099 357 .81
"000020" 5000 "本科以上"          5015 26 .06
"000020" 9000 "职工总数"             . 441    .
"000021" 5000 "本科"                5020 354 .0837
"000021" 9000 "职工总数"             .  4231    .
"000021" 5000 "中专"                5030  2088 .4935
"000021" 5000 "硕士及以上"       5015 52 .0123
"000021" 5000 "大专"                5025 242 .0572
"000021" 5000 "其他"                5099  1495 .3533
"000023" 9000 "职工总数"             . 264    .
"000023" 5000 "中专"                5030 14    .
"000023" 5000 "大专"                5025 61    .
"000023" 5000 "博士后及研究生" 5099 12    .
"000023" 5000 "本科"                5020 66    .
"000025" 9000 "职工总数"             . 976    .
"000025" 5000 "专科"                5025 199    .
"000025" 5000 "其他"                5099 635    .
"000025" 5000 "大学本科"          5020 122    .
"000026" 9000 "职工总数"             .  1614    .
"000026" 5000 "大专及大专以上" 5025 471    .
"000027" 9000 "职工总数"             . 64    .
"000028" 9000 "职工总数"             .  3757    .
"000028" 5000 "硕士及以上学历" 5015 77 .0205
"000028" 5000 "高中及以下学历" 5099 911 .2425
"000028" 5000 "大学专科"          5025 913  .243
"000028" 5000 "大学本科"          5020 705 .1877
"000028" 5000 "中专"                5030  1151 .3064
"000029" 9000 "职工总数"             .  2323    .
"000029" 5000 "中专"                5030 297 .1279
"000029" 5000 "本科及以上"       5020 221 .0951
"000029" 5000 "高中及以下"       5099  1542 .6638
"000029" 5000 "大专"                5025 263 .1132
"000030" 9000 "职工总数"             . 13    .
"000030" 5000 "硕士"                5015    2 .1538
"000030" 5000 "大学本科"          5020    4 .3077
"000030" 5000 "大专"                5025    4 .3077
"000030" 5000 "其他"                5099    3 .2308
"000031" 9000 "职工总数"             . 485    .
end

drop 类别代码次类别代码
sort code 学历
reshape wide 人数比例,i(code) j(学历) string

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

DΘstinyじò

2022-1-23 19:56:14

尝试

复制代码

建议还是先整理学历类型这个变量，把同一意思的不同表述统一标准。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-23 20:11:01

DΘstinyじò 发表于 2022-1-23 19:56
尝试建议还是先整理学历类型这个变量，把同一意思的不同表述统一标准。

OK，我先搞定这个，不过我认为问题不出在这里，假如整理好了，比如学历分为ABCD四类，然后第1家公司有ABC，第二家有D，第三家有BCD，还是不整齐……

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-23 20:18:42

qianchen 发表于 2022-1-23 19:14
clear
input str6 code int 类别代码 str72 学历 int 次类别代码 long 人数 double 比例
"000001" 5000 ...

values of variable 学历 not unique within code

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

qianchen

2022-1-23 20:22:29

bbsflyingsnow 发表于 2022-1-23 20:18
values of variable 学历 not unique within code

我的完全没有问题

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-23 20:24:49

qianchen 发表于 2022-1-23 19:14
clear
input str6 code int 类别代码 str72 学历 int 次类别代码 long 人数 double 比例
"000001" 5000 ...

values of variable 学历 not unique within code
Your data are currently long.  You are performing a reshape wide.  You specified
i(code) and j(学历).  There are observations within i(code) with the same value of
j(学历).  In the long data, variables i() and j() together must uniquely identify the
observations.

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-23 20:25:27

qianchen 发表于 2022-1-23 20:22
我的完全没有问题

ok 谢谢您，看来是后面有重复的数据我马上查查

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

qianchen

2022-1-23 20:47:03

你肯定又用了其他数据了用贴出来的数据试试完全没有任何问题

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-24 07:08:06

qianchen 发表于 2022-1-23 19:14
clear
input str6 code int 类别代码 str72 学历 int 次类别代码 long 人数 double 比例
"000001" 5000 ...

搞定了非常感谢！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-26 11:59:43

复制代码

加上年了，怎么把年的分开啊
如果不控制年度，就又重复了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-26 12:04:15

qianchen 发表于 2022-1-23 20:47
你肯定又用了其他数据了用贴出来的数据试试完全没有任何问题

如果加个新的年度变量怎么办啊，

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

bbsflyingsnow

2022-1-26 14:44:35

reshape wide 数量,i(code year) j(学历) string 谢谢各位

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群