请问面板数据分组求和结果不一致怎么解决？

修波

3576

收藏 2019-03-08

本人使用工业企业数据库就业数据进行分组求和，但是发现分组计算后，不同组的总就业量计算结果是不一致的。根据部分同学提出的采用doule命令，计算结果依旧不一致，请问这种情况应该如何，多谢指教。

1998.dta
大小:(1.29 MB)

马上下载

下面是命令:

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

黃河泉

2019-3-8 15:45:16

你到底是要做什么？请直接说明！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-8 15:54:18

黃河泉发表于 2019-3-8 15:45
你到底是要做什么？请直接说明！

我对就业数据分别按照城市、行业大类和行业小类进行分组求和，得出了三列数据，但是发现这三列数据的总就业量是不一致的，我就想咨询一下这是怎么回事

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-8 16:20:26

修波发表于 2019-3-8 15:54
我对就业数据分别按照城市、行业大类和行业小类进行分组求和，得出了三列数据，但是发现这三列数据的总就 ...

请根据你的资料，说明哪里有问题？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-13 20:30:25

黃河泉发表于 2019-3-8 16:20
请根据你的资料，说明哪里有问题？

问题就是使用和不使用分组求和计算的总就业量不一致，一个为1.09e+09，一个为1.05e+09，想请问老师怎么解决分组求和计算结果不一致的问题

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-14 08:28:24

修波发表于 2019-3-13 20:30
问题就是使用和不使用分组求和计算的总就业量不一致，一个为1.09e+09，一个为1.05e+09，想请问老师怎么解 ...

看不懂！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

修波

2019-3-14 12:42:00

黃河泉发表于 2019-3-14 08:28
看不懂！

[sad] 第一步：我先直接用 total emp 计算了所有地区、所有产业的总就业量为1.09e+09；第二步：按照产业分类计算了不同地区对应的就业量( bysort shi_id : egen double emp_city=sum(emp))，再计算total emp_city为1.05e+09。按道理来说 total emp 和 total emp_city 的结果应该是相等的，但是我得到的结果却不一致，我就想问老师如何使利用分组求和得到的 emp_city 总就业量和 total emp 结果一致？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-14 17:01:18

修波发表于 2019-3-14 12:42
第一步：我先直接用 total emp 计算了所有地区、所有产业的总就业量为1.09e+09；第二步：按照 ...

我实在不想看你的程序，你的

复制代码

或

复制代码

都会改变资料的多寡，当然与

复制代码

会不一样！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-14 17:31:38

黃河泉发表于 2019-3-14 17:01
我实在不想看你的程序，你的或都会改变资料的多寡，当然与会不一样！

我是用两张相同内容的表格分开来计算total emp 和 total emp_city，这两个结果互不影响。利用命令( bysort shi_id : egen double emp_city=sum(emp))需要删除重复的值，删除重复值之后计算出的 total emp_city 结果就出现了与 total emp 结果不一致的问题。所以才想向老师询问怎么解决两个求和值不一致

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-14 18:23:02

修波发表于 2019-3-14 17:31
我是用两张相同内容的表格分开来计算total emp 和 total emp_city，这两个结果互不影响。利用命令( bysor ...

我们就一步一步来！1. 根据你给的资料 (或者你要发一个更具代表性之资料)，我们要删除哪些观察值？请说明。2. 删除完后，要计算哪些东西，也请说清楚，不要再谈你的程式！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-14 20:59:28

黃河泉发表于 2019-3-14 18:23
我们就一步一步来！1. 根据你给的资料 (或者你要发一个更具代表性之资料)，我们要删除哪些观察值？请说明 ...

好的，老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令，先分组求和，得到分产业就业量 emp_city，再用duplicates drop命令删除不同地区（shi_id）单个产业（class_xiao）就业量的重复值。例如删除“101”地区中“1312”产业的就业量重复值。删除重复值后计算总就业量 total emp_city , 得到的结果是4.51e+07；
使用第二个命令：重新导入数据，直接计算所有地区、所有产业的总就业量 total emply ，得到的结果是4.56e+07。
您看我这样是否表达清楚问题了

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-15 06:39:00

修波发表于 2019-3-14 20:59
好的，老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令，先分组求和，得 ...

原则上，我尽量不下载别人资料。所以你若要问程序，永远附上相关资料；若附上资料，永远用 dataex 印出资料。
1. 先 ssc install dataex (并见说明)，将原始 Stata 资料中具有”代表性”的一部分资料列出，以供有意回答者实验之用，并能提供具体操作指令。
2. 请参考说明https://bbs.pinggu.org/thread-5048204-1-1.html。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-15 06:41:47

修波发表于 2019-3-14 20:59
好的，老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令，先分组求和，得 ...

如同我前面所讲，你底下所计算的观察值不一样 (你知不知道这点？)，结果一样才奇怪呢！

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-15 06:47:01

修波发表于 2019-3-14 20:59
好的，老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令，先分组求和，得 ...

我怎觉得你现在说的根最原先讲的又不太一样？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-15 09:11:13

黃河泉发表于 2019-3-15 06:47
我怎觉得你现在说的根最原先讲的又不太一样？

可能是我没表达清楚吧，我最开始是直接把所有命令都贴出来了，包括门类大类和门类小类，还有一些不相关的命令。现在为了把问题说清楚，我就只用了地区、产业分类和就业量三个变量，思路是没有变的。
现在的问题就是，老师您说我“所计算的观察值不一样 ”，但是我的理解就是，利用 duplicates drop 只是删除了分组求和后的重复值，剩下的 emp_city 是同一地区、同一产业下所有企业的就业量合集，依旧是所有企业就业量的总和啊，只是经过了两次求和而已啊。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-15 09:16:20

黃河泉发表于 2019-3-15 06:39
原则上，我尽量不下载别人资料。所以你若要问程序，永远附上相关资料；若附上资料，永远用 dataex 印出资 ...

嗯，好的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-15 09:46:20

修波发表于 2019-3-15 09:11
可能是我没表达清楚吧，我最开始是直接把所有命令都贴出来了，包括门类大类和门类小类，还有一些不相关的 ...

看看底下作法：

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-15 09:47:48

修波发表于 2019-3-15 09:16
嗯，好的。

两个结果一样：

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-15 11:00:00

黃河泉发表于 2019-3-15 09:47
两个结果一样：

嗯，验证了一下，老师发的命令是对的，我写的删除重复值的命令 duplicates drop class_xiao emp_city, force 缺少一个shi_id。非常感谢老师耐心指导，解决了我的困惑

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2019-3-15 11:06:07

修波发表于 2019-3-15 11:00
嗯，验证了一下，老师发的命令是对的，我写的删除重复值的命令 duplicates drop class_xiao emp_city, fo ...

终于水落石出，呵呵！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

修波

2019-3-15 11:18:45

黃河泉发表于 2019-3-15 11:06
终于水落石出，呵呵！

是啊，这得感谢老师不厌其烦的指导。我对命令的理解也一知半解，还得多学习

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群