stata中怎么按照两个变量来分组，为什么用statsby命令不行！！

求知的凯蒂

10856

收藏 2018-10-31

各位大神，又要请你们帮忙了，例如编号为1011100的产品数据观测值相同的有很多，但根据其来源地不同，如来自美国，加拿大和日本则将其分为3种产品，怎么用stata命令，用egen=

stata求助.dta
大小:(12.06 KB)

马上下载

group好像只能根据一个变量，也用了这个命令statsby group=r(N), by( v4 v25 )，其中v4 v25 是产品编号和来源地，但命令始终是错的，，help statsby 感觉不能用，很急，试了好几天都不行

，计量小白请各位大神帮帮忙，在这里谢谢大神们了

. dataex in 1/100

----------------------- copy starting from the next line -----------------------

复制代码

------------------ copy up to and including the previous line ------------------

Listed 100 out of 1832500 observations

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

黃河泉

2018-10-31 16:23:07

编号为1011100的产品数据观测值相同的只有两个！你要的结果是长什么样子？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

求知的凯蒂

2018-10-31 16:38:14

黃河泉发表于 2018-10-31 16:23
编号为1011100的产品数据观测值相同的只有两个！你要的结果是长什么样子？

黄老师您好，是这样的，就是说编号为1011100的产品有两个，但分别来自于美国和日本，我就想把他们按来源地分成两种产品，group 1 2，接下来如果有编号为1011101的产品三种，都来自加拿大，就group 3，视为第三种产品，以此分种类。文字表达能力不好，，望老师见谅，请黄老师赐教

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2018-10-31 16:53:50

求知的凯蒂发表于 2018-10-31 16:38
黄老师您好，是这样的，就是说编号为1011100的产品有两个，但分别来自于美国和日本，我就想把他们按来源地 ...

请先安装 ssc install runby 并试试 (希望没有误解)

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

求知的凯蒂

2018-10-31 17:47:00

黃河泉发表于 2018-10-31 16:53
请先安装 ssc install runby 并试试 (希望没有误解)

首先很感谢黄老师忙里帮忙，您的命令可以对相同编号的产品进行分组排序，比如1011100产品有两个，分别来自日本和俄罗斯就分组排序1,2；然后对下一个编号1011900 分别来自美国，加拿大，香港，荷兰，荷兰，再重新标记分组排序1,2,3,4,4，那怎样把所有产品都叠加，使下一个编号即1011900的产品直接在1011100产品基础上标号为3,4,5,6,6。不要再区分产品编号的命令。谢谢黄老师，感觉这些天的努力不过黄老师的一点小小的指教，感激！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

黃河泉

2018-10-31 17:50:03

求知的凯蒂发表于 2018-10-31 17:47
首先很感谢黄老师忙里帮忙，您的命令可以对相同编号的产品进行分组排序，比如1011100产品有两个，分别来自 ...

这个更简单，

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

求知的凯蒂

2018-10-31 18:11:26

黃河泉发表于 2018-10-31 17:50
这个更简单，

哇哇哇，啊啊啊，谢谢黄老师，替我解决了困扰好几天问了好多人的问题了，谢谢黄老师！又学了一个知识，真棒！黄老师，ranby与statsby命令用法广泛吗？感觉要学的很多，再次谢谢黄老师黄大牛！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

xcj520

2018-11-1 10:37:24

qq3262369478讨论

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

赵安豆

2024-12-5 22:51:23

在Stata中，根据两个或更多变量进行分组并执行特定操作（如生成汇总统计量）的常用命令是`by:` 或者 `bysort:` 结合所需的函数。但是当你提到 `statsby` 命令时，你的用法基本是对的，但是这个命令在Stata 15及以后的版本中已经被标记为过时。尽管如此，在某些情况下它仍然可以工作。

然而，你想要做的事情更直接的方法是使用`bysort:` 结合 `egen` 或者直接计算你需要的统计量。例如，如果你想要对每种组合的产品编号和来源地进行计数，你可以这样做：

```stata
* 假设你的数据已经被正确读入了。
bysort v4 v25: egen group_count = count(v4)
```

这样 `group_count` 变量就会包含每个`v4`和`v25`组合的数量。如果你想基于这些组生成其他统计量，比如平均值、中位数等，可以使用相应的 `egen` 函数。

如果你在尝试使用 `bysort:` 和 `egen` 时遇到问题，请确保你的数据是按照你感兴趣的变量排序的：

```stata
sort v4 v25
```

然后再进行操作。这将确保 `by:` 或 `bysort:` 命令按正确的顺序处理组。

如果你的目的是创建一个唯一的组合编号来标识每个`v4`和`v25`的不同组合，你可以使用以下命令：

```stata
egen groupID = group(v4 v25)
```

这样，`groupID` 将会是一个整数变量，其中每个不同的 `v4` 和 `v25` 组合对应一个唯一的数字。这在数据分析中非常有用，特别是当你需要基于这些组合进行进一步的分析或合并数据时。

希望这个解释能帮到你！如果有更具体的问题或者遇到错误，请提供详细的错误消息和你的代码片段，这样我可以给出更精确的建议。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群