悬赏 1 个论坛币 已解决
比如我有一个变量var执行:tab var, sort 命令之后得到var的频率表,且频数从大到小排列.
为了方便叙述,这里举一个简单的例子:
var Freq.
a 5
b 3
c 2
d 1
e 1
f 1
g 1
h 1
在这个例子里,defgh的频数都是1,我如何操作才能使tab表格不显示这些低频数的分组呢?
也就是说,我希望最后直接输出频数最高的几项,而不需要其他的结果,例如:
var Freq.
a 5
b 3
c 2
这样一来tab显示的行数就由原本的8行缩减到了3行
在实际操作中,我的变量var类别太多,直接使用tab var, sort命令的话输出的行数大概有4万多,stata会提示:【too many values】从而导致操作无法进行。
因此我想只输出频数最高的结果,请各位赐教。
如果不能够只输出频数最高的结果,也请各位告诉我如何才能解决【too many values】这一错误提示的方法。
最佳答案
夏目贵志 查看完整内容
bys var: egen count=count(var)
preserve
drop if count