请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
这是因为stata严格按分位数分组。
当观测值等于某一分位数的情况有很多时,每组的份额便可能不均等了。
简单说,按分位数分组并不总等价于n等分组。
所以结果是对的,并没有进行处理的必要,对么?
sort yg sh=_n/_Ng q5=0forv i=1(1)5{replace q5=`i' if sh<=`i'/5&sh>(`i'-1)/5}drop sh
*根据q5可得到关于y的五等分组
[此贴子已经被作者于2009-3-11 22:50:36编辑过]
另一种方法,使用 group() 函数:
. sysuse auto, clear
. sort price
. gen g5 = group(5)
. tab g5
g5 | Freq. Percent Cum.------------+----------------------------------- 1 | 15 20.27 20.27 2 | 15 20.27 40.54 3 | 14 18.92 59.46 4 | 15 20.27 79.73 5 | 15 20.27 100.00------------+----------------------------------- Total | 74 100.00
但是这样的话, 好像有可能同样大小的观测值被分到两个组里面ba