yongyitian 发表于 2009-3-19 21:56 
看看是这样吗?data lizzie; input id $5. @7 entr $1. money;datalines;10001 a 2310001 b 11 ...
您好,在论坛上看见您的帖子太开心了,我也遇到了相似的难题。特向您请教~~
我的数据是医院报销数据,每一条数据中有很多变量,其中之一是诊断(diagn)。数据结构如下:
year county name age address diagn expen los....
2012 1 x1 23 xxxxxx 分娩 1234 7
2012 1 x1 56 xxxxxx 肺炎 1234 7
2013 1 x1 47 xxxxxx 分娩 1234 7
2012 1 x1 23 xxxxxx 胃癌 1234 7
2012 1 x1 25 xxxxxx 阑尾炎 1234 7
2012 1 x1 28 xxxxxx 分娩 1234 7
2012 1 x1 28 xxxxxx 肺炎 1234 7
2012 1 x1 23 xxxxxx 胃癌 1234 7
2012 1 x1 23 xxxxxx 胃癌 1234 7
我想实现的是:
1.将诊断按照频数从大到小排序,有"编号+频率+累计频率"这几个结果,不知应该如何实现?
下例中的结果想要输出为
编号 diagn
N fre af
1 分娩 4
40%
40%
2 胃癌 3 30% 70%
3 肺炎 2 20% 90%
4 阑尾炎 1 10% 1
2. 在stata中,按照编号替换diagn为diagn1
我想要的结构是
year county name age address diagn
diagn1 expen los....
2012 1 x1 23 xxxxxx 分娩 1 1234 7
2012 1 x1 56 xxxxxx 肺炎 3 1234 7
2013 1 x1 47 xxxxxx 分娩 1 1234 7
2012 1 x1 23 xxxxxx 胃癌 2 1234 7
2012 1 x1 25 xxxxxx 阑尾炎 4 1234 7
2012 1 x1 28 xxxxxx 分娩 1 1234 7
2012 1 x1 28 xxxxxx 肺炎 3 1234 7
2012 1 x1 23 xxxxxx 胃癌 2 1234 7
2012 1 x1 23 xxxxxx 胃癌 2 1234 7
期待您的指导与回复~