全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1953 2
2014-05-01
首先有两种方法可以赋予字符型变量一定的编码,即group命令和encode命令*方法一 group命令*
inp str10 name
beijing
tianjin
hebei  
taiyuan  
end
format name %-10s
list
egen id=group(name)
list
相应的结果是
inp str10 name

name
1. beijing
2. tianjin
3. hebei  
4. taiyuan  
5. end

. format name %-10s

. list

+---------+
name   
---------
1.  beijing
2.  tianjin
3.  hebei   
4.  taiyuan
+---------+

. egen id=group(name)

. list

+--------------+
name      id
--------------
1.  beijing    1
2.  tianjin    4
3.  hebei      2
4.  taiyuan    3
+--------------+

*方法二 encode命令*
inp str10 name
beijing
tianjin
hebei  
taiyuan  
end
format name %-10s
list
encode name,gen(nameid)
label drop nameid
list

相应的结果是
inp str10 name

           name
  1. beijing
  2. tianjin
  3. hebei  
  4. taiyuan  
  5. end

. format name %-10s

. list

     +---------+
     | name    |
     |---------|
  1. | beijing |
  2. | tianjin |
  3. | hebei   |
  4. | taiyuan |
     +---------+

. encode name,gen(nameid)

. label drop nameid

. list

     +------------------+
     | name      nameid |
     |------------------|
  1. | beijing        1 |
  2. | tianjin        4 |
  3. | hebei          2 |
  4. | taiyuan        3 |
     +------------------+

我的问题是 为什么编码的顺序不是按照从小到大呢? 1 4 2 3 这是根据什么排序的呢?
谢谢大家~!希望大家能积极踊跃地探讨~~




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-5-1 16:36:22
tianjin按字母排列在最后。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-5-1 16:55:14
哦哦哦   谢谢  谢谢  我知道了
在encode和group命令之前 先sort下name  就可以得到从小到大的编码顺序了
谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群