全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
2058 4
2015-10-06

(本文为andruw原创,转载请注明出处)

很多时候,我们需要基于现有数据创建虚拟变量(dummy variable)或分类变量(categorical variable)。比如,我们拿到如下样本,需要按国家建立虚拟变量。

复制代码

生成该数据的代码:

复制代码

创建虚拟变量比较常见的有三种方法:

1.      使用generate命令

复制代码

2.      使用tabulate命令

复制代码

3.      使用xi(factor variable,即因子变量)

复制代码

创建分类变量比较常见的方法有:

1.      使用egen函数group

复制代码

2.      使用encode(同时还会生成数值标签)

复制代码



Stata tips & tricks帖子列表:

000. “吐槽”Stata

001. Reshape! Reshape!



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-10-6 18:15:36
提示: 作者被禁止或删除 内容自动屏蔽
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-6 20:18:31
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-10 10:20:01
很巧。今天有个同事问了一个关于effect coding的问题。我才第一次知道原来使用dummy还不是唯一的方法。作为对楼主的补充。请读者们参考一下http://www.ats.ucla.edu/stat/mult_pkg/faq/general/effect.htm
两种方法各有优势。但是本质上是一样的。按需选用就好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-10 14:16:03
夏目贵志 发表于 2015-10-10 10:20
很巧。今天有个同事问了一个关于effect coding的问题。我才第一次知道原来使用dummy还不是唯一的方法。作为 ...
恩,要针对具体问题选择最有效的方法。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群