全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1246 5
2014-10-23
悬赏 15 个论坛币 已解决
是关于数据分组的问题。我想实现这样一个目标:
现在有count和hhi两个变量,我想对其进行分组,目的是找到这两个变量都高的以及都低的那些极端值(究竟是分两组还是三组呢?也还要大家指点),都高的和都低的总共有两个组,其中一个组里的样本赋值1,一个组里的样本赋值0,也就是不用这两个指标的具体值来计算,而是根据分组构建一个虚拟变量来分析。

求各位高人了。我的币也不多,以示感谢

最佳答案

ermutuxia 查看完整内容

照你的意思可以生成2个虚拟变量,一个是都高,一个是都低。其他作为对照组。你可以根据count和hhi生成count1 hhi1两个变量,这两个变量取值都为1 2 3 4就是用四分位数将count和hhi每个变量分为四组,1 2 3 4,count1和hhi1都取1时表示都小 都取4时表示都大。这是基本思想
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-10-23 15:05:27
照你的意思可以生成2个虚拟变量,一个是都高,一个是都低。其他作为对照组。你可以根据count和hhi生成count1 hhi1两个变量,这两个变量取值都为1 2 3 4就是用四分位数将count和hhi每个变量分为四组,1 2 3 4,count1和hhi1都取1时表示都小 都取4时表示都大。这是基本思想
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-24 12:19:35
先分为四组分别赋值1、2、3、4,然后再生成虚拟变量,如果都等于4的则赋值1,如果都等于1的则赋值0?
这样应该可以。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-24 12:36:23
sort hhi
xtile hhi1=hhi, nq(4)
sort count
xtile count1=count, nq(4)
gen dum=1 if hhi1=4 & count1=4
replace dum=0 if hhi31=1 & count1=1


请大家帮我修改修改!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-24 15:26:12
谁来帮我看看啊,在线等。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-10-24 16:22:49
好吧,虽然我水平较差,但还是摸索了一点出来,不知道是不是正确的,但好像满足我的要求了,供参考:
set more off
set mem 128
clear
use modellast
sort hhi_v8
xtile hhi1=hhi_v8, nq(3)
sort inssum
xtile inssum1=inssum, nq(3)
gen dum=1 if hhi1==3&inssum1==1
replace dum=0 if hhi1==1&inssum1==3
save dummy,replace
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群