全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
6153 4
2017-06-03
回归的时候总是出现omitted because of collinearity
然后就以为是变量共线性的问题,于是就各种变化变量的组合,依然每次只有一两个变量进入模型
其他的omitted because of collinearity
我的回归命令是
clogit choicechengdu dalian foshan guangzhou haerbin haikou handan hangzhou hefei jinankunming liuzhou nanchang nanjing nanning ningbo qingdao xiamen shanghaishaoxing shenzhen shenyang shijiazhuang suzhou taiyuan tangshan tianjin wuluwuxi wuhan xian xining yinchuan changsha chongqing zibo pgdp fdi third wageuniversity people1 people2 airport east rank government,group(id) nolog
pgdp之前都是目标选择城市,pgdp及以后是我想引入的变量
惊奇的发现变量在最前面一个的能进入模型,后面就omitted掉了,
于是我就做了试验,删去一个前面目标选择城市,这个时候前面两个变量进入模型
很神奇,好像发现了规律
所以我认为是前面目标城市的虚拟变量设置上除了问题,
[size=13.3333px]贴出一部分数据请大神指导

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-6-3 11:46:11
你的数据得多给一点。你现在这点就一个id,而且一个城市就一个观测值,你这一堆dummy全都会omit掉。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-3 17:01:44
夏目贵志 发表于 2017-6-3 11:46
你的数据得多给一点。你现在这点就一个id,而且一个城市就一个观测值,你这一堆dummy全都会omit掉。
我的数据太多了,一共是38个城市,也就是每一个企业的id对应的是38个城市,我做的是500强,就是500*38了,后面的数据格式差不多,只有choice变量下每个ID的选择是不一样的,
看您回复我感觉好像抓到了稻草,您所说的一个城市观测值是指什么呢
我的问题应该是出在了数据格式上,但是自己还没有看出来
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-4 00:21:04
kaikaixinxinfei 发表于 2017-6-3 17:01
我的数据太多了,一共是38个城市,也就是每一个企业的id对应的是38个城市,我做的是500强,就是500*38了, ...
大概明白你的意思了。我觉得这样的话你就不用每个城市放一个dummy了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-6-4 08:10:01
夏目贵志 发表于 2017-6-4 00:21
大概明白你的意思了。我觉得这样的话你就不用每个城市放一个dummy了。
感谢斑竹深夜回复
我也意识到是虚拟变量太多的问题,因为我做的是区位选择,就把涉及到的城市都包括了
如果删去一些城市会不会影响结果
另外我之前是有54个城市的,其中26个城市企业个数为1,回归结果不太好,后来就把着26个城市删了,结果还是不太好
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群