全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3301 3
2011-06-14
没有系统学过stata,论文用logit模型,数据来自问卷,很多缺失值,很多自变量。问卷的有些自变量是相似的,想把那么多变量合并成几组,来检验这几个因素对因变量的解释情况。
请问这个该用因子分析还是聚类分析?我只是想简单的把一些变量分个组。。
PS,这种分析如果要应用到panel data是否可行?

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-6-14 21:27:40
根据  理论和常识来确定变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-17 15:58:54
2# 蓝色
谢谢版主,我已筛选至38个自变量。。。
可是有些问题,比如有5个变量是这样的数据
1.你认为你活到75岁的概率有多大
2.你认为你活到80岁的概率有多大
3.你认为你活到85岁的概率有多大
4。你认为你活到90岁的概率有多大
5.你认为你活到100岁的概率有多大

这都是关于longevity的自我评估,我该如何处理这样的5个相关的变量呢?需要做聚类/因子分析么?

求解答,谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-6-17 16:41:41
我个人觉得,先不用那么急。
单就数据来自问卷,很多缺失值 这一句话,就很值得探索。

当您依据蓝色版主的那句 "根据  理论和常识来确定变量"
同时经过您专业的经济素养,筛选至38个自变量。
那么,先看看这些变数的叙述统计吧! 首先确定,有没有违反您的直觉。
再则,当这些变数同时被考虑进去模型时,您造成的missing值个数有多少个。
譬如A及B与C三个变数,您未来打算放入模型,那A与B及C有各自的缺失值,
放入模型后,通常进行的,会是min{A,B,C}三者最小无缺失值的个数。

简言之,因为Missing value的问题,最后,您要从最简单的叙述统计,
去探讨有无违反直觉,有无丧失样本的代表性。 【这是最基本,但也最容易被质疑的地方】
如果没有丧失,再接着去探讨后续的研究问题吧!

当然,现代有关Missing值得处理,已发展成一门学问,
而stata的手册 [MI] 也进行了部份探讨与介绍。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群