全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
8845 3
2010-01-29
悬赏 10 个论坛币 未解决
我做一个关于教育投资回报的论文,已有二手数据,别的机构搜集的,是个让湖北部分高校毕业生填的调查问卷,样本为700多。
Y1:
大学毕业第1年收入,
Y2:
3年收入
Y3:
5年收入,以上三个都是数值型,基本都是1000以上

我的X变量涉及三部分内容,一部分是学生的家庭背景(有4X变量反映),另一部分是大学的作用(也有4X变量表现),还有一部分是求职渠道(也有4个变量);
难道用12个变量一起作用于那三个Y吗?
需要怎么处理X变量自己的内部关系呢?比如很明显大学的表现会和家庭背景相关,还有好多X变量自己内部的相关。

这些变量的问题选项有三种类型,
一是0-1 (是或否)
二是1-4型(好,还行,一般,不好)
三是直接填大数字的,比如收入(1000以上),比如高考分数(200以上)

我对模型的想法有如下
1LogisticRegression, 因为我有些X变量是
01)的,做多元回归的话,怕不显著,X变量实在太多了,12个。Logistic这个模型合适吗
2StructuralEquation Model (SEM), 画出比较复杂的相关结构图,这个比较麻烦的是STATA不能做,只能用其他软件,比如AMOS做。SEM这个模型合适吗
大家觉得还有什么模型适合我这个研究呢

不甚感激!!!!!1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-1-29 21:22:13
你的这些指标如果单纯做回归估计效果不好
因为“一部分是学生的家庭背景(有4个X变量反映),另一部分是大学的作用(也有4个X变量表现),还有一部分是求职渠道(也有4个变量)”他们之间都是高度相关的
建议先进行因子分析,可以用SPSS或者stata
提取出关键因子再做回归就好了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-1-30 14:49:47
chenxiaoliang22 发表于 2010-1-29 21:22
你的这些指标如果单纯做回归估计效果不好
因为“一部分是学生的家庭背景(有4个X变量反映),另一部分是大学的作用(也有4个X变量表现),还有一部分是求职渠道(也有4个变量)”他们之间都是高度相关的
建议先进行因子分析,可以用SPSS或者stata
提取出关键因子再做回归就好了
可是我想看一下家庭背景,大学作用,求职渠道这三个X变量哪个对Y变量,即大学毕业生教育投资回报的影响更大。因子分析的话就是比如“家庭背景"4个变量通过因子分析可以转出主因子,然后删掉1-2个不是太相关的变量对吗?这样"家庭背景"就只由1-2个变量决定?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-9-2 15:37:25
在你的研究中选择使用Logistic Regression或是Structural Equation Model(SEM),关键在于你想要探究的问题类型和数据的性质。

1. **关于Logistic回归:**Logistic回归适用于二分类因变量预测问题。但是,在你的案例中,Y1、Y2、Y3都是数值型变量,代表收入水平,并不适合用Logistic回归模型来分析。尽管某些X变量可能是0-1二元变量,但这并不意味着整个模型应该使用Logistic回归。在这种情况下,多元线性回归或更复杂的模型可能更为合适。

2. **关于Structural Equation Model (SEM):**如果你的目标是探索多个概念之间的复杂关系,并且你认为这些概念之间存在因果路径或是中介效应和调节效应,那么结构方程模型(SEM)可能是更好的选择。SEM可以处理变量间的相关性、共线性和潜变量问题,同时允许你测试复杂的假设结构。

### 推荐建议:

- **先进行探索性数据分析:**在决定具体使用哪种统计方法之前,对数据进行深入的探索是非常重要的,这包括检查变量之间的关系(如使用散点图或热力图查看相关性)、处理缺失值、异常值以及进行必要的变换等。

- **考虑使用SEM:**鉴于你提到X变量之间存在复杂的相关性和可能的因果路径(例如,“大学表现”与“家庭背景”的关系),建议考虑使用结构方程模型。这种模型可以同时评估多个假设,并允许你通过建立潜变量来处理概念上的抽象性,这在研究教育投资回报这类复杂问题时非常有用。

- **处理X变量内部关系:**SEM的一个优点就是它能够直接处理和测试变量之间的关系,包括中介、调节作用等。你可以构建路径图(Path Diagram),明确指出哪些变量是直接效应、间接效应还是共同影响最终结果的变量。

### 实际操作:

在实际应用中,你可能需要使用统计软件如SPSS AMOS, Mplus, R中的lavaan包或其他SEM专用软件来实现模型的构建和估计。确保你的理论假设清晰,并且在设计模型时考虑到数据的特点和研究目的。

最后,在选择任何分析方法之前,请务必详细阅读相关文献,理解每种技术的应用场景及其限制条件,这将帮助你做出更加合理、科学的研究决策。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群