各位专家、老师和同学们大家好,入驻经管之家这么长时间,受益匪浅,这段时间用Logit模型做了一篇论文,虽然自己还处于入门阶段,但还是想将自己的一些学习的收获和大家分享,希望各位专家、老师和同学们批评指教~~~
1.数据要求:
Logit模型和Probit模型一样,因变量要求必须为二分类变量。也就是说,要用这个模型,被解释变量必须是0、1这种变量。
2.模型构建:
本人的数理基础必要薄弱,无法给大家分享太多干货,但给大家分享了两个介绍Logit模型的文件,这两个文件个人认为对Logit模型的解释较为清晰明了,应该能给大家提供一点点帮助。
3.软件操作:
本文是使用的Stata16版本进行的实操。关于Logit模型的使用,在我目前有限的认知里,已有论文里大概分为两类。
(1)回归分析:
第一类是回归分析,这一类的Stata的操作命令是:logit y x1 x2 控制变量。这种基础回归,主要是用于研究解释变量对被解释变量的作用方向及显著性。例如,解释变量对被解释变量具有显著的正向/负向影响,在1%、5%、10%的水平下显著。
补充:这种回归也可延伸为分组回归。例如:将样本按农村和城市、性别等进行分组回归。
(2)边际效应:
第二类是求边际效应。求边际效应可以看出解释变量影响被解释变量的真实效度,即在其他条件不变的情况下,由解释变量变化引起的被解释变量的概率变化。求边际效应有很多类型,命令也各不相同。在我目前有限的认知里,一般是求各变量处于均值处的边际效应。
Stata的命令为:margins,dydx(*)post
对于边际效应的结果解读,在我已阅览的论文中,一般是在其他条件不变的情况下,解释变量每增加1单位,被解释变量发生的概率增加/减少/变化多少。
4.一些心得杂谈:
下面这部分就是我在实际操作中一些新的所想,就写到哪里算哪里吧。
(1)数据处理方式:
在跑数据过程中,难免遇到结果不显著的情况,这种情况,一般需要我们更换变量或者更换数据处理方式。
一般来说,对于一些例如贷款金额、存款等变量,可以使用取对数、缩尾(一般1%-5%缩尾)等处理方式。
对于一些使用标准化处理后还不显著的变量,可以使用归一化处理再试试。
(2)注意事项:
在实际操作过程中,被解释变量同时存在分类变量和连续变量时,分类变量和连续变量不能在结果解读时进行比较。
时间原因,就先写到这里,以上仅代表我的个人浅显的认知,难免会出现错误,希望大家多批评指正!
附件列表