全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 学道会
1437 1
2019-08-21
复习一下自己做的笔记,比较乱

1.想在stata中做一个logistic回归,应变量为Y(结局变量,二分类),
自变量有X1,X2,×3等等,假设其中X1表示的是受教育情况,取值
有:1=低等教育,2=中等教育,3=高等教育。想把“低等教育\\\"这一
层次作为referent,让后面两层次分别与其相比,得出OR值!请问高
手,该如何操作??
注:是在stata软件中实现!!xi : logistic y i.x1  x2  x3


2.怎么在stata中使用逐步回归法消除多重共线性?

输入命令sw reg depvar indepvarsdepvar是自变量indepvars是你的一些因变量
最好先检验到底是否存在共线性

3.多重共线性检验:
第一种方法:方差膨胀因子检验法: estat vif若输出结果中最大的vif值大于10则说明存在共线性,若小于等于10则说明可以不去考虑
第二种方法:相关系数矩阵法: corr X1 x2 x3 .X为解释变量;如果结果中数值的绝对值大于0.8则说明这两个解释变量存在共线性,若小于0.8则不能证明不存在共线性(注意)。
多重共线性的处理: stewise,pr(显著性水平,如0.05 , 0.01 , 0.1等) : req YX1 x2 x .V为被解释变量, X为解释变量。或者用差分法处理


单因素logistic回归和卡方也可以说是一样的,那从实用角度来看,单因素logistic回归是说明自变量对因变量的影响,Pearson卡方其实从广义上来讲,也是说两个变量的关联,而且一般也是区分主次的(但也可以不区分)。因为卡方一般那都同时显示两组例数和比例,用单因素logistic回归,则只能给出参数估计结果。

卡方检验 tab y x, chi2                     皮尔森检验   cor x y


***有序变量,但发现未通过平行线检验,因此使用无序多分类Logistic模型。


有序多分类的Logistic回归模型中,必须对自变量系数相等的假设进行检验(又称平行线检验)。如果不满足平行线假设,则考虑使用无序多分类Logistic回归或其他统计方法。


stata做“平行线检验”可以用brant,需要安装spost9(written by Long and Freese)可以搜索一下。findit
spost9。



优势比:OR  发生率与未发生率之比。即阳性率/阴性率。

RR(相对危险度relativerisk):表示暴露组与非暴露组发病率(或死亡率)的比值。也称为危险比(risk ratio)。反映了暴露与疾病发生的关联强度。

线性诊断方法在logistic回归的共线性诊断方面也同样适用。通过比较各种诊断方法,方差膨胀因子、容许值、特征根分析系统比较适合在医学研究中使用,既操作方便,又能够得到比较全面的结果,

分类变量主要采用pearson卡方检验,连续变量主要采用方差分析



logit内生性问题
help cmp

二值选择模型内生性检验方法、步骤及Stata应用---文献袁微
横截面与面板数据的计量经济分析

数据的集中性特征(平均值)和波动性特征(标准差值),以了解数据的基本情况。方差这一概念的目的是为了表示数据集中数据点的离散程度
sig值通常用 P>0.05 表示差异性不显著;0.01<P<0.05 表示差异性显著;P<0.01表示差异性极显著。(“p<0.01,“p<0.05,‘p<0.1;括号内为稳健标准误)

由于标准的probit模型或者logit模型的扰动项是服从同方差假设的,但是很多回归模型是存在异方差的。这时可以使用Stata进行“似然比检验”(LR)来检测异方差的存在。   mLE极大似然估计
                            共线性  内生性   数据验证   结构方程
多重共线性(Multicollinearity)是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

多重共线性使参数估计值的方差增大,1/(1-r2)为方差膨胀因子(Variance Inflation Factor, VIF)如果方差膨胀因子值越大,说明共线性越强。相反 因为,容许度是方差膨胀因子的倒数,所以,容许度越小,共线性越强。可以这样记忆:容许度代表容许,也就是许可,如果,值越小,代表在数值上越不容许,就是越小,

解决方法编辑
(1)排除引起共线性的变量。
找出引起多重共线性的解释变量,将它排除出去,以逐步回归法得到最广泛的应用。
(2)差分法。
时间序列数据、线性模型:将原模型变换为差分模型。
(3)减小参数估计量的方差:岭回归法(Ridge Regression)
  
   内生性
内生性问题:就是模型中的一个或多个解释变量与随机扰动项相关译的问题。变量的内生性问题总
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-8-21 11:36:24
学习笔记奖!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群