全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
980 0
2019-07-18
我在做面板数据回归时,遇到了两个问题,想请教各位。
       我的因变量每个患者在各个随访年份的费用,自变量有年龄组、性别、基线期合并各个疾病的虚拟变量、随访期内合并各个疾病的虚拟变量(模型1)。考虑到我的因变量——费用是偏态分布的,我又尝试了对因变量费用取对数后进行回归(模型2)。由于我的自变量中有不随时间变化的变量,所以在随机效应模型和固定效应模型中,我选择了随机效应模型进行回归。我的问题是:

      (1)我在决定是用不取对数的模型(模型1)还是取对数的模型(模型2)时,可以根据拟合优度判断吗?(我之前有在网上看到,“在随机效应模型中,三个 R2都不能像OLS中那样解释,仅作为一种参考,不具有实际意义,也无需解释”。)如果不可以的话,我应该根据什么判断呢?
     (2)不知道什么原因,模型1和模型2的结果差异较大,比如:模型1的常数项代表年龄[50,60)的男性患者不合并任何疾病的年费用是2217元,模型2的常数项为6.63,代表的也是年龄[50,60)的男性患者不合并任何疾病的年费用,是(e^6.63)元=757元;模型1中除了“合并心梗的虚拟变量”取1,其他自变量取0时,代表的是年龄[50,60)的男性患者仅合并心梗的年费用是39,368元,取值相同的情况下,模型2的值为8.85,即同样情况的患者费用为(e^8.85)元=6,947元。不知道您觉得两个模型的结果差异的原因会是什么呢?不知道是不是跟费用的分布有关呢?(附件的两个图分别是取对数前后费用的分布情况(表头qfsje:未取对数,表头Inqfsje:取对数后)) 或者是我对最终结果的解读有问题?
屏幕快照 2019-07-17 下午5.26.00.png 屏幕快照 2019-07-17 下午5.25.41.png


















二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群