紧急求助！！！费用做因变量，取对数前后结果差异较大

1024

收藏 2019-07-18

我在做面板数据回归时，遇到了两个问题，想请教各位。
   我的因变量每个患者在各个随访年份的费用，自变量有年龄组、性别、基线期合并各个疾病的虚拟变量、随访期内合并各个疾病的虚拟变量（模型1）。考虑到我的因变量——费用是偏态分布的，我又尝试了对因变量费用取对数后进行回归（模型2）。由于我的自变量中有不随时间变化的变量，所以在随机效应模型和固定效应模型中，我选择了随机效应模型进行回归。我的问题是：

   （1）我在决定是用不取对数的模型（模型1）还是取对数的模型（模型2）时，可以根据拟合优度判断吗？（我之前有在网上看到，“在随机效应模型中，三个 R2都不能像OLS中那样解释，仅作为一种参考，不具有实际意义，也无需解释”。）如果不可以的话，我应该根据什么判断呢？
   （2）不知道什么原因，模型1和模型2的结果差异较大，比如：①模型1的常数项代表年龄[50,60)的男性患者不合并任何疾病的年费用是2217元，模型2的常数项为6.63，代表的也是年龄[50,60)的男性患者不合并任何疾病的年费用，是(e^6.63)元=757元；②模型1中除了“合并心梗的虚拟变量”取1，其他自变量取0时，代表的是年龄[50,60)的男性患者仅合并心梗的年费用是39,368元，取值相同的情况下，模型2的值为8.85，即同样情况的患者费用为(e^8.85)元=6,947元。不知道您觉得两个模型的结果差异的原因会是什么呢？不知道是不是跟费用的分布有关呢？（附件的两个图分别是取对数前后费用的分布情况（表头qfsje：未取对数，表头Inqfsje：取对数后））或者是我对最终结果的解读有问题？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群