立即打开
我在做面板数据回归时,遇到了两个问题,想请教各位。
我的因变量每个患者在各个随访年份的费用,自变量有年龄组、性别、基线期合并各个疾病的虚拟变量、随访期内合并各个疾病的虚拟变量(模型1)。考虑到我的因变量——费用是偏态分布的,我又尝试了对因变量费用取对数后进行回归(模型2)。由于我的自变量中有不随时间变化的变量,所以在随机效应模型和固定效应模型中,我选择了随机效应模型进行回归。我的问题是:
(1)我在决定是用不取对数的模型(模型1)还是取对数的模型(模型2)时,可以根据拟合优度判断吗?(我之前有在网上看到,“在随机效应模型中,三个 R2都不能像OLS中那样解释,仅作为一种参考,不具有实际意义,也无需解释”。)如果不可以的话,我应该根据什么判断呢?
(2)不知道什么原因,模型1和模型2的结果差异较大,比如:①模型1的常数项代表年龄[50,60)的男性患者不合并任何疾病的年费用是2217元,模型2的常数项为6.63,代表的也是年龄[50,60)的男性患者不合并任何疾病的年费用,是(e^6.63)元=757元;②模型1中除了“合并心梗的虚拟变量”取1,其他自变量取0时,代表的是年龄[50,60)的男性患者仅合并心梗的年费用是39,368元,取值相同的情况下,模型2的值为8.85,即同样情况的患者费用为(e^8.85)元=6,947元。不知道您觉得两个模型的结果差异的原因会是什么呢?不知道是不是跟费用的分布有关呢?(附件的两个图分别是取对数前后费用的分布情况(表头qfsje:未取对数,表头Inqfsje:取对数后)) 或者是我对最终结果的解读有问题?
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
相关推荐
栏目导航
热门文章
推荐文章
扫码加好友,拉您进群