全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2741 20
2016-12-03
我现在有一个数据集,是一个1000病人的部分数据,如下:
id          time                              PaO2         outcome
1     2016/02/03 14:23:00           78            die
1     2016/02/03 15:24:00           89
1     2016/02/03 18:44:00           90
1     2016/02/04 08:23:00           77
1     2016/02/04 12:33:00           100
1     2016/02/05 09:12:00           108
1     2016/02/06 14:25:00           103
2     2016/03/12 13:26:00           100           live
2     2016/03/12 15:35:00           99
2     2016/03/13 17:46:00           98
3     2016/03/03 16:23:00           109           die
3     2016/03/03 19:55:00           95
3     2016/03/04 20:25:00           93
3     2016/03/04 14:23:00           87
3     2016/03/04 17:20:00           113
4     2016/02/08 14:23:00           106           die
4     2016/02/08 15:24:00           80

...           ...                   ...           ...

其中,id为病人编号,time为记录时间,PaO2为病人血氧分压,outcome为病人最终的结局。现在我想研究病人的PaO2和病人死亡概率之间的关系,应该怎么做呢?因为PaO2的值和时间相关,且每个病人id对应了不同数量的PaO2的值,这样的话应该采取什么样的方法呢?


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-12-3 17:20:00
结果为二值变量,做logistic回归就好
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-3 19:48:28
飞天玄舞6 发表于 2016-12-3 17:20
结果为二值变量,做logistic回归就好
但是PaO2怎么处理呢?每个病人都有多个PaO2值,总不能将每个病人的PaO2值取均数吧?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-3 21:46:56
这个是非平衡的面板数据,可以将每个 id-time-outcome 视为一个样本,outcome对PaO2回归,并在回归中加入 id和时间 虚拟变量来控制
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-3 22:04:45
clarencelin 发表于 2016-12-3 21:46
这个是非平衡的面板数据,可以将每个 id-time-outcome 视为一个样本,outcome对PaO2回归,并在回归中加入 i ...
可是每个病人PaO2的记录时间都不一样,而且每个病人的PaO2值得数量也不同,可以用这种方法么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-4 14:12:05
lanhong1993 发表于 2016-12-3 22:04
可是每个病人PaO2的记录时间都不一样,而且每个病人的PaO2值得数量也不同,可以用这种方法么?
记录有无规律?比如接受治疗后多长时间
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群