zerofung 发表于 2017-2-11 19:56 
初步想法是这样的,
library(tidyverse)
data %>% group_by(id,disease) %>% #是按患者和病种分组
谢谢回复!!非常感谢你在我只言片语中能完全弄清楚我的问题!
样本数据(sample_211.xls)已经上传到本帖中,但是只是一小部分样本,有可能没有同患者因同病种多次住院的情况,但是对于您了解数据情况和编写程序应该够了。
还有几个问题想请教:
1. arrange(id,disease,time1) 时间数据可以arrange排序吗?我运行的时候总是报错“Error in UseMethod("arrange_") : no applicable method for 'arrange_' applied to an object of class "function"”
2. filter之后是相当于新生成了一个数据集,还是在原始数据的基础上进行了更改呢?若患者同病种只入院一次,那暂且判断患者治疗有效,也就是对应的outcome的值是good。outcome的数据(包括有效和无效的病例)是要在后续分析中使用的,所以需要在原始数据data中进行更改,而不是生成一个只包含n>2的数据集。
3. 日期数据as.Date 之后不能直接加减运算吗?如果用lubridate包,能不能说具体点怎么用呢?是要跟mutate函数和lag函数整合使用吗?
我也是最近刚学习R,有很多不明白的地方,请多多指点,谢谢啦!终于看到可行的曙光了~谢谢~