caozhaowen 发表于 2020-2-2 15:01 
我是用你网页上文件粘到excel中然后读入做的。不知你str_detect(string=data_web[20,],pattern = "Progress ...
多谢!数据已传到网盘,链接: https://pan.baidu.com/s/13ljnN0I4oFfpcz0_wDLP_g 提取码: fe2u
请用read.table读取txt文件吧。将13-15这3列数据合并在新建的Outcome列,新规则(改了原来考虑优先级的第3条)如下:
1.认为Unknown与Not Available同义,并且级别最低,如果某一行数据在三列中不同,取Unknown或Not Available以外的某列数据。
2.如果Unknown或Not Available与Complete Remission/Response、Partial Remission/Response、Stable Disease、Progressive Disease等值在某一个格子内同时出现,认为是原始记录错误,忽略Unknown或Not Available。
3.如果三列中有两列一致,另一列不一致,认为不一致的可能是记录错误,取两列一致的值(Unknown与Not Available除外),例如:Complete Remission/Response、Not Applicable、Not Available,取Complete Remission/Response;Partial Remission/Response、Complete Remission/Response、Partial Remission/Response,取Partial Remission/Response。如果三列完全不一样(认为Unknown与Not Available一样),赋值为DEL或系统允许的表示删除的值,例如83行的Complete Remission/Response、 Partial Remission/Response、 Not Available,无法判断前两个值哪一个正确。
4. Outcome列中的结果都用简写吧: Complete Remission/Response简写为CR、Partial Remission/Response简写为PR、Stable Disease简写为SD、Progressive Disease简写为PD。
您所建议的,我执行后结果如图,都是3个FALSE,但相应的行是有相应的pattern的