现在我想做一组关于房贷违约的数据。原始数据如下
ID delinquency_status
1 0
1 0
1 1
1 2
1 3
1 4
1 5
1 0
1 1
2 0
... ...
假设delinquency_status等于3的时候就为真正违约(0为没有违约;1为违约30天;2为违约60天;3为违约90天;4为违约120天;但只有违约90天才定义为真正违约),我需要创立一个新的变量,假设为X。对于同一个ID的观察值,如果DS(delinquency_status)=0或者1或者2时,X=0;当DS=3时,X=1;且DS=3之后对于相同ID的观察值X=.(missing)。
因为不同ID的观察值都有几十万个所以手动是不可能的。
需要得出的结果是:
ID delinquency_status X
1 0 0
1 0 0
1 1 0
1 2 0
1 3 1
1 4 .
1 5 .
1 0 .
1 1 .
2 0 0
... ... ...
求大神们帮忙,小弟刚开始学习SAS捣鼓了半天都没有一点头绪。
拜谢!