10000501
27
27.6
187
3.9
201
9.1
218
3.5
249
3.6
270
274
8.3
292
35.7
322
2.3
333
7.9
343
36
434
4.4
476
486
5
504
10.2
508
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
zhangzachary 发表于 2012-2-6 14:45 如果表里没有那天realday的值怎么处理?还是这个表是每天都记录的?
zhangzachary 发表于 2012-2-6 14:44 你想要的是什么样的结果? 比如,输入301(第301天),然后计算从第(301-26*7)天开始到第300天的spendin ...
carol1222 发表于 2012-2-6 14:54 spending的值都有的,没有缺失值。如果缺失,当做0处理。
zhangzachary 发表于 2012-2-6 15:07 spending的值好处理,那么realday呢?是每天都有,还是说只需要将在301-26*7+2到300之间存在的realday值的 ...
carol1222 发表于 2012-2-6 15:22 您有解了吗?
zhangzachary 发表于 2012-2-6 15:30 最好把最后realday bfday afday那里的symget变成symgetn,虽然不会影响结果,不过考虑到变量类型和让log规范 ...
zhangzachary 发表于 2012-2-6 15:26
carol1222 发表于 2012-2-6 15:35 还有个问题,ID是有多个不同的ID的,那么我在最后的output数据集里面需要把他们都列出来,应该怎么办呢?
zhangzachary 发表于 2012-2-6 16:31 不好意思初始数据a多复制了一次……主要参考之后的程序~
carol1222 发表于 2012-2-6 17:25 我又来问题了,是这样的。我的数据集一共有40多万条这样的信息。我发现,如果我这样一条条的跑,他每次都 ...
zhangzachary 发表于 2012-2-6 17:42 由于realday不是连续的,所以我感觉很难优化程序,似乎必须每次计算都要扫一遍数据集。这个code不算难看的 ...
carol1222 发表于 2012-2-6 18:04 嗯~~~我觉得是挺好的~~ 我还有个问题哦。其实,这里是母体;
zhangzachary 发表于 2012-2-6 18:26 这个可以用前面那个macro把需要比较的几条记录放到一起就可以了。下班了,明天再来~
carol1222 发表于 2012-2-7 13:57 问题是~~~我需要比较的有400多万条,而总数据有700多万条。。所以。。
zhangzachary 发表于 2012-2-7 14:17 那就用后面那个生成所有结果,然后再用data step筛选一下。或者先筛选好再用macro,注意一些小节修改就行 ...