应用场景描述:
客户的购物清单数据:
1. 现在每个客户一张表,假设以data0037861 (数字为客户ID)分别命名。
2. 客户数量是在不断增加的,因此所有客户的数据表 data0000001 -- datan,其中的n是在不断变化的。
3. 每个客户表中,存储的主要信息包括 交易时间(tractime)、goods(商品名称,以逗号分隔,文本形式放在一起)等。因时间的变化,因此每个客户的数据是动态变化的。
应用分析需求:
1. 指定某个时间段,比如2012年11月11日到2012年12月12日,要求分析生成这个时间段内,交易的所有商品的客户覆盖比例表。举例说明:如果其中有“牛奶” 这个商品,分析发现这段时间有82.6%客户买过牛奶,那么“牛奶”的客户覆盖比例就是82.6%。
程序要点:指定时间点、多张表格(每个客户一张)、动态交易数据、找出所有的交易商品名,计算百分比。
拿出200论坛币,一点小小心意,希望各位老鸟、能人,提供分析思路及SAS code样例,希望能满足高效的需求,实现实时分析,迅速处理巨大的数据。
谢谢了先!