全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1175 3
2012-12-19
悬赏 200 个论坛币 未解决
应用场景描述:
客户的购物清单数据:
    1. 现在每个客户一张表,假设以data0037861 (数字为客户ID)分别命名。
    2. 客户数量是在不断增加的,因此所有客户的数据表 data0000001 --  datan,其中的n是在不断变化的。
    3. 每个客户表中,存储的主要信息包括 交易时间(tractime)、goods(商品名称,以逗号分隔,文本形式放在一起)等。因时间的变化,因此每个客户的数据是动态变化的。

应用分析需求:
    1. 指定某个时间段,比如2012年11月11日到2012年12月12日,要求分析生成这个时间段内,交易的所有商品的客户覆盖比例表。举例说明:如果其中有“牛奶” 这个商品,分析发现这段时间有82.6%客户买过牛奶,那么“牛奶”的客户覆盖比例就是82.6%。

程序要点:指定时间点、多张表格(每个客户一张)、动态交易数据、找出所有的交易商品名,计算百分比。

拿出200论坛币,一点小小心意,希望各位老鸟、能人,提供分析思路及SAS code样例,希望能满足高效的需求,实现实时分析,迅速处理巨大的数据。

谢谢了先!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-12-20 09:11:09
简单说一下,lz做参考,不一定对
既然用了SAS,就要利用sql,那就要用关系型数据库创建尽量满足最高范式的数据表
你在这里一个客户一张表明显是在视图阶段做的事情
现在要做的就是一张客户表,一张产品表,一张销售流水表
然后在这三张表上你爱做什么做什么了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-20 12:12:22
playmore 发表于 2012-12-20 09:11
简单说一下,lz做参考,不一定对
既然用了SAS,就要利用sql,那就要用关系型数据库创建尽量满足最高范式的 ...
我以前只有二维表数据的分析经验,您说的东西对我比较新,我消化一下先。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-12-21 19:15:28
顶起来,继续求。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群