全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
8874 30
2013-05-30
复制代码
数据结构如上,共有三个字段:CUSTOMER TIME PRODUCT
复制代码

关联分析代码如上,非常简单,主要用到两个过程PROC ASSOC和PROC RULEGEN1. PROC ASSOC 主要的作用为生成所有的K-项集,并统计其频率。格式如下:
复制代码
option中最重要的两个分别为items=5 和support=20分别代表K项集的最大项目数阈值和支持度(support)
CUST statement 与TARGET statement分别代表你的标志变量和目标变量。
使用该过程的时候需要注意一点,引用SAS官方原文:
复制代码
如果你处理的是大数据,运行这个程序的时候可能会磁盘满或者内存溢出。为了避免这种情况的发生,在第一次运行的时候应该设置一个比较高的置信度。逐次递减。
2.PROC RULEGEN 主要的作用是生成关联规则,格式也非常的简单,如下:
复制代码
option主要是设置minconf:最小置信度(confidence)
3.运行后生成结果(部分)为:主要有:support(支持度)、confidence(置信度)、lift(梯度),rule(规则)

result.png

本帖隐藏的内容

emlib.rar
大小:(18.17 KB)

 马上下载











补充内容 (2013-11-3 17:13):
原文参考:http://support.sas.com/documenta ... iner/em43/assoc.pdf
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-5-30 11:30:55
复制代码


时序关联唯一的区别是PROC DMDB(ps:这个过程在SAS/EM非常重要,基本所有数据挖掘过程运行前都必须运行这个过程。主要作用是为建模创建数据仓库)过程中加入标识变量为custom time。时间也加入标识变量之一。关键过程为PROC SEQUENCE
格式如下:
复制代码




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-30 11:36:25
好东西,看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-30 14:47:02
一直用图形化工具,看来编程更灵活
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-31 17:40:06
支持啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-5-31 23:56:56
ben大神学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群