全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4818 0
2014-11-05
悬赏 100 个论坛币 未解决
我想用SAS来做Apriori关联算法,我的数据集中有大约100个变量,这些变量都是0,1变量。我跑了一下自己的程序,发现结果完全没有意义,这是因为所有变量的值都是0或者1,而SAS 无法识别区分。结果如下:

我知道要解决这个问题,就需要赋予这些变量不同的logical的值,比如YES/NO,TRUE/FALSE,但是我有近100个变量,上万行数字,根本无法一一地改变。


所以想请教坛里的高手们如何解决这个问题。谢谢!!!
我附上了我的SAS程序。这里面的变量都是sample data。您处理问题时需要考虑有100个。

data test;
  input id $ 1 class1 $ 3 class2 $ 5 class3 $ 7 class4 $ 9 class5 $ 11 class6 $ 13 class7 $ 15 ;
cards;
1 0 0 1 1 0 1 0
2 1 0 0 1 0 1 1
3 0 1 1 0 1 1 0
4 1 1 0 1 0 1 1
5 0 1 1 1 0 1 0
6 0 0 0 1 0 1 1
;
run;


data items2;
set test;
length tid 8;
length item $8;
tid = _n_;
item = class1;
output;
item = class2;
output;
item = class3;
output;
item = class4;
output;
item = class5;
output;
item = class6;
output;
item = class7;
output;
keep tid item;
run;

proc sql;
alter table items2
modify item char(8);
quit;

proc dmdb data=items2 dmdbcat=dbcat;
class tid item;
run; quit;
proc assoc data=items2 dmdbcat=dbcat pctsup=0.5out=frequentItems;
id tid;
target item;
run;

proc rulegen in=frequentItems dmdbcat=dbcat out=rules minconf=80;
run ;
proc sort data=rules;
by descending conf;
run ;

data surviverules;
set rules(where=(set_size>1));
run;
proc print data=surviverules;
var conf support lift rule ;
run ;





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群