全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6031 3
2014-01-21
交易数据格式如下:
  1         2             3           4             5           6          7             8         9   。。。。。。。。。。。。100
面包      0             0         牛奶        益力多     0          0           鸡蛋       。。。   。。。    。。。  。。。
面包      豆浆       酸奶      0            益力多     可乐      0            0          。。。   。。。    。。。  。。。
0           豆浆        0          牛奶         0             0         橙汁       鸡蛋      。。。   。。。    。。。  。。。
面包       0            酸奶      牛奶        0            可乐    橙汁         0          。。。   。。。    。。。  。。。
。。。
。。。
。。。
。。。


请问在R中,在进行apriori之前,要如何预处理数据,转成怎样的一种格式比较合适??
由于字段有100个字段,行数有2BW左右,直接把这个数据放到apriori处理会处理的很慢,而且占内存。


是否可以转成如下格式或者其他的什么格式:
1  面包
1  牛奶
1  益力多
1  鸡蛋
2  面包
2  豆浆
2  酸奶
2  益力多
2  可乐
....
....

如果我要求的是 “面包”与其他食品的关联性,应该如何处理呢??求教
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-1-21 12:23:28
用SQL多好
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-1-21 12:54:51
yayabe 发表于 2014-1-21 12:23
用SQL多好
怎么说?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-11-21 13:17:04
可以的。item是物品,tid是订单号之类
trans4 <- as(split(a_df3[,"item"], a_df3[,"TID"]), "transactions")
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群