全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3820 4
2019-02-24
悬赏 2 个论坛币 未解决
1.原始数据集为8448*20008,每一列是一个transaction,每一行是一个item。
2.使用R 转置函数,将原始数据集转置。
问题!3.转置后的数据集格式为character,如何变成能进行频繁项集处理的transaction呢?
          4. 使用fread读取数据集的时候,总是报错显示invalid head position. jump=1,我知道是因为表格中(0,0)部分没有数据,如何解决呢?
原始数据集格式(部分):0代表没有买,大于0的数字代表已购买。

1550965817.png


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-2-24 11:00:39
as(x, "transactions")
#x为列表或data.frame

好像可以这样,试下看。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-24 11:52:53
cutebe 发表于 2019-2-24 11:00
as(x, "transactions")
#x为列表或data.frame
我试了这个样子不行,假设数据集是这个样子:
   cheese    bread     apple
1      0           1          1
2       1          1         0
我的输出是所有的列名,并没有按照0,1来构造准确的交易记录,是为什么呢?输出结果是:1.{cheese,bread,apple}
抱歉二次修改,之前发现自己理解错了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-24 13:46:26
# Data Processing Of Gene

# Import the dataset
library(data.table)
dataCSV = fread("Data.csv")
dataRow = fread("GSE115469_Data.csv",header = FALSE)
dataP1 = dataRow[,1:1069]

# Transpose
dataTrans = t(dataP1)

# Set the rowNames and colNames
rownames(dataTrans) = dataTrans[,1]
colnames(dataTrans) = dataTrans[1,]
dataTrans = dataTrans[-1,-1]

# character --> Numberic
dataNum=apply(dataTrans,2,as.numeric)

# Normalization
dataNum[dataNum > 1] = 1
dataNum[dataNum < 1] = 0

# Removing all rows which all columns have value
dataValue = dataNum[which(rowSums(dataNum==0)!=0),]

# Removing all rows which all columns are 0
dataZero = dataValue[which(rowSums(dataValue)>0),]
dataZero =na.omit(dataZero)

# Apriori
library(Matrix)
library(arules)

# data --> Transaction
trans = as(dataZero,"transactions")

# Using Apriori to find frequent itemsets
#dataset = read.transactions(dataTrans)
#itemFrequencyPlot(dataset, topN = 100)
rules = apriori(data = trans, parameter = list(support = 0.8, confidence = 0.8))


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-12-12 11:32:59
遇到了同样的处理Transactions交易数集的问题,是与这个基因数集格式相同的嘛,求分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群