全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1041 2
2016-03-01
现有一份文档,每行的数据是该用户的标签属性,现在想把他们整理一下以方便建模,格式如下:

原文件:

C;B;D
D;A
A;D;C
B;C;D;A

整理后:

A     B     C     D
0     1     1      1
1     0     0      1
1     0     1      1
1     1     1      1

请问有什么比较好的方式么?谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-3-1 17:38:16
假设该文档的文件名是test.txt,数据总共有n行,我们用来存放该数据的变量是rawdata 和 data:
# 读取数据
rawdata <- vector(mode = "list", length = n)
for (i in seq_len(n)) {
  rawdata[[n]] <- scan("test.txt",  sep = ";", what = character(0), skip=i-1, nlines = 1)
}
# 清洗数据
rawdata <- lapply(rawdata, factor, levels = c("A", "B", "C", "D"))
data <- t(sapply(rawdata, table))
data
     A B C D
[1,] 0 1 1 1
[2,] 1 0 0 1
[3,] 1 0 1 1
[4,] 1 1 1 1
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-1 19:06:07
cheetahfly 发表于 2016-3-1 17:38
假设该文档的文件名是test.txt,数据总共有n行,我们用来存放该数据的变量是rawdata 和 data:
# 读取数据 ...
谢谢!我去试试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群