全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1875 4
2016-03-07
有以下数据格式如表1,V1~V5分别为5个变量,一行为一个个案,id为个案编号,我想实现的处理是:按id整合,同一个id,其V1-V5的数值合并,形成表2的形式

表1
idv1v2v3v4v5

1

0

0

0

0

0

1

1

0

0

1

1

1

0

1

0

0

0

1

1

0

1

0

1

2

1

0

0

0

0

2

0

0

1

0

0

2

0

1

0

1

0

2

0

0

0

0

0

2

0

1

0

0

0

2

0

0

0

0

1

3

1

0

0

1

0

3

0

1

0

0

0



表2
idv1v2v3v4v5

1

2

1

1

1

2

2

1

2

1

1

1



请问用R如何操作呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-3-8 00:59:30
假设你的数据框为dt,
mapReduce(id,sum(V1),sum(V2),sum(V3),sum(V4),sum(V5),data=dt)很久以前可以这样做,现在不知道为什么没有了
参照https://bbs.pinggu.org/thread-2632228-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-8 09:06:58
给你个例子:
用aggregate函数就可以了。
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-8 09:07:36
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-3-8 10:27:59
万人往LVR 发表于 2016-3-8 09:07
感谢,原来R的sql包如此强大还简单
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群