全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6447 3
2014-05-13
rt,处理这么一个问题
原始数据
cn wk logon
1   0    15
1  1     20
1   3    13
2   0   3
2   1   5
2   2  2
想要转换成

cn  wk0 wk1 wk2 wk3
1    15   20   0      13
2    3     5     2       0
这样,怎么个量级呢?500W日志,18W个cn(行), 80+个列
自己写了一个for for 嵌套的循环,一晚上只跑了300个cn。。。
不信邪,优化了一下循环,速度提升了22倍,试着跑了5个,依然需要几秒,算下来跑完需要好几天
实在不能忍,各种查资料,找到了reshape2相关的这个帖子
http://stackoverflow.com/questions/17382097/transpose-data-by-groups-in-r
试着reshape了一下,心说,吃个午饭时间看看跑的怎么样吧。。。。。。

神奇的事情发生了——就那么啪的一下,结果出来了! 18W*85的dataframe已经好了!!!
太TM牛逼了吧,Hadley Wickham大神这次R语言年会要来的,找他要签名去!!!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-5-13 13:44:24
lz要是方便的话可以试试SAS里的proc transpose
不知道这个和reshape2哪个更快些
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-5-13 14:03:33
playmore 发表于 2014-5-13 13:44
lz要是方便的话可以试试SAS里的proc transpose
不知道这个和reshape2哪个更快些
呵呵 其实拿到数据的第一时间就想到SAS的transpose了,不过我不再用SAS了,不爱盗版爱开源~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-2-22 22:02:51
不得不说,stata在1998年就有了reshape命令,跟R相比,语法十分简洁
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群