全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3224 2
2016-08-13
目前有一个几百万行的数据框。目的是以某一列为标准分割成为小的数据框,方便下一步分析。如,以时间列为标准,目的是根据每一个时间生成一个含有这个时间的数据的数据框。
目前采用的办法是用循环做类似data.time.i=data[data$time==time.i,]。思考后觉得,每一次循环都要在总数据中进行一次核对,效率很低。请问是否可以采用分割的思路,每一个循环里将符合条件的分割出,将总数据逐步缩小,下一个循环便不用核对之前已经分割的数据,从而提高效率。如何实现?或者是否有什么函数可以高效实现这一过程。
本人小白,刚接触R。还请各路大神指点,感激不尽!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-13 18:21:40
split函数
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-13 22:12:53
library(dplyr)
data <- iris
a <- levels(data$Species) #这一步的前提是,你要分类的这一列是个factor
for (i in a) assign(paste0("Data_",i),filter(data,Species==i))
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群