全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1109 2
2014-02-26
data.table: Extension of data.frame for fast indexing, fast ordered joins, fast assignment, fast grouping and list columns

http://datatable.r-forge.r-project.org/



Fast subset, fast grouping, fast assign, fast ordered joins and list columns in a short and flexible syntax, for faster development.

DT[X] is a fast join for large data (DT and X both type data.table).
DT[,sum(b*c),by=a] is fast aggregation (a, b and c are column names).
DT[i,b:=3.14] is fast sub-assignment (to column b) by reference.
DT[,p:=x/sum(x),by=group] to add a new column by reference by group.
fread("big.csv") is 3+ times faster than read.csv(,colClasses,nrow,etc).
10+ times faster than tapply()
100+ times faster than ==
500+ times faster than DF[i,j]<-value
Latest stable release: 1.9.0 on CRAN, 25 Feb 2014

User reviews, data.table wiki and Stack Overflow data.table tag
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-2-26 23:30:31
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-27 10:06:54
ltx5151 发表于 2014-2-26 23:30
哈哈,之前分享过 https://bbs.pinggu.org/thread-2279782-1-1.html
不好意思。补充一个相关的package
dplyr

http://blog.rstudio.org/2014/01/17/introducing-dplyr/
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群