全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 MATLAB等数学软件专版
2475 6
2013-12-27
有人用julia的DataFrames和r的data.tables比过吗? 慢太多了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-12-27 01:13:23
具体干什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-27 01:17:00
数据处理的速度。比如下面的r code:
n <- 1000000
dt1 <- data.table(x = sample(1:5, n, replace = T), y = runif(n))
dt2 <- dt1[, list(avg = mean(y)), by = x]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-27 18:04:57

对data.table 到时刮目相看。

用 julia 和你的写的 做了对比
复制代码
这个BY应该是向量化的,julia 用时0.2秒, data.table0.05秒, 而data.frame后tapply花时就太久太久。。。
看作者一些blog,介绍非向量化的比向量的要快多了。





二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-27 18:20:39
winslow 发表于 2013-12-27 01:17
数据处理的速度。比如下面的r code:
n
试试看julia用循环语句 速度能否快些
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-12-27 21:24:25
想看看循环的速度是怎么样的?
#另一台比较破的笔记本算的
复制代码
复制代码
#elapsed time: 0.311458916 seconds
复制代码
一百万次循环, 可以看出非向量化用时是 比 向量化用时 短的
而这比 R,优势已经不是一点点了。











二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群