全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4154 14
2015-03-24
一直感觉R在数据处理(ETL)这部分很凌乱,原生的函数里,tapply好像一直不支持 y~x的函数形式,aggregate又不支持多function。
参数的方式也不统一,每次都要查帮助。reshape2倒是利器,不过如其包名,基本上只管reshape,别的事儿都不管。
plyr不太熟呢,数据量大了还行不行?

还有啥包?

觉得各本讲分析的书里对数据处理这方面都没太展开,只是基于分析案例讲的。
哪位能推荐一本专门讲数据处理的世界观、方法论、方方面面的书啊?
多谢!



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-3-24 14:10:47
data.table包,sqldf包都是帮助整理数据的,aggregate支持多个function有什么意义吗?  为什么不能你写一个函数,然后调用多个函数?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-24 14:12:22
liu7788414 发表于 2015-3-24 14:10
data.table包,sqldf包都是帮助整理数据的,aggregate支持多个function有什么意义吗?  为什么不能你写一个 ...
自定义函数啊,好建议,多谢多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-24 14:39:27
ETL任务最适于SAS。凭借2万多个算法包,R的江湖地位可以维持。未来PYTHON会取代R。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-24 22:58:10
davil2000 发表于 2015-3-24 14:39
ETL任务最适于SAS。凭借2万多个算法包,R的江湖地位可以维持。未来PYTHON会取代R。
学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-25 09:33:21
davil2000 发表于 2015-3-24 14:39
ETL任务最适于SAS。凭借2万多个算法包,R的江湖地位可以维持。未来PYTHON会取代R。
谢谢大牛~我准备面向未来了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群