全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 学习笔记1.0
1665 0
2013-05-15
如何在R中导入大数据集,对于很多人(me included)来说非常棘手(当然对于R高手来说very easy),但是被重复问及,就难免想总结一些自己平常用的比较多的方法。其实方法比较多,或许我的方法在某些人面前都out了。      首先产生一个较大数据集:
复制代码
     然后,
复制代码
      然后,使用sqldf包中的sqldf重新try:
复制代码
      节约了3分钟左右,差异是不是很惊人!当然这是不是最快的?答案是NO!很多包提供了其它的方法,ff包、data.table包都提供了一些很不错的方法:
复制代码
       还有其它很多方法可以帮助提高读取数据的速度,比如,read.table中指定数据类型(colClasses)和行数(nrows)等等。当然不同情况,适合用不同方法,这里就不在说了。




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群