全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
34387 18
2015-01-01
如果数据文件比较大,读取时间会比较慢,因此想只读取一部分数据,该怎么做呢?
用read.table可以实现呢?

假设数据文件是这样的,只希望读取2014年的数据。
Date                  income              outcome
1900-01-01         10                      20
2012-07-02         30                       50
...

2014-12-31         70                           30


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-1 21:15:03
用read.table怕是不能实现,一般都是全部读取,或者读取指定的几列数据,至于按行读取的,只能是全部都读完了之后再按照条件进行筛选吧。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-1 21:41:59
同意楼上的,只能先读,然后用grepl函数或者时间函数筛选
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-2 11:40:02
可以先用scan()试试,里边有nmax, n, nlines几个参数。read.table其实就是scan()的wrapper. 设置nlines可能比较适合你的问题。如果scan不行,就用lower-level input functions, 比如,readLines()或readline(),然后自己设定一下数据格式就行了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-2 13:29:59
rodbc包,sql查询
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-10-6 22:28:43
jiangbeilu 发表于 2015-1-1 21:15
用read.table怕是不能实现,一般都是全部读取,或者读取指定的几列数据,至于按行读取的,只能是全部都读完 ...
请问如何只读取几列数据?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群