全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
9448 6
2015-01-21
数据本身是txt格式,有如下的几个问题
1)表头有一些说明,所以导致变量名称在第四行,
2)变量名称和数据之间还有分隔符
3)在数据的最后又有一些说明
现在只需要导入变量名称,数据主体,不需要导入表头,2里面的分隔符以及最后的表尾。
其实就是有好多行不需要导入,只知道是1,2,4 以及倒数第一行不需要导入。但是不知道倒数第一行是第几行。。。

请问应该怎么写code? 下面是例子:


this table contains xx colums
--------------------
|name|content|
--------------------
|1|AA|
|2|BB|
|3|CC|
---------------------
谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-1-21 15:17:45
read.table(file, header = FALSE, sep = "",
           skip = 0)
file是文件的路径,skip是需要跳过几行开始读入数据,sep为分割符号,sep='|'
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-21 17:10:05
高手,学习了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-22 10:19:35
李会超 发表于 2015-1-21 15:17
read.table(file, header = FALSE, sep = "",
           skip = 0)
file是文件的路径,skip是需要跳过几 ...
多谢, skip功能我理解,skip只能跳过连续的前几行,
但是我需要skip不连续的行数。
例如,我想要跳跃1,2,4,100行,你看我的例子里面,1,2,4行都不要,第3行是header所以要保留。最后一行又是结尾符。而且不知道具体最后一行是第几行。。。

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-22 10:36:05
read.table(file, header = FALSE, sep = "",
           skip = 0,fill=TRUE),fill=TRUE 填充缺失值,然后再在R里面处理-------
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-22 10:51:20
我来试试,多谢多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群