这样数据如何读入？

kk22boy

3099

收藏 2012-05-01

悬赏 10 个论坛币已解决

部分数据如下，每一行的长度都不一样，直接read.table会提示

> x=read.table("racing.txt")

错误于scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : 3行没有13元素

racing.zip
大小:(1.27 KB)

马上下载

本附件包括：

racing.txt

谢谢高手指点~

最佳答案

epoh 查看完整内容

ywh兄建议的小修改如下: fileID

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

epoh

2012-5-1 08:48:20

ywh兄建议的小修改如下:
fileID <- file("racing.txt",open="rt")
nFields <- count.fields(fileID)
mat <- matrix(nrow=length(nFields),ncol=max(nFields))
invisible(seek(fileID,where=0,origin="start",rw="read")) #81 x 19 NA matrix
for(i in 1:nrow(mat) ) {
mat[i,1:nFields] <-scan(fileID,what=double(),nlines=1,quiet=TRUE)
}
close(fileID)
df <- as.data.frame(mat)
df

###################
由于你的data matrix,每个row差异很大
若是第一个row是最长的,那好办
read.csv("racing1.csv",na.strings='',header=FALSE)
racing1.csv

racing1.rar
大小:(1.12 KB)
马上下载

本附件包括：
racing1.csv

##################
要不然就类似unbalanced data: '.' or 'NA'
racing.csv

racing.rar
大小:(1.14 KB)
马上下载

本附件包括：
racing.csv

race= read.csv("racing.csv",na.strings='.',header=FALSE)
#or replace these by zeros:
race[is.na(race)] <- 0
race