全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4295 5
2013-03-29
我现在手上有一个比较大的矩阵,是26445到2685的,其中有一些值是NA的,我现在想把那些含有NA的行给去掉。本人知道的R的内置函数较少,所以就

#建立空变量,里面值全是TRUE
mind = rep( 1 , 26445 ) > 0
#首先得到全部的逻辑判断的矩阵
uind = !is.na(rawdata)
#每一行去扫描,再存在之前那个变量里面
for( i in 1:26445 )
{
    mind = all( uind[ i , ] )
}
#然后我再引用下标就可以了
newdata = rawdata[ mind , ]

但是这样速度好慢好慢好慢啊!!苍天啊!!

我觉得R肯定有那种内置的函数,能够超快的处理这种批次的感觉的,尤其是矩阵的函数。不知道有没有大侠指点一下如何迅速做到逻辑矩阵速度逐行求与操作的函数呢?谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-3-29 11:00:19
试试na.omit(rawdata)
你的程序有点问题。你的那个for循环里没有把每次的结果存到mind里。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-3-31 05:17:38
newdata <- olddata[complete.cases(olddata), ]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-1 15:47:12
qoiqpwqr 发表于 2013-3-29 11:00
试试na.omit(rawdata)
你的程序有点问题。你的那个for循环里没有把每次的结果存到mind里。
谢谢大大,这个果然是对的,但是我刚刚才注意到我的数据非常nasty,每一行都有na或者infinite的值,这怎么处理呢?能否还能做PCA之类的Multidimensional Analysis呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-1 15:50:57
ntsean 发表于 2013-3-31 05:17
newdata
这个命令也是可以的,谢谢大大,正如楼上所说,我现在数据没有一行是全须全引儿的,要不就是有Na,要不就是Inf。这种时候应该怎么处理呢?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-4-3 05:52:02
Hamlet邵e 发表于 2013-4-1 15:50
这个命令也是可以的,谢谢大大,正如楼上所说,我现在数据没有一行是全须全引儿的,要不就是有Na,要不就 ...
你需要做missing data imputation
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群