全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
10280 3
2012-04-09
将EXCEL数据输入R中时,由于原数据中含有缺失值而不能输入。请问在R中如何解决缺失值的问题?谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-4-10 08:40:45
R FAQ
How does R handle missing values?

http://www.ats.ucla.edu/stat/r/faq/missing.htm


I hope this may useful for you.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-4-10 15:12:21
我觉得可以有以下几种方法:
1、直接删除
2、均值替代
3、最邻近方法补充,代码如下:
library(cluster)
tData2<-tData[1:500,]
dist.mtx <- as.matrix(daisy(tData2,stand=T))

central.value <- function(x) {
if (is.numeric(x)) median(x,na.rm=T)
else if (is.factor(x)) levels(x)[which.max(table(x))]
else {
f <- as.factor(x)
levels(f)[which.max(table(f))]
}
}


for(r in which(!complete.cases(tData2)))
{
   tData2[r,which(is.na(tData2[r,]))] <-
   apply(data.frame(tData2[c(as.integer(names(sort(dist.mtx[r,])[2:11]))),
   which(is.na(tData2[r,]))]), 2,central.value)
}

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-3-13 14:18:52
受教了~~~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群