全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
18577 9
2013-12-17
mydata<-read.csv("f:/Book1.csv")
mydata
mydata[complete.cases(mydata), ]
mydata[!complete.cases(mydata), ]
library(mice)
md.pattern(mydata)
x <- as.data.frame(abs(is.na(mydata)))#这一行是干嘛的?
head(mydata, n=111)

head(x, n=111)
imp<-mice(mydata,seed=22222)#这里运行老是显示1   1  热量摄入.千卡.  艾滋病人数.人.  艾滋病发病率.人.万人.  成年男性健康状况得分.分.  成年女性健康状况得分.分.错误于solve.default(xtx + diag(pen)) :
  系统计算上是奇异的: 倒条件数=1.90034e-16
fit=with(imp,lm(热量摄入.千卡= 艾滋病人数.人+艾滋病发病率.人.万人+成年男性健康状况得分.分+成年女性健康状况得分.分))#这里的lm后面不知道哪些设为自变量,因变量,我只是个补个缺失值,难道还要分自变量和因变量?
pooled<-pool(fit)
summary(pooled)                                             
dataset3 <- complete(imp, action=3)


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-12-23 21:55:47
x <- as.data.frame(abs(is.na(mydata)))###定义指示变量用的,即如果mydata数据缺失则对应元素1,否则为0。
imp<-mice(mydata,m) m应该是插补的次数,一般定义为5-10。
没模型的话直接运行就行了不用定义fit。
自我见解。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-27 21:44:36
目前在做缺失数据有关的,多重插补法的论文,请问是否有较好的能够用于这类分析的不完全数据集
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-5-23 19:34:33
先保证变量都是数值型的,观测要多,变量要少(可减小变量数和增加观测数试试)。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-5-28 22:06:47
张冬阳 发表于 2015-5-27 21:44
目前在做缺失数据有关的,多重插补法的论文,请问是否有较好的能够用于这类分析的不完全数据集
R中有个Sleep数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-8-25 01:34:38
您好前辈,我跟您有同样的疑问,我们进行缺失值的插补,为什么平白无故的要进行回归,如果研究主题与回归有关还好,那没有关系,为社么要用回归系数去评价插补的情况呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群