全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1610 0
2017-01-17
最近在学习R语言,在看R语言实战这本书,今天看到了第八章第8.4.3强影响点章节(183页)

书上说cook's D值大于4/(n-k-1),则表明是强影响点,其中k为预测变量数量
那么k值应该是不包含截距项的,也就是书中前面提到的p值-1,(p值是包含截距项的)
cutoff <- 4/(nrow(states)-length(fit$coefficients)-2)
plot(fit,which=4,cook.levels=cutoff)
abline(h=cutoff,lty=2,col="red")


我的问题是:
代码第一行应该是cutoff <- 4/(nrow(states)-length(fit$coefficients))才对吧?

本身n-p就多减了一个1,后面应该+1再-1

n-k-1=n-(k+1)=n-p   而不是  n-p-2

也不知道我理解的对不对,如果不对,烦请指正

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群