全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
23227 9
2015-11-13
在R中对多列数据计算相关系数。
在缺失值的处理中,有四种方法:

当use=“all.obs”时,有缺失值就会报错;

当use=“complete.obs”时,空值的地方会被casewise deletion( If use is "complete.obs" then missing values are handled by casewise deletion (and if there are no complete cases, that gives an error). )但计算出来的相关系数矩阵是完整的没有缺失值的,那么那些空值的地方的值是用什么方法填补的呢?

当use=“na.or.complete”计算结果与上面一样,只不过如果全部都没有完整数据的行列,结果将给出NA,而不是像上面一样给一个error。

当use=“pairwise.complete.obs”计算结果和前面两个不一样(if use has the value "pairwise.complete.obs" then the correlation or covariance between each pair of variables is computed using all complete pairs of observations on those variables. This can result in covariance or correlation matrices which are not positive semi-definite, as well as NA entries if there are no complete pairs for that pair of variables. )但结果也是完整的。

想问下,那些缺失值的地方在计算过程中是如何处理的?是选择了数据列中均值、中值、众数之类的来替代的吗?还是用什么方法进行填补的?




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-11-13 11:53:27
?cor
看details
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-13 13:50:00
万人往LVR 发表于 2015-11-13 11:53
?cor
看details
是的哦。哦 我看看。。。谢谢哈。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-13 14:13:36
万人往LVR 发表于 2015-11-13 11:53
?cor
看details
不好意思,麻烦再问下,这个details在哪里呀?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-13 18:42:43
羊乖乖 发表于 2015-11-13 14:13
不好意思,麻烦再问下,这个details在哪里呀?
只有选择pairs...那个,才是不用缺失值进行计算的,选择complete cases进行计算。也就是在计算 的时候,先剔出了缺失值,并没有用其它值进行代替。
下面是Details
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-11-16 19:48:17
可以使用DMwR包中的knnImputation(data,k=...)函数来填补缺失值
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群