全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1700 3
2014-11-08
悬赏 20 个论坛币 已解决
变量一共有11个,所有变量都是二进制的虚拟变量(0和1)。请问做相关关系分析要用Pearson还是Spearman?
在网上找了很多资料都没有明确的解答,有没有相关文献可做参考?

最佳答案

yongyitian 查看完整内容

Pearson correlation is for normal distributed continuous variables (interval variables). Spearman correlation is for non-normal distributed or categorical variables. Chi-square statistics is for binary variables. Look at Proc FREQ for details. For information, google: difference between pearson and spearman correlations sas correlation between binary variables http://www.ats.ucla.edu/ ...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-11-8 11:00:22
Pearson correlation is for normal distributed continuous variables (interval variables).
Spearman correlation is for non-normal distributed or categorical variables.

Chi-square statistics is for binary variables. Look at Proc FREQ for details.

For information, google:
difference between pearson and spearman correlations
sas correlation between binary variables

http://www.ats.ucla.edu/stat/sas/faq/tetrac.htm
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-11-12 11:13:39
Thank you!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-11-13 11:56:50
burnpark 发表于 2014-11-12 11:13
Thank you!
Terachoric correlation, for binary variable, 在一些社会学科里叫常见。二进制只是表象,连续性是本质(潜在特质模型)。如果对性别这样的变量之间 求Terachoric correlation, 就可能是笑话。因为男是男,。。。。心里沮丧可以是归类为有和无,但是沮丧的程度可以用连续的分值来表示。所以说该关联在这里是合理的。另外,该关联的算法比较复杂。大致是用牛顿方法来算似然值。如果纬度大,Polychoric correlation, 运算的效率值得考虑。我曾经在一个有关性病耻辱度的调查问卷中用到该关联度。最后发现良好的教育背景,良好的心里素质都与其有反向的有意义的关联。那个时候是从网络上找了个R package. Now FREQ in SAS can do it. For SAS 9.4/SAS 9.3 M2, my SAS version, PROC CORR with Polychoric option works.
京剧 (>>>>read my blog)
AS follows, continuous variables are discretized into order groups.




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群