全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
13524 19
2020-12-11
copula熵是一种显著优于皮尔逊相关系数的统计工具,不像后者只适用于线性高斯的情况,copula熵可以衡量任何相关性。
如下论文进行了理论和实验对比,表明了copula熵的巨大优越性:
         Discovering Association with Copula Entropy
         https://arxiv.org/abs/1907.12268
论文实验采用了著名的NHANES医学体检数据,方法实现用到了CRAN上的copent包。

Pearson相关系数作为一个有着悠久历史的相关度量,也该进入历史了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-1-16 17:19:17
已经在R语言里下载了您的包,学习一段时间后给您反馈!非常感激
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-11-13 19:12:00
请问Copula怎么算相关系数矩阵?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-11-14 22:59:45
majianthu 发表于 2020-12-11 09:45
copula熵是一种显著优于皮尔逊相关系数的统计工具,不像后者只适用于线性高斯的情况,copula熵可以衡量任何 ...
好的好的好的好的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-11-23 15:07:27
您好,我在找相关性比较的方法,用于业务可视化。
【目标】我想先识别出来哪个属性字段(如年龄段,性别,车型等) 对业务数据(百公里加速次数)的相关性最大,然后对这个属性进行可视化业务展示。
【问题】不知道copula熵该从何下手计算,以及计算后如何评估是否相关,相关的大小,是否有简单一点的完整例子,谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-12-8 16:14:00
阿灬士 发表于 2021-11-23 15:07
您好,我在找相关性比较的方法,用于业务可视化。
【目标】我想先识别出来哪个属性字段(如年龄段,性别, ...
对比相关性方法,可以参考我的论文Variable selection with copula entropy
Ma, Jian. Variable Selection with Copula Entropy. Chinese Journal of Applied Probability and Statistics, 2021, 37(4): 405-420. See also arXiv preprint arXiv:1910.12389 (2019).
    论文网址:https://arxiv.org/abs/1910.12389
    论文演示代码:https://github.com/majianthu/aps2020
论文对比了几种主要的相关性度量方法,copula熵是表现最好的。供参考。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群