全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
154485 84
2009-03-04

“相关系数”和“显著性水平”,在进行相关分析时都要计算。并且,我知道r只反映线性相关程度。但是,分析结果时,以哪一个为准判断是否相关?

例如:(1)r=0.03,p=0.001, (2)r=0.8,p=0.6

该怎么解释(1)和(2)?

谢谢!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-3-4 22:20:00

应该讲,只有显著性水平显著时,相关系数才是可信的。问题:

(1)显著性水平显著,但是相关系数接近0,能否认为是线性相关的?

(2)显著性水平不显著,但是相关系数接近1,是否意味着不线性相关?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-3-7 22:57:00

[原创]浅谈线性相关和显著性水平

在一定的假设条件下,显著性水平和相关系数应该是一致的,一般不会出现这种情况,相关性强的一般p值就低,但是但存在异方差,自相关,变量之间的多重共线性时就有可能出现这种情况。还有在经济学中还有伪相关,虽然相关系数很高,但是他们之间并不存在必然的相关关系,需要进行协整检验。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-3-9 11:35:00

3楼谈的不错,接着3楼谈:

相关系数主要度量两变量的之间的线性关系,其基本模型是经典线性模型的简单情形,包含的前提假设有:

1).线性性假设,即:假设因变量关于自变量的条件期望是自变量的线性组合

2).齐方差假设,即:误差方差相同

3).独立性假设,即:误差独立

经典模型假设自变量是非随机的,如果两变量都是随机的,则一般可以推广到平稳弱相依变量情形,结论不变;

如果两变量未必平稳,则有“虚假相关”的问题,需要进行更细致的非平稳性分析和经典的协整分析;

至于3楼所说,“在一定假设条件下,显著性水平和相关系数应该是一致的”,我的理解是指经典假设(上述三条),而两者一致则是有其他条件的,我通常认为:p值比相关系数的绝对大小更可信,很多情况下并不等价

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-3-11 11:39:00

4楼的果然是理论高手,仰之弥高,佩服!佩服!我只能从一般情况谈谈。

通常情况下,我们计算的是Peason相关系数,也就是线性相关系数,按照公式进行计算这是一件非常简单的任务。

但记住,这相当于统计推断里的点估计,至于这个估计值是否合理,就需要进行假设检验。其实我们在计算平均值、方差时都应该进行假设检验,但不知为何我们都省略了这一步(我猜测使这些估计方法都非常稳健,因此计算结果必定能通过检验,是否如此,还期待高手的指导)。

言归正传,当我们计算出r的估计值时,需要进行假设检验,计算出相应P值。但在实践中,许多人不重视这一步,直接应用r的结果,这是非常不严谨的。

这样一来,结果就清楚了

1)、r=0.03,p=0.001

由于p=0.001,应该小于预设的置信度,因此不接受原假设,因此对r无法再进一步解释。

2)、r=0.8,p=0.6

由于p=0.6,应该大于预设的置信度,因此接受原假设,故r=0.8,而按照一般的原则,这显然是强相关。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-3-11 16:39:00

呵呵

谢谢5楼夸奖,可是后面你对两个相关系数的解释,却是基本不赞同,

相关系数的假设检验,一般间接利用简单模型的拟合优度的F检验,其两个假设一般为:

H_0:\rho=0     <----->H_1:\rho not=0

r=0.03,但是p=0.001,一般拒绝原假设,认为两变量显著相关;

r=0.8,但是p=0.6,接受原假设,认为两变量统计无关;

所以我说,关键看p值,而不是r值,否则极容易迷惑

欢迎继续拍砖

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群