全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
1954 2
2013-06-05
我在人银工作,想研究一下当地工农中建四行存款情况,结果发现,四行从2003-2012年各月底个人存款数据相关系数高的很,0.9以上。我先以为是由于各行客户重叠的原因,即大规模的人 即在工行有存款 又在农行有存款,同时在中建行也有存款。为了验证这一想法,我又找到农行两个县行的个人存款数,这样在两个县行的范围内,各县人员不可能那么流动,那么重叠客户就会很少,照理相关系数就会很低,可结果是依然很高!我考虑是不是因为个人客户大多是吃财政饭的,因而相关系数高??又找到两个地级市的农行个人存款月底数据,这样不在同一地区个人客户几乎不可能重叠,但结果依然很高,0.99左右。

那位大侠能帮我解释一下是为什么呢???相关系数如此高能说明什么呢??为什么相关系数高???

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-6-6 17:32:12
时间序列的相关系数都会比较大,共同和时间因素有关系
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-6-6 17:34:25
首先,请问你的个人存款数据是什么结构的呢?是每个人一条记录吗?如果这样,你去比较相关性就没用太大意义。因为正如你所说,不同的地区的客户比然重叠程度是比较低的。相关系数高,可能只能说明两个地区的存款数据分布可能趋同,这也是合理的。
我建议,应该比较不同银行存款数据的分布情况,比如A行存款大于100W的人数占总人数的比例和B行相比较。
另外,相关系数高,不代表两组变量之间有明显的关系;反之,相关系数低,不代表两者没有关系。比如X和X^2,X是标准正态分布函数,他们之间的相关系数是0,但显然X对X^2有强烈的影响。
希望能帮到楼主。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群