经管之家App
让优质教育人人可得
立即打开
全部版块
我的主页
›
论坛
›
提问 悬赏 求职 新闻 读书 功能一区
›
经管百科
›
爱问频道
关于相关性分析,急!!!!
31楼
420948492
2010-7-24 11:41:31
7#
kiddy_q
存在多个变量的情况下,应该做偏相关检验
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
32楼
woshihzhqing
2010-7-24 11:44:24
P值是能拒接原假设的最小显著性水平。性关系系数是表明两个变量的性关系程度的。
10#
kiddy_q
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
33楼
kilion2004
2010-7-24 12:17:43
菜鸟说一句,错了请各位大虾批评。比如变量为:y, x1, x2。
相关系数的公式计算y和x1的关系,其中根本不涉及x2的数据;可是回归计算中的系数计算却会涉及到x2的数据,因而两者存在显著差别。
假如y和x1,x2分别正相关,那么做回归计算x1系数的时候,x2会来分润和稀释这个相关性,导致回归中x1的系数不如单独计算的相关系数醒目。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
34楼
kilion2004
2010-7-24 12:19:05
至于样本数量,在不引起总体变化的情况下,样本越大就越接近总体,可靠性越好。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
35楼
kilion2004
2010-7-24 12:26:03
用你的数据搞了一下,建议结果如下:
Source SS df MS Number of obs = 16
F( 4, 11) = 17.18
Model .024766576 4 .006191644 Prob > F = 0.0001
Residual .003963868 11 .000360352 R-squared = 0.8620
Adj R-squared = 0.8119
Total .028730443 15 .001915363 Root MSE = .01898
item1 Coef. Std. Err. t P>t [95% Conf. Interval]
na -.4540557 .2103215 -2.16 0.054 -.9169702 .0088588
item4 -.0433938 .016853 -2.57 0.026 -.080487 -.0063005
item5 .0023748 .0006626 3.58 0.004 .0009163 .0038333
item6 .3832896 .1182281 3.24 0.008 .1230714 .6435079
_cons .4724177 .108321 4.36 0.001 .2340048 .7108305
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
36楼
kilion2004
2010-7-24 12:27:01
如果2、3不是你的核心变量,那么把他们都去掉,效果还不错。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
37楼
kilion2004
2010-7-24 12:32:23
如果你很想要2,结果如下:
Source SS df MS Number of obs = 16
F( 3, 12) = 16.99
Model .023254134 3 .007751378 Prob > F = 0.0001
Residual .00547631 12 .000456359 R-squared = 0.8094
Adj R-squared = 0.7617
Total .028730443 15 .001915363 Root MSE = .02136
item1 Coef. Std. Err. t P>t [95% Conf. Interval]
na -.6696417 .2063741 -3.24 0.007 -1.119292 -.2199911
item2 .1080853 .0358902 3.01 0.011 .0298873 .1862832
item4 -.0390382 .0186031 -2.10 0.058 -.0795709 .0014944
_cons .7815594 .0404899 19.30 0.000 .6933395 .8697793
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
38楼
kilion2004
2010-7-24 12:34:33
如果你很想要3,结果如下:
Source | SS df MS Number of obs = 16
-------------+------------------------------ F( 3, 12) = 15.60
Model | .022866596 3 .007622199 Prob > F = 0.0002
Residual | .005863847 12 .000488654 R-squared = 0.7959
-------------+------------------------------ Adj R-squared = 0.7449
Total | .028730443 15 .001915363 Root MSE = .02211
------------------------------------------------------------------------------
item1 | Coef. Std. Err. t P>|t| [95% Conf. Interval]
-------------+----------------------------------------------------------------
item3 | -.6708899 .2158867 -3.11 0.009 -1.141267 -.2005132
item5 | .0019341 .0007952 2.43 0.032 .0002014 .0036668
item6 | .3468903 .124147 2.79 0.016 .0763973 .6173833
_cons | .4087064 .1045654 3.91 0.002 .1808779 .6365349
------------------------------------------------------------------------------
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
39楼
wwfellow
2010-7-24 12:46:24
要先剔除不显著的变量再看
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
40楼
海粟
2010-7-24 12:55:40
路过学习,谢谢各位大虾!
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
41楼
yangnay
2010-7-24 15:51:28
譬如在春天的时候,花儿开了,动物也发情了。你要是做相关分析,你会发现,动物发情和花儿开了有很强的相关系数;但是你要是以“动物发情”为因变量,“春天来了”和“花儿开了”作自变量的回归分析,你会发现花儿开了的回归系数并不显著,为什么呢?因为在排除了“春天来了”的因素之后,动物发情和花儿开了本身并没有什么联系。
总之,回归系数就是度量在排除了其他因素之后的变量之间的关系。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
42楼
zly05
2010-7-24 16:03:30
学习了!。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
43楼
listenyoga
2010-7-24 19:25:59
一起做回归,变量之间互相影响,自然会是这样的,建议你做回归时选择逐步回归法
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
44楼
yuu851
2010-7-24 20:13:22
并不是都能做回归的,你的应该是多元线性回归,要考虑变量的可行性,也就是变量的实际经济意义,其次回归之间应该考虑变量之间是否存在多重共线性和异方差等等,不能只看变量之间的相关性,这只是一个初步的判断,具体的回归模型的建立,还要需要计量方法,再次和数据也有关系,数据有没有进行处理和真实性等等。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
45楼
Isscaliu
2010-7-24 21:18:46
第一:可能存在多共线性
第二:样本太少
建议:1。增加样本 2.做model selection可以尽量避免多共线性(当然,如果你是纯粹做predictive model 存在共线性没有问题)3.考虑用其他方法去分析数据(估计楼主是搞工程之类的吧,这样的数据这样的搞法已经见怪不怪了,经典的一个不懂统计分析的在搞统计分析)
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
46楼
如此执著
2010-7-24 22:06:22
p<0.05 说明自变量对因变量的影响是显著的,而相关性的大小是与1比较的,相关系数越接近1,则说明正的相关性越强,相关系数越接近-1,则说明负的相关性越强。。。。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
47楼
如此执著
2010-7-24 22:17:02
你的问题是什么啊?就是要分析这些数据做什么用
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
48楼
如此执著
2010-7-24 22:18:19
感觉问题不是数据多少的问题,而是分析数据的思路有点乱。。。。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
49楼
三采田
2010-7-24 23:45:02
太深了,不懂,我是专科而已。。。。。。。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
50楼
kiddy_q
2010-7-25 12:27:25
41#
yangnay
虽然这个比喻有点寒。。。不过还是挺能说明问题的好像,有点明白了,哈哈
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
51楼
kiddy_q
2010-7-25 12:40:09
46#
如此执著
是这样,平时工作说要运用数据分析的方法去寻找原因,用得最多的就是回归分析和相关性分析,但是部门里没人是学统计的,也都没这个经验,做好分析也就是单纯看看p值和r值,也不考虑其他很多因素的,所以总觉得有很多不规范的东西和不正确的结论。 我想问下,r值看相关性的话,我知道是看它的绝对值有多接近于1,但是用什么界限去衡量相关不相关呢?界定很模糊的感觉啊。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
52楼
kiddy_q
2010-7-25 12:41:32
44#
yuu851
真希望有人带带我啊。。。。单位里没人会,5555,俺都自学的。。。学得半调子。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
53楼
kiddy_q
2010-7-25 12:53:38
45#
Isscaliu
你说的没错 ,我不是学这个的,单位里也没人学这个,单位里到处宣传着要用数据分析来帮助解决问题,控制流程,但是其实都是只知道些皮毛,然后忽悠其他也不懂得人的, 现在俺是质量部门的,不专业一下不行啊。。。一点点学了。 杯具的是,平时工作都没带,都没人指导,自己整了半天,也不知道对的错的。。。总觉得这样下去害了自己啊
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
54楼
kiddy_q
2010-7-25 13:18:25
48#
如此执著
55555,从来没被那么批评过。。。惭愧死了,想再去高考了。。。。。
扫码加我 拉你入群
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝
首页
上一页
下一页
跳至第
页
栏目导航
stata专版
行业分析报告
经管文库
文献求助专区
数据交流中心
计量统计软件
热门文章
CDA 数据分析师:特征处理核心指南
投资人与创始人互坑套路
全球能源转型展望2025—全球和区域预测至20 ...
中国金融生成式AI多模态内容鉴伪与安全防御 ...
自己整理的私募股权投资实操手册。
海外资管机构赴上海投资指南(2025版)
全球企业社会责任报告数据
USPS账号又“暴雷”,合规浪潮来袭!
瓦尔拉斯框架与阿罗德布鲁 - SMD 框架的核心 ...
世界机器人2025年报告 World Robotics 2025
推荐文章
AI狂潮席卷学术圈,不会编程也能打造专属智 ...
10月重磅来袭|《打造Coze/Dify专属学术智能 ...
最快1年拿证,学费不足5W!热门美国人工智能 ...
关于如何利用文献的若干建议
关于学术研究和论文发表的一些建议
关于科研中如何学习基础知识的一些建议 (一 ...
一个自编的经济学建模小案例 --写给授课本科 ...
AI智能体赋能教学改革: 全国AI教育教学应用 ...
2025中国AIoT产业全景图谱报告-406页
关于文献求助的一些建议
说点什么
分享
微信
QQ空间
QQ
微博
扫码加好友,拉您进群
各岗位、行业、专业交流群