全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
3410 5
2010-02-02
虚心求助:

如果我有变量x1,......x10都是n维向量,这里的n比较大,1万左右。
我想分析它们是否相关,分析每一个是否连续,分析是否可以用几个x代替所有的x。

如何分析?如何用R?

谢谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-2-2 07:54:17
这么大的文件最好用sas分析,毕竟速度来说sas有优势。
相关系数在R中是cor(x)
想画出相关系数矩阵symnum函数,你可以在r中用 ?cor去看例子,然后对自己的文件分析。

”分析是否可以用几个x代替所有的x“我理解为你在想说x是离散的
但是我觉得对于连续与否的问题要回到你获得sample的随机变量中去看,r能解决这样的问题?我就不知道了,讨论一下。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-2 11:33:36
谢谢2楼!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-2 12:01:56
I did similar thing recently. Here is my suggestion:
1. calculate distance between every pair of X. The distance can be equal to 1 - absolute value (correlation), or a kind of distance for multivariate variables
2. based on the distance matrix, clustering X variables. For instance, draw a tree to illustrate the association.
3. you may see several clusters from the tree. pick only 1 variable from each cluster will meet the objective.

Alternatively, you may consider factor analysis or principal component analysis to see whether some functions of X variables can represent all X variables or some X variables can explain majority variation.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-3 11:08:44
谢谢楼上的建议。
关于每个“x”是否连续的问题,是这样的:每个X的物理意义并不清楚。希望从统计上判断是否可以认为每个x(列向量)为连续的变量,根据相应的n*1向量值。

我想问一下,这个应该怎么做?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-2-4 11:28:54
有点困难哟!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群