悬赏 30 个论坛币 未解决
问题:一个变量和其它n个变量的关联
1、 一个变量,如健康水平,离散分为25个水平,其它九个变量,如锻炼频率、肺活量等,每个变量也是离散有25个水平。共有十万条记录。求一个变量和其它n个变量的关联。注意,是关联,不是因果关系,健康水平只是我举出的例子,并不代表一个变量之间和其它n个变量的因果关系。而且多元回归是行不通的,方差分析不支持九个变量这个多。如何求呢?第一个方法,我的初步想法是将n个变量进行聚类,然后将每个聚类后的每类变量用个指标值代替。但下一步怎么做,无从下手,指标值如何算?算出指标值,如何跟第一个变量联系起来?聚类分析似乎很难用上,可能本人不知道如何灵活变通第二个方法是将变量进行聚类后,再进行区间划分,然后计算分布密度,就是求出正常值比例,一些异常值比例。
2、如果一个变量和其它n个变量中,一个变量是连续的变量,又有什么变化,又该如何做呢?
如果有详细步骤最好啦,麻烦大家!
本人统计学水平不高,现在很烦这个问题。希望不烦赐教!!