非常感谢!
      1、第一个问题,我的上司老大需要的是一些简单而有逻辑的结果,如果告诉他分布在哪些区间内的是正常值,异常值有多大的比例,从哪个区间开始算是异常值。我想我会被老大骂死。但是两个变量之间的散点图,又表明两者之间,没有太明显的关系,似乎只能给出正常值的取值之间和异常值比例的结果。请问还有什么方法可以找出两个变量的关系吗?
      2、只有一个变量的,不是用来聚类的,
      3、还有第三个问题未请教。
         一个变量和其它n个变量的关联
    一个变量,如健康水平,离散分为25个水平,其它九个变量,如锻炼频率、肺活量等,每个变量也是离散有25个水平。共有十万条记录。求一个变量和其它n个变量的关联。注意,是关联,不是因果关系,健康水平只是我举出的例子,并不代表一个变量之间和其它n个变量的因果关系。而且多元回归是行不通的,方差分析不支持九个变量这个多。如果求呢?我的初步想法是将n个变量进行聚类,然后将每个聚类后的每类变量用个指标值代替。但下一步怎么做,无从下手,指标值如何算?算出指标值,下一步骤是什么?或者将变量进行聚类后,再进行区间划分,然后计算分布密度,类似第一问。
       本人统计学水平不高,现在很烦这三个问题。希望楼上的不烦赐教!!