对应分析:两因素多分类数据,样品与变量间的关系
1.首先需要在R语言安装ca包
2.卡方检验数据是否适用于对应分析
X² = 33.925,查表可知,在5%显著性下,自由度(列-1*行-1)为25的临界值是37.65,接受因素之间独立的原假设(电脑通常计算的是在原假设为真的情况),后面的p值>0.05,接受原假设,两个标准说一个就行,该数据不适合做对应分析。
3.进行对应分析
准备的数据经过卡方检验,拒绝原假设,可以做对应分析。
两个因子的累计贡献率达到了98.0%,我们选取两因子做对应分析图。
查看ca的对象列表
提取行坐标
提取列坐标
对应图分析:
根据上图可将样本点和变量分成五组:
第一组:变量:高收入户
样品:1、2、7
第二组:变量:中高收入户
样品:3
第三组:变量:中等收入户
样品:6
第四组:变量:中低收入户
样品:5
第五组:变量:低收入户、人均少于1500元户
样品:4
观察图中两个因素(变量和样品)的距离,进行分组,相似的类靠的近。