对于概念的数据测量,分两种情况。其一,可以直接观察到,则可以直接测量,例如身高。在数据分析中对应观察变量。
其二,不可以直接观察到,只能通过已知数据进行回溯性推理,例如抑郁程度,此时可以考虑寻找一些外围指标(用以表示抑郁症状的指标,如睡眠时间等),捕获它。就好像使用多个圆圈,类似于集合,做出一个交集,所有指标都包含的部分,也就是我们的目标。在数据分析中对应潜变量。
因此,因子分析时,会将许多指标提纯成几个核心的概念,可以理解为化繁为简。
问卷调查仅仅只是一种数据收集方式,并不能和因子分析挂钩,只要分析目的与因子分析匹配,就可以使用因子分析。
但是,这不意味着化繁为简的方法只有因子分析一种,也不意味着因子分析就适合所有的化繁为简的目的。
常见的降维方法还有主成分分析。化繁为简,或者对众多指标进行分类的方法,也有诸如聚类分析。
因子分析最终出来的模型,是潜变量影响观察变量,也就是认为众多指标背后存在一个本质原因,而这些指标仅仅只是该原因的结果,是表面现象。而因子分析的目的是找到这个背后的原因。
因此,如果你认为企业的绩效指标(例如有A1、A2和A3三个)背后还存在着某种原因,并且要进行一个概念提取,则应当使用因子分析。
如果你仅仅只是因为企业绩效的多个指标高度相关,怕产生共线性,则与因子分析目的不相称。此时可以考虑主成分分析。
如果你觉得这些企业绩效指标,都是合理的指标,说明企业的绩效可以放在多维视角下,它的绩效本来就不是单一的。与之对应的是,在数据分析的时候,每个绩效指标都要进行分析。
当然,随意使用统计方法也是可以的,只要别人没有意见就行,即使错了也可以发论文。