指数制作方法综述
合成各指标数据的方法
因子分析法
因子分析的应用
指数是同一领域或为了说明同一问题的各方面指标数据的一个综合,大体来说,指数的制作的过程一般要:
1、先选择合适的指标,这些指标应能对待研究问题的各个方面做较好阐释;
2、再收集这些指标的数据并按一定方法合成为一个指数;
3、再是对指数做检验,看它是否能对研究问题的总体做较好的信息表述;
4、最后还应该随着实践的发展不断改进和完善该指数,使之适应新的实际情况。
这里我们仅对合成各指标数据的方法做简要探讨:
1.加权平均法。加权平均法无非就是把各指标的数据按照其权重大小进行加权平均,以得到一个综合的指数。对于权重的选择又有3种方法,其一是平均权重法,平均权重法假设各指标对研究问题的重要性是相等的,即如果有N个指标,则每个指标数据的权重设为1/N,全部加权平均以后可得到指数数据。其二是各指标数据有着某种天然的权重蕴含其中,如股价指数可以按其市场份额配以不同的权重;其三是采用层次分析法对各指标的权重进行人为的主观的估计,当然进行估计的人应该是该领域的专家,通过专家对各个指标的重要性打分后再利用数学方法确定每个指标的权重,得到权重后,再按此权重进行加权平均,这样就可以得到指数数据。
2.单一指数法。虽然研究的问题包括了方方面面,但有一个核心指标决定并左右着该问题的发展和格局,所以我们一旦得到了该核心指标的数据,我们就可以直接使用该指标数据作为指数来综合反映该研究问题。
3.因子分析法或主成分分析法。因子分析法与主成分分析法不同之处在于因子分析法除一般使用主成分分析法提取各指标数据的共同部分外,还需要对各提取出来的分因子的含意做出解释。
因子分析法最初是由心理学家发展起来的,目的是借助提取出的公因子来代表不同的性格特征和行为取向,从而解释人类的行为和能力。经典的例子是用于研究人类的智商,由于智商包含多个方面,借助因子分析法可以很好的把人类的智商统一为一个综合的数据,同时也可以把影响智商的因素概括为创造力、想象力、逻辑思维能力等等。由于在长期的实践中证实该方法能有效地提取内在结构,并在解决变量共线性等问题上作用突出,现在它已被应用到了医学、社会学、市场营销、经济学等各个领域。
因子分析的技术细节:
因子分析(Factor Analysis)是多元统计分析技术的一个分支,其主要目的是浓缩数据。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示基本的数据结构。这些假想变量能够反映原来众多的观测变量所代表的主要信息,并解释这些观测变量之间的相互依存关系,我们把这些假想变量称之为基础变量,即因子(Factor)。因子分析就是研究如何以最少的信息丢失把众多的观测变量浓缩为少数几个因子。
因子分析的应用主要有以下两个方面:
,寻求基本结构(Summarization)。在多元统计分析中,经常碰到观测变量很多且变量之间存在着较强的相关关系的情形,这不仅给问题的分析和描述带来一定困难,而且在使用某些统计方法时会出现问题。例如,在多元回归分析中,当自变量之间高度相关时,会出现多重共线性现象。变量之间高度相关意味着他们所反映的信息高度重合,通过因子分析我们能找到较少的几个因子,他们代表数据的基本结构,反映了信息的本质特征。例如,在市场调查中收集了食品的五项指标:味道、价格、风味、是否快餐食品、能量。经过因子分析后可以提取两个公因子,结合实际,我们可以把前一公因子代表“价廉”,后一公因子代表“味美”。这样,通过因子分析我们能找出反映数据本质特征的因素,并分析提炼出来的因子与原来变量之间的关系。
第二、数据化简(Data reduction)。通过公因子分析把一组观测变量化为少数的几个因子后,可以进一步将原始观测变量的信息转换成这些因子的因子值,然后,用这些因子代替原来的观测变量进行其他的统计分析,如回归分析、路径分析、判别分析和聚类分析等,利用因子值也可以直接对样本进行分类和综合评价。
人大经济论坛版权所有 违者必究