数据处理之变量计算及转换

1527

收藏 2021-11-02

生成变量是在数据处理分析过程中一个非常实用的功能，可用于计算或转化原变量，在原变量的基础上生成新的变量。

例如，根据身高体重的数据项，计算体重指数；或对单位不统一的数据项进行标准化处理；又或者计算多个题项的总得分等，都可以通过生成变量功能完成。

操作方法

Step1： 点击 [数据处理] 下的 [生成变量]

Step2： 点击选择具体分析题项，下拉复选框选择计算功能（如平均值、乘积等）

Step3： 填写新变量名（部分功能不需要填写），点击确认处理

SPSSAU提供了约20类数据处理功能，其各项功能及计算公式、应用场景具体说明如下：

平均值是最常被使用的。可用于求多个变量值的平均值，也可将多个题目合并为一个维度进行分析。 例如，计算每个学生各科成绩的平均值或将“我愿意向朋友推荐SPSSAU”，“我有需要会再来使用SPSSAU”，合并为“忠诚度”一个整体维度。

求和多被用于计算多个题项的总体得分，如量表总分等。例如，计算每个学生各科成绩的总和（总成绩）。

用于计算两个变量或多个变量的乘积，例如，计算权重与指标的乘积，或者交互项计算等。

虚拟变量用于将分类数据，如职业、性别等对收入的影响，吸烟对高血压的影响等，通过引入“哑变量”的方式将分类变量进行“量化”纳入回归模型中。例如，研究四种不同治疗方法对某病的疗效，可将4种治疗方法转化为哑变量，再进行Logistic回归分析。

用于对不同量纲的数据，进行无量纲化处理，消除指标间的量纲影响。例如，收集身高数据，想要把单位为M和CM的数据放一起比较，此时可对数据进行标准化处理，使数据具有可比性。

用于求原数值的对数。例如，对非正态数据做对数转换处理，使数据转化为更接近“正态分布”数据。

如果数据包括10个指标，其中9个数字越大越好；另外1个数字越大表示越差；此时可对该1项正向化。

用于计算多个变量值中的最大值或最小值，例如计算每个学生各科成绩中的最高分或最低分。

如果想对样本按编号进行筛选，但又没有相应的编号列，可用这一方法生成一列编号。

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝