生成变量是在数据处理分析过程中一个非常实用的功能,可用于计算或转化原变量,在原变量的基础上生成新的变量。
例如,根据身高体重的数据项,计算体重指数;或对单位不统一的数据项进行标准化处理;又或者计算多个题项的总得分等,都可以通过生成变量功能完成。
操作方法
Step1: 点击 [数据处理] 下的 [生成变量]
Step2: 点击选择具体分析题项,下拉复选框选择计算功能(如平均值、乘积等)
Step3: 填写新变量名(部分功能不需要填写),点击确认处理

功能介绍
SPSSAU提供了约20类数据处理功能,其各项功能及计算公式、应用场景具体说明如下:

平均值是最常被使用的。可用于求多个变量值的平均值,也可将多个题目合并为一个维度进行分析。 例如,计算每个学生各科成绩的平均值或将“我愿意向朋友推荐SPSSAU”,“我有需要会再来使用SPSSAU”,合并为“忠诚度”一个整体维度。
求和多被用于计算多个题项的总体得分,如量表总分等。例如,计算每个学生各科成绩的总和(总成绩)。
用于计算两个变量或多个变量的乘积,例如,计算权重与指标的乘积,或者交互项计算等。
虚拟变量用于将分类数据,如职业、性别等对收入的影响,吸烟对高血压的影响等,通过引入“哑变量”的方式将分类变量进行“量化”纳入回归模型中。例如,研究四种不同治疗方法对某病的疗效,可将4种治疗方法转化为哑变量,再进行Logistic回归分析。
用于对不同量纲的数据,进行无量纲化处理,消除指标间的量纲影响。例如,收集身高数据,想要把单位为M和CM的数据放一起比较,此时可对数据进行标准化处理,使数据具有可比性。
用于求原数值的对数。例如,对非正态数据做对数转换处理,使数据转化为更接近“正态分布”数据。
如果数据包括10个指标,其中9个数字越大越好;另外1个数字越大表示越差;此时可对该1项正向化。
用于计算多个变量值中的最大值或最小值,例如计算每个学生各科成绩中的最高分或最低分。
如果想对样本按编号进行筛选,但又没有相应的编号列,可用这一方法生成一列编号。
其他说明
- 生成变量是针对每个样本数据进行计算,即每一行样本数据都会得到一个计算结果。
- 生成变量后,系统会新生成数据,而非原始数据基础上修改。
- 针对生成变量这一数据处理功能,操作时直接选中即可(相除、相减除外),不需要拖拽操作。配合ctrl或者shift键同时选择多项,批量一次性操作处理。
- 部分生成的新变量系统会默认进行命名,可使用【标题处理】修改变量名称。