全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
1406 0
2021-11-02

生成变量是在数据处理分析过程中一个非常实用的功能,可用于计算或转化原变量,在原变量的基础上生成新的变量。

例如,根据身高体重的数据项,计算体重指数;或对单位不统一的数据项进行标准化处理;又或者计算多个题项的总得分等,都可以通过生成变量功能完成。

操作方法

Step1: 点击 [数据处理] 下的 [生成变量]

Step2: 点击选择具体分析题项,下拉复选框选择计算功能(如平均值、乘积等)

Step3: 填写新变量名(部分功能不需要填写),点击确认处理

功能介绍

SPSSAU提供了约20类数据处理功能,其各项功能及计算公式、应用场景具体说明如下:

  • 平均值

平均值是最常被使用的。可用于求多个变量值的平均值,也可将多个题目合并为一个维度进行分析。 例如,计算每个学生各科成绩的平均值或将“我愿意向朋友推荐SPSSAU”,“我有需要会再来使用SPSSAU”,合并为“忠诚度”一个整体维度。

  • 求和

求和多被用于计算多个题项的总体得分,如量表总分等。例如,计算每个学生各科成绩的总和(总成绩)。

  • 乘积

用于计算两个变量或多个变量的乘积,例如,计算权重与指标的乘积,或者交互项计算等。

  • 虚拟变量

虚拟变量用于将分类数据,如职业、性别等对收入的影响,吸烟对高血压的影响等,通过引入“哑变量”的方式将分类变量进行“量化”纳入回归模型中。例如,研究四种不同治疗方法对某病的疗效,可将4种治疗方法转化为哑变量,再进行Logistic回归分析。

  • 标准化、中心化、归一化

用于对不同量纲的数据,进行无量纲化处理,消除指标间的量纲影响。例如,收集身高数据,想要把单位为M和CM的数据放一起比较,此时可对数据进行标准化处理,使数据具有可比性。

  • 自然对数、10为底对数

用于求原数值的对数。例如,对非正态数据做对数转换处理,使数据转化为更接近“正态分布”数据。

  • 正向化、逆向化

如果数据包括10个指标,其中9个数字越大越好;另外1个数字越大表示越差;此时可对该1项正向化。

  • 最大值、最小值

用于计算多个变量值中的最大值或最小值,例如计算每个学生各科成绩中的最高分或最低分。

  • 样本编号

如果想对样本按编号进行筛选,但又没有相应的编号列,可用这一方法生成一列编号。

其他说明

  • 生成变量是针对每个样本数据进行计算,即每一行样本数据都会得到一个计算结果。
  • 生成变量后,系统会新生成数据,而非原始数据基础上修改。
  • 针对生成变量这一数据处理功能,操作时直接选中即可(相除、相减除外),不需要拖拽操作。配合ctrl或者shift键同时选择多项,批量一次性操作处理。
  • 部分生成的新变量系统会默认进行命名,可使用【标题处理】修改变量名称。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群