全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
974 0
2021-12-23

继上两篇论文里的分析方法要用哪一种?知识清单给你答案(1)论文里的分析方法要用哪一种?知识清单给你答案(2) 本文继续知识清单的总结。

主要内容包括:数据分布、模型研究、一致性研究、配对数据研究、多元统计研究等五类分析方法的使用辨析。

15. 数据分布

判断数据分布是选择正确分析方法的重要前提。

正态性: 很多分析方法的使用前提都是要求数据服从正态性,比如线性回归分析、相关分析、方差分析等,可通过正态图、P-P/Q-Q图、正态性检验查看数据正态性。

随机性: 游程检验是一种非参数性统计假设的检验方法,可用于分析数据是否为随机。

方差齐性: 方差齐检验用于分析不同定类数据组别对定量数据时的波动情况是否一致,即方差齐性。方差齐是方差分析的前提,如果不满足则不能使用方差分析。

Poisson分布: 如果要判断数据是否满足Poisson分布,可通过Poisson检验判断或者通过特征进行判断是否基本符合Poisson分布(三个特征即:平稳性、独立性和普通性)

卡方拟合优度检验: 卡方拟合优度检验是一种非参数检验方法,其用于研究实际比例情况,是否与预期比例表现一致,但只针对于类别数据。

单样本T检验: 单样本T检验用于分析定量数据是否与某个数字有着显著的差异性。

16. 模型研究方法

当需要研究多个变量之间的关系情况时,通常可构建统计模型用于分析及预测。

如果研究一个X或多个X对Y的影响关系,其中Y为定量数据,可使用线性回归分析。

如果研究一个X或多个X对Y的影响关系,其中Y为定类数据,可使用Logistic分析。

如果要分析1组X与一组Y之间的关系情况,可使用典型相关分析

如果要分析多个X与多个Y之间的影响关系情况,且样本量较小(通常小于200),可使用PLS回归分析

如需分析多个X对多个Y的影响关系,以及具体哪些X对哪些Y有影响如何影响,可使用路径分析

还有一种方法称为结构方程模型,包含测量模型和结构模型,类似于因子分析和路径分析的结果,可应用于多种研究,能够评估模型的测量精确性,同时也能够对变量之间的直接和间接关系建模分析。

17. 信息浓缩方法

当研究中包括有很多题目或很多变量时,可通过信息浓缩的方法,把数据浓缩成一个或多个变量,以便用于后续的分析。

主成分分析和因子分析都是信息浓缩的方法,即将多个分析项信息浓缩成几个概括性指标。如果希望进行将指标命名,SPSSAU建议使用因子分析。原因在于因子分析在主成分基础上,多出一项旋转功能,该旋转目的即在于命名。

平均值和求和也是信息浓缩的常用方法,比如要将多个题项合并成一个变量,可通过求平均值概括成一个题项。当数据不满足正态,存在极端值时,可用中位数代替平均值。

18. 一致性研究方法

一致性检验的目的在于比较不同方法得到的结果是否具有一致性。检验一致性的方法有很多比如:Kappa检验、ICC组内相关系数、Kendall W协调系数等。

Kappa系数检验,适用于两次数据(方法)之间比较一致性,比如两位医生的诊断是否一致,两位裁判的评分标准是否一致等。

ICC组内相关系数检验,用于分析多次数据的一致性情况,功能上与Kappa系数基本一致。ICC分析定量或定类数据均可;但是Kappa一致性系数通常要求数据是定类数据。

Kendall W协调系数,是分析多个数据之间关联性的方法,适用于定量数据,尤其是定序等级数据。

19. 配对数据研究方法

配对研究是一种医学上常见的研究设计,常见于单组样本前后对比研究,或者将样本分为实验组和对比组两组,针对干预措施进行研究。

如果配对样本数据为定量数据时,可使用配对样本T检验

如果配对样本数据为定量数据,但配对样本的差值不符合正态分布,则考虑使用配对Wilcoxon检验

如果数据为定类数据,则使用配对卡方检验

20. 多元统计研究

判别分析: 用于在分类确定前提下,根据数据的特征来判断新的未知属于哪个类别。

对应分析: 用于分析定类数据的分类情况,并结合图形展示。

曲线分析: 如果想要研究X对Y的影响关系,且X和Y不满足线性关系(可通过散点图观察),而呈现出曲线关系,建议根据曲线拟合图结果,选择拟合程度较好的曲线进行曲线回归分析。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群