全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心 数据求助
347 1
2025-08-30
在平行中介模型(Parallel Mediation Model)中,样本量的确定是确保模型估计精度、统计检验效力(尤其是中介效应显著性检验)的关键步骤。由于平行中介涉及一个自变量(X)、多个并行中介变量(M₁, M₂, ..., Mₖ)和一个因变量(Y),其样本量需求需同时考虑中介路径数量、效应量大小、显著性水平及统计效力,不能简单套用简单线性回归或单中介模型的样本量标准。




一、核心影响因素:先明确这4个关键参数
在计算样本量前,需先界定以下核心参数,这些参数直接决定样本量需求的高低:


| 影响因素                | 说明                                                                 |
|-------------------------|----------------------------------------------------------------------|
| 效应量(Effect Size) | 平行中介中最关键的参数,指各路径(X→M、M→Y、X→Y直接效应)的关联强度,通常用标准化回归系数(β) 或 Cohen's f² 衡量。效应量越小,需越大样本量才能检测到显著效应。 |
| 统计效力(Power)    | 指“正确检测出真实存在的效应”的概率,通常设定为 0.8(80%) 或 0.9(90%)(行业通用标准)。效力要求越高,样本量需求越大。 |
| 显著性水平(α)     | 犯“第一类错误(误判效应存在)”的概率,通常设定为 0.05(双侧检验)(社科、医学等领域通用)。α越小(如0.01),需更大样本量。 |
| 中介变量数量(k)   | 平行中介中中介变量越多,模型复杂度越高(需估计的路径系数越多),样本量需求也随之增加(但并非线性递增)。 |




二、3种主流计算方法(附操作指引)
平行中介样本量的计算需依托统计软件或专用公式,手工计算误差大且复杂,推荐以下3种实操方法(按推荐优先级排序):




方法1:基于“效应量模拟”的软件计算(最精准,推荐)
平行中介的核心是“检测多个中介路径的联合效应”,需通过蒙特卡洛模拟(Monte Carlo Simulation) 或G*Power的“定制检验” 模拟真实效应场景,计算最小样本量。  
常用工具:G*Power 3.1(免费)、Mplus、R(mediation包)  


以最易上手的 G*Power 为例,操作步骤如下:  
1. 打开G*Power,选择左侧“Tests”→“Correlation and regression”→“Linear multiple regression: Fixed model, R² deviation from zero”(适用于多路径回归的联合检验);  
2. 输入核心参数:  
   - Effect size f²:根据文献或预实验确定(小效应f²=0.02,中等f²=0.15,大效应f²=0.35,平行中介通常需至少中等效应);  
   - α err prob:设为0.05(双侧检验);  
   - Power (1-β err prob):设为0.8或0.9;  
   - Number of predictors (p):等于“中介变量数量(k)+1”(因X需同时预测k个M,每个M再预测Y,此处按“X+M₁+M₂+...+Mₖ”为预测变量总数);  
3. 点击“Calculate”,输出“Total sample size”即为最小样本量。  


> 示例:若k=2(2个平行中介)、中等效应f²=0.15、Power=0.8、α=0.05,则G*Power计算得最小样本量约为 64(实际需略增加,避免数据缺失影响)。




方法2:基于“经验公式”的粗略估算(快速参考)
若暂无软件或预实验数据,可通过学界通用的经验公式估算,适用于初步设计阶段(结果需用软件验证):  
最小样本量 n ≥ 50 + 8k(k为中介变量数量)  
- 来源:基于Baron & Kenny中介检验框架的经验总结,假设效应量中等、Power=0.8;  
- 示例:k=3(3个平行中介),则n ≥ 50 + 8×3 = 74;k=4,则n ≥ 50 + 8×4 = 82。  


> 注意:此公式为“下限粗略值”,若效应量小(如f²<0.1),需将系数“8”替换为“10~12”,即n ≥ 50 + 12k。




方法3:基于“预实验数据”的精准计算(最优方案)
若已有小样本预实验(如n=30~50),可通过预实验得到的各路径回归系数(β_X→M、β_M→Y) 计算效应量,再代入软件得到精准样本量:  
1. 用预实验数据计算各路径的标准化β系数;  
2. 按公式计算综合效应量 f²:f² = R² / (1 - R²)(R²为整个平行中介模型的决定系数,即Y的变异被X和所有M解释的比例);  
3. 将f²代入G*Power或Mplus,得到的样本量最贴合实际研究场景(避免“效应量假设偏差”导致的样本不足)。




三、关键注意事项(避免样本量不足或冗余)
1. 优先考虑“效应量”而非“中介变量数量”:  
   若中介效应极小(如β=0.05),即使k=1,也需n≥200以上才能检测到显著效应;反之,若效应量大(β=0.3),k=3时n=60即可满足需求。  
2. 预留“数据缺失”的样本量:  
   实际研究中可能存在数据缺失(如问卷漏填、被试退出),需在计算结果基础上增加10%~20%样本量(例:软件计算需n=80,实际应招募n=90~96)。  
3. 警惕“过度追求大样本”:  
   样本量并非越大越好——过大样本可能检测出“统计显著但实际意义微弱的效应”(如β=0.01也显著),导致结果误导;需结合“理论意义”判断效应量是否有实际价值。  
4. 复杂模型需额外扩容:  
   若平行中介同时包含“调节变量”(如调节中介)或“分类变量”(需哑变量编码),模型自由度降低,需在原有样本量基础上增加20%~30%。




四、总结:平行中介样本量确定流程
1. 明确模型结构:确定X、M(k个)、Y的数量及测量方式;  
2. 获取效应量信息:通过文献回顾、预实验或专家判断确定效应量(f²或β);  
3. 设定统计参数:α=0.05(双侧)、Power=0.8~0.9;  
4. 软件计算:用G*Power或R/Stata计算最小样本量;  
5. 调整样本量:预留10%~20%应对数据缺失,复杂模型额外扩容。  

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2025-10-8 16:45:24
thanks for sharing
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群