全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
3837 4
2022-03-02
悬赏 400 个论坛币 未解决
问题描述如下:
对一组面板数据以年份进行分组,如2001年-2006年一组,2007年至2012年一组。
两组分组数据分别用同一个模型做回归分析。模型如: y=α1+α2*X+α3*Ctrl+α4 ,其中X为核心解释变量。
两个回归结果中,核心解释变量的估计系数α2全部为三星显著,但系数大小不同,假定2001年-2006年组系数为 0.02,007年至2012年组为 0.85。
在此结果下,不能用显著性来比较影响程度了,需要比较影响程度的不同,但不能直接用 0.85>0.02 来比较。

问:是否需要以标准化系数的方法作比较?比较的命令是什么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2022-3-11 18:43:36
自己搞明白了,发出来给大家参考吧。

(1)以上问题应归类于分组数据回归,组间系数比较问题。大家在搜索关键字的时候围绕这个来找资料。

(2)为什么在模型完全一样的情况下,组间系数仍不能直接比较?
因为不能确定随机扰动项α4是不相关的。也就是说假如随机扰动项相关的话,系数的大小很可能是由于分组条件下所取得的这一批样本本身导致的,而不能确定在这个分组条件下样本所代表的总体都会有这个特征,可能的情况是取了不同的样本,系数的大小就可能会发生变化。所以在这种情况下不能直接比较系数大小。

(3)组间比较系数大小的方法之一:SUR估计(似不相关估计)。
基于以上原因,想要比较系数大小,需要做的就是否定“两个分组中的两个随机扰动项α4相关”这个假设,确定其不相关之后,就可以比较系数的。做法就是,用系数差异检验否定原假设:两组随机扰动项相关。

(4)代码如下(针对面板数据)
对于面板数据,首先需要去除个体效应,再进行系数差异检验,代码如下:

xtset id Time
local y "因变量"
local x "自变量1 自变量2 自变量3"
bysort id:center `y', prefix(cy_)
bysort id:center `x', prefix(cx_)
xi:reg cy_* cx_* i.Time if 分组条件
est store 结果1
outreg2 using 结果1_系数差异,replace
xi:reg cy_* cx_* i.Time if 分组条件
est store 结果2
outreg2 using 结果2_系数差异
esttab 结果1 结果2

suest 结果1 结果2
test [结果1_mean]cx_自变量1 = [结果2_mean]cx_自变量1

计算出来结果之后,只看p值即可,p值小于0.01,即说明否定了原假设。系数就可以比较了。


如果您看了以上答案,觉得有用的话,一定留言顶贴,让需要的人看到。有时候一个小小的问题就会耽误很长时间,让遇到同样问题的人顺利解决,也是一个贡献。



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2022-3-12 14:49:46
顶一顶
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-3-20 13:35:37
MatthewLiu1979 发表于 2022-3-11 18:43
自己搞明白了,发出来给大家参考吧。

(1)以上问题应归类于分组数据回归,组间系数比较问题。大家在搜 ...
你太强了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-8-27 14:20:01
在面板数据回归分析中,核心解释变量的系数大小确实反映了该变量对因变量影响强度的不同。虽然显著性检验(如t检验或p值)能够告诉我们估计的系数是否显著地不同于零,但它并不直接反映效应的大小或者比较不同模型中的效应强度。

当面对不同时间段内同一模型的核心解释变量估计结果时,可以直接通过比较非标准化的回归系数来初步评估其影响程度的不同。例如,在你给出的例子中,2007年至2012年组中X的影响力度明显强于2001至2006年组。

然而,直接比较未标准化(即原始)系数可能受到变量量纲或尺度的影响,使得这种比较不够直观或者合理。在经济学、金融学等社会科学领域,为了更加公平地比较不同模型或是不同时间段内相同模型的效应大小,研究者通常会采用两种方法:

1. **标准化回归系数**:将所有自变量进行标准化处理(即对每个变量减去其平均值后再除以其标准差),这样得到的回归系数称为标准化回归系数。标准化后,所有的自变量都处于相同的尺度上,使得比较不同模型或不同时间段内的效应大小更为合理。

2. **效应量**:计算效应量是另一种评估和比较不同条件下影响强度的方法。常用的效应量包括Cohen's d、eta-squared等,在多元线性回归中可能更关注标准化的偏回归系数(即β系数)作为效应量的一种衡量标准。

在统计软件如Stata、R或Python中,可以使用特定命令来获取或计算标准化回归系数:

- **Stata**:可以直接对模型加入`i.varname`形式的控制变量进行部分标准化处理,或通过先手动标准化所有自变量再做回归。
  
- **R**:使用`lm.beta()`函数(需要加载`QuantPsyc`包)可以在回归后直接得到标准化系数。

- **Python**:在`statsmodels`库中,可以通过预处理数据实现标准化,然后进行回归分析。

记住,在解释和比较效应强度时,还需考虑模型的假设、残差分布特性以及可能存在的多重共线性等问题。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群