全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
1826 7
2024-12-17
各位老哥们,我在做回归分析的时候,对数据用缩尾处理时有一个回归结果不显著,用截尾处理时都显著,那么请问用截尾处理可以吗,我问了导师说可以,但是我看论文基本都是用的缩尾。还有一个问题是截尾时产生的缺失值要不要drop掉呀
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2024-12-18 15:29:40
在进行回归分析前对数据进行预处理是常见的步骤,其中“缩尾”和“截尾”处理分别指的是对极端值(异常值)的不同处理方式:

- **缩尾**处理:通常是指将超出一定范围的异常值拉回到这个范围内。例如,可以使用winsorizing的方法,将极大或极小值替换成一个界线内的最大或最小值。

- **截尾**处理:则是直接删除那些被视为异常的数据点,即不包括在分析中。

你遇到的情况是缩尾后某些回归结果变得不显著,而截尾后则显著。这可能是由于被截掉的点对模型产生了较大的影响,但在统计学上,选择哪一种处理方式取决于多个因素:

1. **理论背景**:首先要考虑数据异常值的原因和你的研究假设。如果这些异常值有合理的解释,并且与你所研究的问题相关,那么应该尽可能保留它们的信息。

2. **数据分析目标**:如果你关心的是总体趋势而非个别极端情况的影响,则缩尾可能更合适。如果认为异常点是由于测量错误或非典型事件造成,截尾可以考虑。

3. **数据分布特性**:数据是否遵循你假设的分布模型?如果不是,异常值的存在可能是合理的,并且应该在分析中予以保留和解释。

关于你的导师提到“可以”使用截尾处理,这表明从实用性和解决当前问题的角度来看是可行的。但是,在发表研究结果时,你应当明确说明采取了何种数据预处理方法及其理由,让读者或审稿人能够理解并评价这种方法对分析结果的影响。

对于**截尾产生的缺失值是否需要drop掉**的问题:

- 如果你的模型能够很好地处理缺失值(例如某些机器学习算法),或者你可以用合适的方法填充这些缺失值,则不一定非要删除。
- 但是,在回归分析中,如果数据点被截去,意味着该观测不再适合作为有效信息用于后续的统计分析。因此,在传统的统计方法中,通常会将这些被截掉的数据点从样本中移除。

最后,无论采取何种预处理方式,都应当在研究报告或论文中详细记录和解释所采取的方法及其理由,以保证研究的透明度和可重复性。

此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-12-18 18:52:37
你需要看看为什么截尾会有不一样的结果
是不是数据中有很离谱的极端值影响了实证结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-12-18 21:53:31
wdlbcj 发表于 2024-12-18 18:52
你需要看看为什么截尾会有不一样的结果
是不是数据中有很离谱的极端值影响了实证结果
那截尾导致的缺失值怎么办呀
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-12-19 08:45:22
点赞分享
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2024-12-19 10:04:25
谢谢分享!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群