全部版块 我的主页
论坛 计量经济学与统计论坛 五区 数据交流中心
817 0
2023-01-09
数据中可能存在一些噪声,因此在正式应用数据前需要对一些异常数据进行剔除,一提出异常数据的原则有三条:
1.使用切比雪规定理,数据在2倍标准差内的数据项为:75%;3倍标准差内的数据为89%,4倍标准差内的数据为94%。对数据分布无要求。
2.经验法则,如果数据呈正态分布:数据在1倍标准差内的数据项为:68%;2倍标准差内的数据为95%,3倍标准差内的数据为100%
3.使用分位数:下限:Q1-1.5IQR,上限:Q3+1.5IQR,其中Q1为四分之一分位数,Q3为四分之三分位数,IQR为四分位距。该方法通常结合箱线图一起进行,更直观。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群