全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
2031 1
2013-01-10
RT,我这有一批大数据,里面有个字段,从1到几千,我想用EM做决策树. 分析之前想先处理下极值,一般从数据分析的角度来讲,需要平滑多少占比的数据? 目前我是这样的,

A>800的占总数据的10%,那将>800的A全置为800.这样对吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-1-11 12:58:51
你需要确定异常的标准,不能看比例,如果数据大部分异常,需要调整理论模型。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群