全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
3369 1
2016-01-25
悬赏 5 个论坛币 未解决
现在在O2O做数据分析,现在正在做用户分析,由于存在用户刷单情况,需剔除刷单用户,用统计语言叫异常值,请问大神,我该如何剔除用户异常值?
字段信息全部都有,有用户订单数量,时间,购买的产品,金额等等
已经知道数据是偏态分布。。。。
求大神解答。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-1-29 00:50:24
刷单用户和普通用户的不同在于下单频率更高?如果是的话,可以看看频率表,把频率特别高的找出来。这是最简单做法。

一般的思路,可以用parametric distribution来fit data, 然后用你的数据和fit出来的分布函数做qq-plot,找出outliers.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群