全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1728 3
2016-07-18
现在我用tapply得到了一个包含均值的数据表,想要加上一列:异常值,求大神指教
idVALUEAVG异常值
A

2

2.5

A

3

2.5

B

4

4.5

B

5

4.5

C

6

4.166

C

6

4.166

C

0.5

4.166

0.5

异常值用1.5倍四、二分位数之差,里面的数据均要按照第一列分组计算
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-7-18 21:41:22
我会使用data.table包来做:
比如,读入数据  

dt <- fread("your csv")
dt[, outlier := "1.5倍四、二分位数之差", by = id]

试试看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-7-19 09:20:40
bbslover 发表于 2016-7-18 21:41
我会使用data.table包来做:
比如,读入数据
谢谢,但是里面有个分组求值这个要求
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-7-19 21:33:12
by = id就是按照分组求值。  你弄一个简单的例子试试看。先安装data.table包
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群