全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1850 4
2017-04-17
如图,我想利用plyr包进行分组数据处理,主要是想先按照ID分类,再对每天的体重进行一个异常值筛选,将异常的体重(比如在上下四分位点之外的)进行一个删除,想问一下plyr这个包是不是可以做到,然后该用什么样的方法去写出这个代码。
附件列表
1.png

原图尺寸 37.59 KB

1.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-4-17 22:15:36
忘记说了,因为数据很多,有18万条左右,有200多个不同的ID和20多个不同的日期。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-18 10:38:10
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-18 13:40:45
stzhao 发表于 2017-4-18 10:38
你好,我运行了一下,这个和我之前用的outliners,箱线图删除异常值差不多,但是存在几个问题,一是还是会存在较小的体重值,第二个是删除了大概一半的数据。
我的想法是比如针对ID为1813这个个体,在7月17日的体重值进行筛选,因为体重是机器测定的,会存在一定的波动,所以要把过小的和过大的异常值删除, 比如10次测定里面,大部分是1.2,1.3左右的,有存在0.9的数据,我想把这个0.9的删除,来保证数据的准确性。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-4-18 14:38:54
想学好R的徐二狗 发表于 2017-4-18 13:40
你好,我运行了一下,这个和我之前用的outliners,箱线图删除异常值差不多,但是存在几个问题,一是还是会 ...
如果想按照ID和日期进行体重值的筛选,只需要在group_by里面加上这两个变量。
复制代码
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群