全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2411 2
2021-03-17
悬赏 5 个论坛币 已解决
如题,每个序列号(第一列)都有好几组不同的数据,在R中如何根据序列号分成几个组,第二列的内容作为其中的参数,然后筛选出最近的日期?在选出需要的数据之后,如何才能让后两列数据一起被选中?
另外,还需要对第3列的数据根据同一序列(第一列)进行加总,如何才能实现呢?

这些筛选后的数据,如何才能提取出来,生成在一个新的dataframe呢?

R小白,希望可以有大佬指点一下!如果我的思路过于绕,也希望可以请教一下更简单的处理方式。谢谢!

这是数据:

2

20190112

1

12

2

20190112

5

77

3

20190102

2

20.76

3

20190330

2

20.76

3

20190402

2

19.54

3

20191115

5

57.45

3

20191125

4

20.96

3

20200528

1

16.99

4

20190101

2

29.33

4

20190118

2

29.73

4

20190802

1

14.96

4

20191212

2

26.48


这是我的想法:
排序:2                      3
        20190112         20190102
        20190112         20190330

                               20190402
                               20191115
                               20191125
                               20200528

选出最近的日期,如:2的是20190112   5   77
                                3的是20200528   1   16.99

根据序列号,第3列的加总,如:2 对应的是6
                                              3 对应的是16

最佳答案

szxship 查看完整内容

library(rvest) library(data.table) url = "https://bbs.pinggu.org/thread-10494277-1-1.html" wb = read_html(url) dat = html_table(wb,fill = T)[[5]] %>% as.data.table() id = dat[,.(X2 == max(X2)),by = X1]$V1 dat[,.(max(X2),sum(X3),X4),by = X1]
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-3-17 09:23:49
此帖仅作者可见
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-18 11:10:30
此帖仅作者可见
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群