全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1768 2
2014-12-05

网上看见有人统计安徽各市区PM2.5监测站数量,在大数据时代,这种累活应该交给机器去做。


library(rvest)


url = "http://www.aepb.gov.cn/Pages/Aepb14_SJZX.aspx"

anhui = url %>% html() %>% html_nodes("table") %>% .[[10]] %>% html_table()

city = anhui[1]


a = url %>% html() %>% html_nodes("table tbody a") %>% html_attrs()

a = as.character(a)

b = paste("http://www.aepb.gov.cn/Pages/",a,sep = "")


myfun = function(x) b[x] %>% html() %>% html_nodes("table") %>% .[[10]] %>% html_table(fill = T) %>% nrow()


site = sapply(1:length(b),myfun)


data = data.frame(城市 = city,监测站数量 = site)

data

    城市 监测站数量

1    合肥         10

2    淮北          3

3    亳州          2

4    宿州          3

5    蚌埠          6

6    阜阳          3

7    淮南          6

8    滁州          3

9    六安          4

10 马鞍山          5

11   芜湖          4

12   宣城          3

13   铜陵          6

14   池州          3

15   安庆          4

16   黄山          3




二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-12-5 13:36:31
这才是真正的大数据!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-6 09:04:29
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群