全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4118 4
2018-04-10
本人刚开始学习R语言,怕网页遇到个问题。用以下代码爬取了首页表格,之后想用for循环翻页发现翻页后url不变,查了半天度娘没找到方法!求大神解惑!
url <- "http://datacenter.mep.gov.cn/websjzx/report!list.vm?xmlname=1512478367400&roleType=CFCD2084&permission=null"
data <- read_html(url,encoding = "UTF-8")%>%html_nodes("div.report_main")%>%html_nodes("table.report-table")%>%html_table(header = T,trim=T,fill=T)%>%as.data.frame()

原网页:http://datacenter.mep.gov.cn/web ... 084&permission=null
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2018-4-11 14:07:42
独脚蜥 发表于 2018-4-10 22:45
本人刚开始学习R语言,怕网页遇到个问题。用以下代码爬取了首页表格,之后想用for循环翻页发现翻页后url不变 ...
没人呢么
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-11 23:15:02
独脚蜥 发表于 2018-4-11 14:07
没人呢么
楼主可以尝试用python爬一下看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-12 13:11:11
此网站,还在试运行。。你给的网站的第一页面,源代码完整,第二页面就不行了。。审查元素的功能,也没有。。等其完善了,再试吧!!!
正常,若翻页面,网址不变,可通过“审查元素”(按鼠标右键,获得)功能中“Network" 可查找实际网址!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-4-12 20:18:14
jgchen1966 发表于 2018-4-12 13:11
此网站,还在试运行。。你给的网站的第一页面,源代码完整,第二页面就不行了。。审查元素的功能,也没有。 ...
好的,谢谢指教!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群