全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1177 0
2016-10-24
求教各位大神,我想用R语言抓取网页总页数,网址和代码如下,Tpage应该显示“共53页”的,可是出现乱码,请问是哪里错了该怎么处理?请有空的高人把以下代码放在自己的Rstudio上运行一下,帮我发现以下错误,谢谢了!
library(XML)
library(RCurl)
library(stringr)
url=getURL("http://search.51job.com/list/020000,000000,0000,00,4,99,%25E6%2595%25B0%25E6%258D%25AE%25E6%258C%2596%25E6%258E%2598,2,1.html?lang=c&stype=1&postchannel=0000&workyear=99&cotype=99&degreefrom=99&jobterm=99&companysize=99&lonlat=0%2C0&radius=-1&ord_field=0&confirmdate=9&fromType=&dibiaoid=0&address=&line=&specialarea=00&from=&welfare=")
html_job<-htmlParse(url,encoding="UTF-8")
rootNode_job<-xmlRoot(html_job)
Tpage<-xpathSApply(rootNode_job,"//div[@class='p_in']/span[1]",xmlValue)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群