全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
4637 5
2016-08-29
网址:http://xh.5156edu.com/ciyu/z4998m5241j1770.html
怎样才能如抓取出这个词语表格呢?哪位大神懂得R的网络爬虫,让我们开开眼界,好么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-8-29 20:14:54
我用了RCurl
url = "http://xh.5156edu.com/ciyu/z4998m5241j1770.html"
wp <- getURL(url)
doc <- htmlParse(wp,asText = TRUE)
tables <- readHTMLTable(doc)
可是并不成功,提示
Error in nchar(els[[1]]) : invalid multibyte string, element 1
据说内码错误还是冲突
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-29 20:16:45

我用了RCurl

wp <- getURL(url)
doc <- htmlParse(wp,asText = TRUE)
tables <- readHTMLTable(doc)
可是并不成功,提示
Error in nchar(els[[1]]) : invalid multibyte string, element 1
据说内码错误还是冲突
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-31 09:02:32
library(rvest)
words <- read_html("http://xh.5156edu.com/ciyu/z4998m5241j1770.html",encoding = 'gbk')
html_table(html_nodes(words, "table"),fill = TRUE)[[7]] 941D.tmp.jpg
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-8-31 21:20:43
明建川 发表于 2016-8-31 09:02
library(rvest)
words
哇哇,好厉害诶,完美解决,开眼界了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2018-8-30 22:37:43
明建川 发表于 2016-8-31 09:02
library(rvest)
words
我也学到了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群