全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1149 2
2021-03-17
我想获取这个网站中,不同文章的信息,每个文章的页面不同,所以是多页面处理。但是这里一直报错,百度和谷歌都查不出来是什么原因。
library(rvest)
library(stringr)
library(dplyr)
library(xml2)

content = read_html("https://academic.oup.com/dnaresearch/issue/")
a= html_nodes(content, "#ArticleList")%>%html_nodes("a")%>%html_attr("href")
a=a[grepl("/article/", a)]
links=paste0("https://academic.oup.com",a)

year_list=html_nodes(content, "#YearsList")%>%html_nodes("option")%>%html_attr("value")
all_list=paste0("https://academic.oup.com",year_list)
issus_list=html_nodes(all_list, "#IssuesList")%>%html_nodes("option")%>%html_attr("value")


报错是最后一行和倒数第二行,错误如下
Error in UseMethod("xml_find_all") :
  "xml_find_all"没有适用于"character"目标对象的方法

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-3-18 08:59:53
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-3-19 10:03:21
最后一行改成
issus_list = lapply(all_list,function(x)html_nodes(read_html(x), "#IssuesList")%>%html_nodes("option")%>%html_attr("value"))
不知道这是不是你想要的结果
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群