全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
825 1
2019-09-25
悬赏 50 个论坛币 已解决
想批量抓取帖子内容,先把帖子超链接下载下来构造了一个向量,但是后面的循环不会写,求救

urlparty="http://dangjian.people.com.cn/n1/2019/0920/c117092-31363966.html"

list = read_html(urlparty) %>%
  html_nodes(".show_text a")%>%
  html_attr("href")

vector1 = c(list)

content = read_html(vector1)%>%

for (url in vector1){
  read_html(url)%>%html_nodes(".show_text p")%>%html_text()
}

最佳答案

cheetahfly 查看完整内容

read_html(content) %>% html_nodes(".show_text p") %>% html_text() %>% str_c(collapse = "") %>% str_remove_all("\t")
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-9-25 16:28:02
read_html(content) %>%
  html_nodes(".show_text p") %>%
  html_text() %>%
  str_c(collapse = "") %>%
  str_remove_all("\t")
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群