全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
5215 4
2016-12-03
RT,用R语言rvest包爬取网页数据遇到这样的问题,网址如下:(欧冠杯-分组赛)
http://odds.cp.360.cn/liansai/scorerank?r_a=rQBzUn&leaid=103&season=2015-2016&subseason=%B7%D6%D7%E9%C8%FC
用rvest只能爬A组的比赛,B--H组的爬不了,以下是程序,本人是新手,求大神指教
--------------------------------------------------------------------------------------------------------------
library(rvest)  
url="http://odds.cp.360.cn/liansai/scorerank?r_a=rQBzUn&leaid=103&season=2015-2016&subseason=%B7%D6%D7%E9%C8%FC"
web=read_html(url,encoding="GBK")
#比赛时间
time=web%>%html_nodes(xpath="//tbody/tr/td[@class='gray999']")%>%html_text()%>%.[1:12]
TimeID=gsub("\\D", "", time)
#主队
Home=web%>%html_nodes(xpath="//tbody/tr/td[2]/a")%>%html_text()%>%.[1:12]
#客队
Away=web%>%html_nodes(xpath="//tbody/tr/td[4]/a")%>%html_text()%>%.[1:12]
#比分
TBF=web%>%html_nodes(xpath="//tbody/tr/td[3]/em[1]")%>%html_text()%>%.[1:12]
HBF=web%>%html_nodes(xpath="//tbody/tr/td[3]/em[2]")%>%html_text()%>%.[1:12]
#赛果
SG=web%>%html_nodes(xpath="//tbody/tr/td[5]")%>%html_text()%>%.[1:12]
#基础内容汇总
match=data.frame(TimeID,Home,Away,TBF,HBF,SG)
match


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-12-4 10:35:15
唉,自己顶个。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-12-4 19:01:28
这么好的帖子没人diao,难道我的问题太简单了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-7 19:52:29
楼主,你这个问题最后解决了没有呀?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-12-30 15:21:03
不是江山 发表于 2017-12-7 19:52
楼主,你这个问题最后解决了没有呀?
早解决了,用scrapy爬的,原理差不多
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群