请问有没有大神指导一下R来抓取网络数据的过程

xdlz584

1413

收藏 2014-03-07

最近导师要我学习如何用R来抓取网络数据但一直找不到相关的学习资料有木有大神指导一下谢了！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

hyu9910

2014-3-7 11:17:03

可能其他的软件更适合

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

zhu334334334

2014-3-11 09:26:19

我舉一例做為說明,以下是r的code碼:
#抓取"http://www.google.com/adplanner/static/top1000/"的數據
library(XML)       #您要先裝XML的套件
google="http://www.google.com/"
path="adplanner/static/top1000/"
top1000s=paste(google,path,sep="")    #將html資料先用top1000s命名
table=readHTMLTable(top1000s)             #讀入r中，並以table命名
top1000=table[[2]]                               #將html資料的欄位資料取出，並命名為top1000
colnames(top1000)=c('rank','site','category','user','reach','view','advertising') #重新對top1000的欄位命名
head(top1000)                                     #查看top1000的前六筆資料

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群