全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
1351 2
2014-03-07
          最近导师要我学习如何用R来抓取网络数据  但一直找不到相关的学习资料  有木有大神指导一下  谢了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-3-7 11:17:03
可能其他的软件更适合
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-3-11 09:26:19
我舉一例做為說明,以下是r的code碼:
#抓取"http://www.google.com/adplanner/static/top1000/"的數據
library(XML)        #您要先裝XML的套件
google="http://www.google.com/"
path="adplanner/static/top1000/"
top1000s=paste(google,path,sep="")       #將html資料先用top1000s命名
table=readHTMLTable(top1000s)              #讀入r中,並以table命名
top1000=table[[2]]                                #將html資料的欄位資料取出,並命名為top1000
colnames(top1000)=c('rank','site','category','user','reach','view','advertising') #重新對top1000的欄位命名
head(top1000)                                       #查看top1000的前六筆資料
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群