全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
6010 6
2015-05-25
复制代码



正常情况下,这样应该就可以获取了,但是在最后输出结果显示为
character(0)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-5-31 00:19:33
等待答案。。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-5-31 15:18:36
offandon 发表于 2015-5-31 00:19
等待答案。。。。。。。
别等了,似乎是淘宝的保护性问题;
1. 在某些时间段执行代码是可以得到正确答案的,有时候不可以
2. 在可以得到正确结果的时候,即便使用%>%html(encoding="GBK"),最后采用iconv(...)也可以得到非乱码的中文

我在尝试用RCurl 采用getUrl来得到完整的html信息
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-2 01:13:20
请教,最近想通通过r语言来抓取一个网站的数据,该怎么实现,网址是http://www.jisilu.cn/data/sfnew/#tlink_0,求指点一二
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-2 10:19:19
应该是淘宝使用ajax动态读取数据了;

正在尝试使用RCurl;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-18 20:49:23
chenjiechao 发表于 2015-6-2 01:13
请教,最近想通通过r语言来抓取一个网站的数据,该怎么实现,网址是http://www.jisilu.cn/data/sfnew/#tlin ...
首先加载XML包,然后输入代码
>url<-"http://www.jisilu.cn/data/sfnew/#tlin "
>-url.html<-htmlParse(url,encoding="UTF-8")
就可以得到html信息,如果想抓取部分信息可以再用getNodeSet函数。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群