rvest抓取淘宝商品信息

wyfhdl

6139

收藏 2015-05-25

复制代码

正常情况下，这样应该就可以获取了，但是在最后输出结果显示为
character(0)

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

offandon

2015-5-31 00:19:33

等待答案。。。。。。。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wyfhdl

2015-5-31 15:18:36

offandon 发表于 2015-5-31 00:19
等待答案。。。。。。。

别等了，似乎是淘宝的保护性问题；
1. 在某些时间段执行代码是可以得到正确答案的，有时候不可以
2. 在可以得到正确结果的时候，即便使用%>%html(encoding="GBK")，最后采用iconv(...)也可以得到非乱码的中文

我在尝试用RCurl 采用getUrl来得到完整的html信息

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

chenjiechao

2015-6-2 01:13:20

请教，最近想通通过r语言来抓取一个网站的数据，该怎么实现，网址是http://www.jisilu.cn/data/sfnew/#tlink_0，求指点一二

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

feng026

2015-6-2 10:19:19

应该是淘宝使用ajax动态读取数据了；

正在尝试使用RCurl；

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

victorchan0633

2015-6-18 20:49:23

chenjiechao 发表于 2015-6-2 01:13
请教，最近想通通过r语言来抓取一个网站的数据，该怎么实现，网址是http://www.jisilu.cn/data/sfnew/#tlin ...

首先加载XML包，然后输入代码
>url<-"http://www.jisilu.cn/data/sfnew/#tlin "
>-url.html<-htmlParse(url,encoding="UTF-8")
就可以得到html信息，如果想抓取部分信息可以再用getNodeSet函数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群