全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2246 4
2016-11-09
悬赏 50 个论坛币 未解决
工作需要爬一些品牌名称,今天爬中关村和汽车之家网站时遇到了一些问题。
url='http://www.zol.com.cn/brand.html'
shuma=html_session(url)
shuma_name=shuma %>% html_nodes("td li a") %>% html_text()
节点不管写什么都会报错,网上也没有找到原因。

Error in eval(substitute(expr), envir, enclos) :
   input conversion failed due to input error, bytes 0x95 0xAA 0xD3 0xCE [6003]

是编码问题还是什么呢?爬别的网站都没什么问题,求助大神!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2016-11-9 14:14:38
没人回答吗?我查了可能因为编码是gb2312的原因。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-9 14:43:25
感慨一句,求人不如求己...已解决~改为shuma=read_html(url,encoding='gbk')即可
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2016-11-14 21:38:43
看到0x95 0xAA 0xD3 0xCE [6003]这样奇怪的鬼首先就得想到编码问题,恭喜楼主解决问题了!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-7-7 17:26:40
renjunxiang 发表于 2016-11-9 14:43
感慨一句,求人不如求己...已解决~改为shuma=read_html(url,encoding='gbk')即可
谢谢啊。我也出现类似的问题,不过我改为encoding="gbk",仍然出错,只是代码不同。最后,我改成了,encoding="utf-8",问题解决。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群