全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3825 5
2019-01-30
R语言
read_html(https://list.tmall.com/search_pr ... mp;type=pc#J_Filter)
报如下错误:
Error in doc_parse_raw(x, encoding = encoding, base_url = base_url, as_html = as_html,  :
  Input is not proper UTF-8, indicate encoding !
Bytes: 0xEC 0xC3 0xA8 0x74 [9]


有电脑就不报错,R的版本一样,求大神告知为什么,谢谢~~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-1-31 10:49:12
编码不是UTF-8格式,从源码来看是GBK格式的
使用guess_encoding()用来探测文档的编码
https://rdrr.io/cran/rvest/man/encoding.html
如果这可以帮助到你,请帮我评分,评分选项在我回复页面的右下方。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-31 12:14:04
网址是不是要加引号?我不加引号就报错,不过报错内容不一样
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-1-31 14:14:40
jimozhegu 发表于 2019-1-31 12:14
网址是不是要加引号?我不加引号就报错,不过报错内容不一样
网址要加引号的。
请你把完整的代码和报错内容贴出来,以方便查找错误。
如果这可以帮助到你,请帮我评分,评分选项在我回复页面的右下方。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-2 09:38:27
jimozhegu 发表于 2019-1-31 12:14
网址是不是要加引号?我不加引号就报错,不过报错内容不一样
是要加引号的,你加了能正常运行吗 ?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-2-2 09:39:54
铁锷未残 发表于 2019-1-31 10:49
编码不是UTF-8格式,从源码来看是GBK格式的
使用guess_encoding()用来探测文档的编码
https://rdrr.io/cr ...
不确定是不是编码的问题,搞不出来,还是谢谢你~
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群