全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1803 7
2015-09-14
用R中readHTMLTable函数抓取网页网格数据,抓取的中文老是出现乱码,求指点
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-9-14 08:54:40
library(XML);
u1<-"http://money.finance.sina.com.cn/corp/go.php/vFD_FinancialGuideLine/stockid/000002/ctrl/2010/displaytype/4.phtml";
df2<-readHTMLTable(u1,header = FALSE,stringsAsFactors=FALSE)[[20]];
大家可以试下
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-14 09:42:05
一般都是因为字符集的问题,你可以试一下,然后再看看
df2[,1] <- iconv(df2[,1],"UTF-8","gbk")
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-14 10:05:33
wangluan 发表于 2015-9-14 09:42
一般都是因为字符集的问题,你可以试一下,然后再看看
df2[,1]
可以了,很感谢,你这样设置是把中文的设置为UTF-8还是gbk了?中文在R中哪种编码不出现乱码?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-14 11:40:11
wangluan 发表于 2015-9-14 09:42
一般都是因为字符集的问题,你可以试一下,然后再看看
df2[,1]
????还在吗
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-9-14 22:26:39
zppn123 发表于 2015-9-14 10:05
可以了,很感谢,你这样设置是把中文的设置为UTF-8还是gbk了?中文在R中哪种编码不出现乱码?
取决于网页用的哪种编码
通过鼠标右键--网页源代码,查看源代码,在开头几行看到gb2312,所以用gbk可以
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群