R语言获取新浪股票信息乱码问题？

3058

收藏 2015-12-22

各位，我在用RCurl获取新浪股票信息的时候出现乱码，
url<-"http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockStructure/stockid/000786.phtml"
temp<-getURL(url=url,httpheader=myheader,.encoding="gb2312")
#该页面是<meta http-equiv="该页面是<meta http-equiv="[url=]Content-Type" content="[url=]text/html; charset=[/url][url=]utf-8[/url]" />的，
temp<-getURL(url=url,httpheader=myheader,.encoding="utf-8")
我现在想要获取url<-"http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockStructure/stockid/000786.phtml"，怎么解决乱码的问题啊？请各位帮帮忙！

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

jiangbeilu

2015-12-22 14:26:25

你先把要提取的数据弄好，然后用iconv转换一下字体编码就可以实现了。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

expet

2015-12-22 15:53:17

jiangbeilu 发表于 2015-12-22 14:26
你先把要提取的数据弄好，然后用iconv转换一下字体编码就可以实现了。

为什么在原来的变量中不行，一定先要提取出来，这里有什么区别啊？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jiangbeilu

2015-12-22 16:17:53

expet 发表于 2015-12-22 15:53
为什么在原来的变量中不行，一定先要提取出来，这里有什么区别啊？

你可以两个都试一下，主要是减少工作量，少出错。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

expet

2015-12-22 19:29:41

jiangbeilu 发表于 2015-12-22 16:17
你可以两个都试一下，主要是减少工作量，少出错。

两个我都试了，还是不行
> myheader=c("User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; rv:1.9.1.6) ","Accept"="text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8","Accept-Language"="en-us","Connection"="keep-alive","Accept-Charset"="GB2312,utf-8;q=0.7,*;q=0.7")
> url<-"http://vip.stock.finance.sina.com.cn/corp/go.php/vCI_StockStructure/stockid/000786.phtml"
> temp<-getURL(url=url,httpheader=myheader,encoding="gb2312")
> k<-htmlParse(temp)
> title<-getNodeSet(k,'//title')
#返回的是<title>卤卤D<c2><bd>篓2<c4>(000786)1茅卤<be><bd>谩11_D<c2>脿<cb>2<c6><be>-_D<c2>脿<cb>铆<f8></f8></cb></c2></be></c6></cb></c2></bd></be></c4></bd></c2></title>

a <- sapply(title,xmlValue)
wp2=iconv(a,"gb2312","UTF-8")
wp2返回的还是乱码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

jiangbeilu

2015-12-22 20:50:06

expet 发表于 2015-12-22 19:29
两个我都试了，还是不行
> myheader=c("User-Agent"="Mozilla/5.0 (Windows; U; Windows NT 5.1; zh-CN; ...

我用这个，可以实现非乱码显示

复制代码

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群