全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
3221 4
2015-07-14
各位大侠:
利用别人介绍的方法,抓取网页的数据后,导出总是提示如下问题:
> output <- write.table(TableData,file='output.txt',row.names = FALSE)
Error in data.frame(`NULL` = list(V1 = c(2L, 1L, 5L, 13L, 12L, 16L, 3L,  :
  arguments imply differing number of rows: 24, 14, 23, 11, 12, 6, 7, 8

请各位帮忙看看是什么问题?

代码如下:
library(XML);##解析网页用##

URL <- 'http://www.stats.gov.cn/tjsj/zxfb/201412/t20141216_653701.html'

if(url.exists(URL)){

  ##read the special table data##

  TableData <- readHTMLTable(URL)

  ##ok##

}
TableData
output <- write.table(TableData,file='output.csv',row.names = FALSE)

附件列表
未命名.png

原图尺寸 5.88 KB

未命名.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-7-14 18:35:27
晕,你想把19张表打印在一张表里?写表的函数也不对。最后一句改成
write.csv(TableData[[1]],file='output1.csv',row.names = FALSE)
1代表第一个表,换成19就是第19个表
估计写成表了你还找不到表存到哪去了,R命令框左上角有个File -> Change dir ,选择你想存文件的位置,设置一次就好了。再运行你的程序就好了。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-14 20:42:47
万人往LVR 发表于 2015-7-14 18:35
晕,你想把19张表打印在一张表里?写表的函数也不对。最后一句改成
write.csv(TableData[[1]],file='outpu ...
非常感谢。你了解从网页上抓取数据吗?不同类型的网站,需要用到不同的方法和代码,有没有体系化的介绍?感谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-7-15 08:48:07
weberxu 发表于 2015-7-14 20:42
非常感谢。你了解从网页上抓取数据吗?不同类型的网站,需要用到不同的方法和代码,有没有体系化的介绍? ...
只是自己探索,参考
http://www.chuanke.com/3379957-137360.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-8-23 20:20:27
8年来我一直在做网页抓取软件开发,而且一直在维护一个免费软件 集搜客GooSeeker ,目前有3万多用户,定义了超过40万个网站抓取模板,这个月我又升级了一版,把8年来积累的软件和技术都陆续免费开放出来,贡献微薄之力,协助大家玩转大数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群