全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
14437 11
2013-02-27
怎么用R进行网页上的数据抓取,回答的好赏大洋啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-2-28 06:06:01
R的文本处理不是很强,为什么用R做这个?奇怪的问题。感觉像那根树枝上山打老虎去
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-28 09:25:58
帮顶
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-28 11:34:39
如果用Python或者C#可能更容易。但是R本身也有很强的处理功能。
用regular expression. 将html的source打开,比如可以将其按照txt的格式打开。里面的编码都是有规律的,接下来用regular experssion打开。比较常用的函数有gsub, strsplit, grep等,lz可以自己看帮助文件。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-2-28 21:51:11
谢谢了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-4-23 12:05:29
用XML包进行网页文本、表格抓取
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群