全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
4061 7
2011-11-02
关于如何用sas从网上抓数据,论坛中有很多帖子,感谢各位前辈的分享,从中学到很多。

帖子中提到的方法的思路都是利用filename url语句把要抓取数据的网页的所有的源代码都抓下来放到sas数据集中,在通过data步将要的数据提取出来。

如果我们要的数据在网页的源代码里面有,那就很好办,就比如这个例子中:http://saslist.com/elek/2010/09/15/%E9%80%9A%E8%BF%87-sas-%E8%AF%BB%E5%8F%96%E7%BD%91%E9%A1%B5%E5%86%85%E5%AE%B9/
我们要的数据都在网页的源代码中,只要把含有数据的源代码搞下来放入sas数据集就能通过处理数据得到想要的结果。

但是现在很多网站提供的数据在源代码中都没有,特别是金融类的数据,比如新浪财经上的数据,
http://vip.stock.finance.sina.com.cn/moneyflow/
这些数据都是通过脚本语言动态产生的,在源代码中没有。


请问如果想抓这种数据sas有没有什么方法呢?

谢谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-11-3 10:18:15
求指导!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-3 11:02:55
求指导??
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-3 14:41:16
求指导...
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-3 15:05:43
你说的是动态网页和静态网页的区别问题。
你直接抓源码的不行。要分析网页代码才行。
这个就是国内网站的问题。国外网站,一般都基于xml设计。国内就比较乱。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-11-4 08:45:16
kuhasu 发表于 2011-11-3 15:05
你说的是动态网页和静态网页的区别问题。
你直接抓源码的不行。要分析网页代码才行。
这个就是国内网站的 ...
谢谢指教!
继续学习!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群