全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
6311 12
2010-12-14
求高人指点如何从网页:http://vip.stock.finance.sina.com.cn/moneyflow/
上下载数据,谢谢谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2010-12-15 09:43:34
以前好像有看过用SAS抓取url里面内容的,但是好像很费劲。
SAS很牛,但他不是万能的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-16 13:55:05
找到一些资料:
SAS使用技巧- 动态抓取外部URL的网友内容使用之前先要注意一下SAS的版本,SAS8的话需要打补丁,并且好像SAS网站上没有直接的补丁,需注意了,9版当然就没有这问题了。

其实实现这已内容很简单,就是通过SAS的DATA STEP来实现

首先:需做一个逻辑文件名引用到该URL地址
然后通过DATA STEP都该文件名即可把内容读取出来
代码如下:
filename 引用名 url 'URL地址' RECFM=v(读取格式,V表以文本格式读取) lrecl=N(每行最长的记录) ;
data 表名;
file _webout;
infile 引用名 LINESIZE =N pad ;
length content $32766. ;
input content $char32766.;
run;

即可实现抓取URL所指向的网页内容,但是很奇怪的是,联系运行上面代码会造成SAS崩溃,真是奇怪,后来把代码改成如下:

filename 引用名 url 'URL地址' RECFM=v(读取格式,V表以文本格式读取) lrecl=N(每行最长的记录) ;
data 表名;
file _webout;
infile 引用名 ;
length content $32766. ;
input content $varying32766.;
run;
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-16 18:46:06
非常感谢楼上,这个方法我试过,但这样处理的结果是,所有内容都会被放在一个变量里,而不是各自区分开来,期待有更好的解决办法!!谢谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-17 10:27:36
尝试用input 控制字段
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-12-18 10:37:00
如何控制呢,能不能给个具体的程序,谢谢谢谢!!!!!!!!!!!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群