全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
3508 7
2008-09-09
我是个新手,现在将从Txt文本导入到数据库中的表中(高频金融时间数据,每天记录可能高达10-15万条记录),结构如下:

成交时间 成交价格 成交数量 成交金额
09:25:00 9.550 200 1910.000
09:30:00 9.540 500 4770.000
09:30:00 9.540 100 954.000
09:30:00 9.530 1000 9530.000
09:30:00 9.520 9000 85680.000
09:30:00 9.520 1000 9520.000
09:30:00 9.520 600 5712.000
09:30:00 9.530 2000 19060.000
09:30:00 9.540 1000 9540.000
09:30:01 9.540 900 8586.000
09:30:01 9.540 300 2862.000
09:30:01 9.540 500 4770.000
09:30:01 9.540 1500 14310.000
09:30:01 9.520 5000 47600.000

注意这个交易数据中的记录是按时间顺序排列,不能打乱,否则没有意义。
现在的要求是,要生成一个新的字段 :“实际成交”,实际成交值根据下面的原则产生:

1.比较时间相邻的二个交易价格,如果后一笔交易价格比前者高,那么实际成交=成交数量(此笔成交数量为正),
否则,实际成交=-成交数量(此笔成交数量为负)。

2.如果二者价格相等,则前面实际成交值为正,那么该笔实际成交也为正,如果为负,该笔实际成交也为负。
新表的根据上述原则,生成新字段如下:

成交时间 成交价格 成交数量 成交金额 实际成交
09:25:00 9.550 200 1910.000 200
09:30:00 9.540 500 4770.000 -500
09:30:00 9.540 100 954.000 -100
09:30:00 9.530 1000 9530.000 -1000
09:30:00 9.520 9000 85680.000 -9000
09:30:00 9.520 1000 9520.000 -1000
09:30:00 9.520 600 5712.000 -600
09:30:00 9.530 2000 19060.000 2000
09:30:00 9.540 1000 9540.000 1000
09:30:01 9.540 900 8586.000 900
09:30:01 9.540 300 2862.000 300
09:30:01 9.540 500 4770.000 500
09:30:01 9.540 1500 14310.000 1500
09:30:01 9.520 5000 47600.000 -5000

请问如何编写?是要用到sql过程和语句吗?(这个表的记录很大,超过了Excel的65525的记录了,不能在Excel里面做,Excel里面很简单)才能达到上述要求,写的比较啰嗦,尽量想比较详细,谢谢大家

我想可能要用到Dif 差分的办法来实现,麻烦哪位高手能不能给个具体指导?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2008-9-9 17:42:00
这个什么东西啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-9-9 17:44:00
是股票的高频金融成交序列,就是逐笔成交数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-9-10 02:36:00

data test;

... (load your dataset here)

Prev成交价格 = lag1(成交价格);

select;
when (成交价格>=Prev成交价格) 实际成交 = 成交数量;

when (成交价格<Prev成交价格) 实际成交 = 0-成交数量;

otherwise;

drop Prev成交价格;

run;

Of course you need to change "成交价格" and so on to your actual variable names. Have fun with SAS!

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-9-10 06:49:00
谢谢楼上的这位兄弟了,我把编辑好后的运行结果给你看看,可能还有部分问题,也许是我编的不对,麻烦你看看

数据集采用的子集的方式,这个会有问题吗?

51   data Level2.Zglt3;
52
53     set Level2.Zglt;
54
55   Prevprice = lag1(price);
56
57   select;
58   when (price>=Prevprice) sjvol = vol;
59
60   when (price<Prevprice) sjvol = 0-vol;
61
62   otherwise;
63
64   drop Prevprice;
     ----
     180
ERROR 180-322: 语句无效或未按正确顺序使用。

65
66   run;

66   run;
        -
        117
ERROR 117-185: 有 1 个未闭合的 SELECT 块。

NOTE: SAS 系统由于错误而停止了该步的处理。
WARNING: 数据集 LEVEL2.ZGLT3 可能不完整。该步停止时,共有 0 个观测和 6 个变量。
WARNING: 数据集 LEVEL2.ZGLT3 由于该步已停止,而没有被替换。
NOTE: “DATA 语句”所用时间(总处理时间):
      实际时间         0.01 秒
      CPU 时间         0.01 秒



二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2008-9-10 08:19:00
非常谢谢楼上的兄弟,在oterwies;语句后再加上End;就可以运行了。

但判断的原则还有点问题,特别是:2.如果二者价格相等,则前面实际成交值为正,那么该笔实际成交也为正,如果为负,该笔实际成交也为负
现在我输出的实际成交结果是:如果2者价格相等,实际成交均为负。

可能还要修改下when语句,麻烦兄弟和其他朋友帮忙看看吧!多谢了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群