全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学
2010-5-11 16:42:00
就不要用什么HASH对象的东西在这里了,楼主你就用soporaeternus 的程序或者pandasasa第一个程序,简洁易懂.如果有兴趣者,可以测试不同程序的效率.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-11 16:42:19
30# cz851218

其中数据A中包含一只股票的DATE TIME CLOSE OPEN HIGH LOW这样六个变量 ,而C数据中含有DATE TIME LX SX四个变量。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-11 21:41:27
4# nkwilling

你的程序没有给出C变量。不过,也是出乎意料的快啊。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-11 22:06:26
28# pandasasa
你的程序没有给出c变量
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-11 23:38:38
31# nkwilling

if gap = 5 and nobs = 1e7; test samples = 72 and follow by different running order. unit = second


jingju = 16.4 sop = 15.7 bobguy = 9.7

p = 0.46 between jingju and sop
p<0.0001 for bobguy to the other two.


conclusion: Bobguy's code is significantly faster the other two, and the other two not significantly distinct (p = 0.46)

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-12 03:29:35
其实效率很可能是一个变化的函数。本人非常认真的在自己的电脑(联入network)运行不同的程序,差不多五六个小时。time Window 从5 变到500.行数是10,000,000. 结果报告如图所示。
我的认识是效率的benchmark很难确定,受制于诸多的因素。
另外bobguy的程序略有误差。也可能是我和sop错了。不过当不影响测试‘效率’。其他的程序由于没有算出c值故此暂时略过。hash太复杂,也略过。重申,此结果只反映在鄙人的电脑上的今天下午的运行情况。如果有差异,不负责。
测时的程序类似于

复制代码

有人建议用stimer。本人不理解其真正含义而舍弃。
附件列表

comparison.doc

大小:70.5 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-5-12 15:03:19
个人认为bobguy的程序虽然测试最快,确实数据全量进memory是极端了,但是此例没比较性,楼主数据量海量,memory存全量不可能实现。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2010-10-14 16:23:28
mark!~~~~~~~~~~`
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群