全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
1653 3
2012-03-16
做logistic regression回国前准备:

1. independent variable:国外金融论坛有关交易词汇的统计:比如“trader,indicator, long, short, market, crazy”等有160个词汇的每日出现的相对频率,经过normalization,比如trader 的出现的次数除以当天总的帖子数目。
2. 预测对象:binary variable: 明日的volatility是否是top 15%, 比如大于60%这个值。 这样1 为大于,0 为小于。

用sas的logistic regression做回国,方法backward,因为不可能160个词汇都有预测能力,所以希望削减variable数量。
模型stay的标准0.05,

结果如下:



问题,最后sas给我选出来的可预测的词汇有52个之多,如上图,df比较高,可是其结论是这样的模型fit最好,这里是否有overfit的隐私存在呢,或者其他的一些明显的缺点呢?谢谢大家了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2012-3-16 21:34:11
没人解答啊,先谢一下吧。顶一下吧
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-18 22:17:09
LZ选择的自变量数量是不是太多了一点。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2012-3-31 12:46:06
搞定了,hoho,自己搞定的
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群