全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2819 3
2014-01-22
关于破产预测,国外很多文献都是用3年连续的数据来预测,多是用neural network现在我想用决策树来做一个破产预测,其实也就是两个类别的分类,70多个解释变量,可是每个解释变量有3年的数据,不知道怎么才能结合在一起用决策树做分析呢。
平时都不存在有时间序列这样,一般就是单个的观测点,每个观测点有70个解释变量的数据而已。不知道怎么才能把每个观测点,70个解释变量,每个解释变量有3年的数据,这样的信息结合起来使用。文献上大多都没说明
不知道有没有有经验的大神可以指点呢。
我比较惯用R里面的rpart
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-1-22 21:21:36
这是一个复杂的问题。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-1-28 15:12:27
比较想知道所谓的3年时间序列数据是什么粒度的,难道是日度或月度数据吗?如果是月度数据,用时间序列方法作没有什么太大的用处,因为数据序列预测都是短期预测,往前预测几个月也没什么意思吧.建议用这3年的数据作出一些指标,然后当横截面数据用,比如波动率,季节周期什么的.
如果是年度数据,样本量又太少了,连波动率都计算不了,只能当横截面数据用.在财务分析中,经常用2-3年移动平均计算指标,因为这样才稳定,用一年的数据噪声太大.所以不用考虑时间序列什么的.

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-1-29 13:03:01
太复杂了,无能为力啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群