全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
3663 8
2013-11-20
最近在看一些文章,关于随机森林的,都说是预测很强。但是这种方法忽视了正态分布之类的等等经典回归的那些假设,不知道究竟哪种方法建模好一些呢?

还在学习中,上面的观点只是抛砖引玉,千万千万表拍死猫。谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-11-20 06:46:11
建议楼主先学习,这些问题如果你真的把理论搞懂了自己就会有判断,即使别人给你什么建议你自己学会需要多长时间?是否可行?这些都是技术应用的成本当加以仔细考虑.
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-20 07:36:58
同意第二楼观点
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-20 09:28:02
经典回归解释性能强,回归系数可以用经济含义解释,适合做实证研究。但由于可能的过度拟合或者拟合不足3问题,可能导致预测性能不佳,要解决这个问题又会涉及到变量选择和变量转换,加惩罚项的问题。
随机森林类似黑箱,模型不易用经济含义解释,但由于在种树时会随机选取特征变量,并汇总每棵树的预测结果(回归问题取均值或众数,分类问题则投票),省去了模型选择的问题,并抑制了过度拟合的现象,从而提高了预测精度,适合用来解决实际问题。随机森林也是用来解决高维数据建模(p>n)的一种思路。
论算法复杂度,通常随机森林更复杂。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-20 14:58:52
牛x牌生发灵 发表于 2013-11-20 09:28
经典回归解释性能强,回归系数可以用经济含义解释,适合做实证研究。但由于可能的过度拟合或者拟合不足3问题 ...
谢谢您的回复。

其实或许这2种方法就不应该做比较?

传统的经典回归通常的步骤是假定分布-假设检验-p值的经典统计过程,但是随机森林完全抛弃了这种思路。
不是说随机森林不好,因为它又给了一个很强的预测。

所以什么时候该用什么方法我依旧很不能确定。或许是用传统的方式建模久了,感觉随机森林这种忽视变量之间关系的方法(例如价格上升,销售数量势必下降,这种简单的关系式都忽视),心里暂时有些难以接受。

抛砖引玉,继续希望高人发表见解,谢谢。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2013-11-21 05:40:50
You know, for traditional regression-based mode,prior assumptions make it far away from reality though simplify the problem and undermine the prediction accuracy. Anyway, it is consistent with causual relationship where economists care about a lot.

RF is supposed to establish a black-box machine. We input everything it requires and it outputs what we need. Compared to statistical or economic theory, efficient algorithm with low computational cost, neat/clean code, and optimized prediction results are much more concerned by machine learning guys
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群