全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
632 3
2023-01-26
您好,我用随机森林来预测是否一名运动员将入选奥运会,结果用0来表示没有入选,1表示是入选。我得到了预测结果,比如a 是0 b是1 c是1 ,请问如何来判断b的入选可能性高还是c的入选可能性高呢;例如给他们最后预测结果是1的人排个名次,第一名是最有可能入选的。可以在之前的随机森林模型上改善吗。感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2023-1-27 15:19:10
随机森林,虽然可以用于回归,但结果并不如线性回归模型好,甚至会更差。
随机森林,本质上是决策树,主要还是用于分类。
如果要用随机森林实现你的想法,要有足够的样本数能够划分出训练集和测试集,变量也要有尽可能多才适合。
如果目标变量是二分类,结果就是你说的能否入选。但这种情况,是无法比较入选可能性的,算法本身原理不复杂,但执行过程是黑匣子,结果中也没有你能据以判断可能性高低的数据。可以安慰的是,可以判断变量的重要性,提示你需要更关注哪几个变量。
如果目标变量变成入选排名1~3甚至是1~5,那么结果就是入选的可能性高低。模型出来后,用测试集验证一下,检查ROC结果。但问题是,这个变量的取值怎么来的呢?恐怕没有历史数据可用,拍脑袋想也没意义。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-1-31 23:45:54
llb_321 发表于 2023-1-27 15:19
随机森林,虽然可以用于回归,但结果并不如线性回归模型好,甚至会更差。
随机森林,本质上是决策树,主要 ...
非常感谢您认真的回复,我曾经尝试用逻辑回归做过,但是因为变量有十几个且他们之间的共线性太严重了,所以换成了随机森林,我在网上搜索了predict(model, data, type = "prob") ,不知道这是否可以代表选中的概率呢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2023-2-1 01:19:27
llb_321 发表于 2023-1-27 15:19
随机森林,虽然可以用于回归,但结果并不如线性回归模型好,甚至会更差。
随机森林,本质上是决策树,主要 ...
请问有什么更好的方法吗,非常感谢
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群