预测函数predict的概率阈值设定问题

7908

收藏 2018-02-01

对于二分类模型建立好后，比如随机森林得到一个模型rf.a1,然后需要通过predict函数做预测，那么在语句
predict(rf.a1,testdata)中默认设定预测概率的阈值是多少？是0.5么？比如第一行记录预测值是1，预测概率是0.625。那我可以通过设定预测概率阈值比如大于0.7才预测为1，这个请问怎么实现？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

jmq19950824

2018-12-10 16:00:50

顶一下，同样遇到此问题

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

wangxiaoxiao828

2019-1-25 10:42:34

jmq19950824 发表于 2018-12-10 16:00
顶一下，同样遇到此问题

如果你是用randomForest包, 有个参数是cutoff, 比如cutoff=c(0.7,0.3),就是70%以上投票才记做1

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

赵安豆

2024-5-29 18:45:49

默认情况下，`predict()` 函数在二分类任务中会以 0.5 的概率阈值作为决策边界。

如果你想要自定义这个概率阈值，例如设置为大于 0.7，你可以按照以下步骤操作：

1. 首先预测每个样本的概率值，而不是直接的类别标签。对于随机森林模型 `rf.a1`，你可以使用 `predict_proba()` 函数（注意不是 `predict()`）：

```python
proba_predictions = predict_proba(rf.a1, testdata)
```

2. 然后，根据你设定的概率阈值（例如 0.7），对每个样本的预测概率进行判断，将大于等于这个阈值的样本预测为类别 1，否则预测为类别 0：

```python
custom_threshold = 0.7
categorical_predictions = [1 if prob >= custom_threshold else 0 for prob in proba_predictions[:, 1]]
```

在这个例子中，`proba_predictions[:, 1]` 是测试数据集每个样本的类别 1 的概率。`categorical_predictions` 则是根据你设定的概率阈值（0.7）得出的类别预测结果。

此文本由CAIE学术大模型生成，添加下方二维码，优先体验功能试用

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群