默认情况下,`predict()` 函数在二分类任务中会以 0.5 的概率阈值作为决策边界。
如果你想要自定义这个概率阈值,例如设置为大于 0.7,你可以按照以下步骤操作:
1. 首先预测每个样本的概率值,而不是直接的类别标签。对于随机森林模型 `rf.a1`,你可以使用 `predict_proba()` 函数(注意不是 `predict()`):
```python
proba_predictions = predict_proba(rf.a1, testdata)
```
2. 然后,根据你设定的概率阈值(例如 0.7),对每个样本的预测概率进行判断,将大于等于这个阈值的样本预测为类别 1,否则预测为类别 0:
```python
custom_threshold = 0.7
categorical_predictions = [1 if prob >= custom_threshold else 0 for prob in proba_predictions[:, 1]]
```
在这个例子中,`proba_predictions[:, 1]` 是测试数据集每个样本的类别 1 的概率。`categorical_predictions` 则是根据你设定的概率阈值(0.7)得出的类别预测结果。
此文本由CAIE学术大模型生成,添加下方二维码,优先体验功能试用