全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
1020 4
2019-10-19
各位坛友们,你们看,我在做一个多分类模型中遇到这样的混淆矩阵,我该怎么办。我希望非零的数字都在主对角线上,但是模型出来的预测都是在第一行上。我也知道我的样本各个分类的数量不一样。
希望可以提出意见

confusion_matrix.png

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-10-20 12:08:56
这个和是不是R没什么关系吧。通常考虑有几种情况。
1.增加误分类的成本(Cost of Classification)
2.用其他分类器,你现在就只用了SVM吧,而SVM的效果通常也就只取决于几个关键样本(支持向量)。至于检测分类器的表现,可以考虑使用MicroROC的AUC。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-21 06:31:10
owenqi 发表于 2019-10-20 12:08
这个和是不是R没什么关系吧。通常考虑有几种情况。
1.增加误分类的成本(Cost of Classification)
2.用其 ...
好的,感谢回答,这个确实不是只有R、在python里面都有这种情况、这个也不是只有svm才能出现,像别的算法也会出现这结果,感谢您给出另外两种评估方式,我再试一试
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-21 07:24:45
老哥你的样本是不是极度不平衡?

如果是0-30占比比较高的话,分类器会用脚投票,即将所有结果预测为0-30,如果0-30的占比为80%,那分类的准确率也有80%,效果还是不错的哈。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-10-21 08:15:07
jiangbeilu 发表于 2019-10-21 07:24
老哥你的样本是不是极度不平衡?

如果是0-30占比比较高的话,分类器会用脚投票,即将所有结果预测为0- ...
哎,就是这样哇,我觉得现在分类模型在样本极度不平衡情况下,用屁股投票,准确率都很高,但是一点也不符合实际。而且我看现在也没什么好的办法,有的说用算法生成数据,使数据平衡,这东西我试过,一点也不理想。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群