悬赏 10 个论坛币 未解决
数据大神们,我在处理有序多分类Logistic回归模型时遇到一个问题,查了很多资料没明确,想咨询下大家:
我用的有序多分类logisitic回归模型建立了一个客户逾期状态的数学建模,分成了正常、关注、坏账三类客户,但三分类的样本容量大概是2500:60:100,这样的数据直接运行是不是不科学?是否需要进行比例设置或者筛选?
另外:我查阅了很多文献都是直接原始数据运算,也看到二分类logistic模型的正常和坏账的样本按照7:3或者1:1,不同比例样本容量,对结果影响大不大?
大神们给解答下,谢谢!