yaoqsm321 发表于 2016-12-14 11:26 
我把788个小样本复制了两遍,然后加进了原数据,数据结构变成了6689个总数据,其中1为4324,0为2364个,然 ...
仅仅复制已有数据,没有增加任何新信息量,结果“突一下”变好了,可信吗?? 当然不可信!!!
据我对你数据分析,用测试数据集(test dataset )的AUC 作模型绩效标准,用 downsample、upsample、smote 、还是,用ROSE , 测试数据集的AUC ,约相同,为 0.605-0.635,没啥子实质改善!!!
你的数据集,非常不规整,理应进行进一步的预处理,并且,这些变量也不是很有效,在实际工作,必然要进一步收集新变量的数据!!!!