全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
1850 1
2013-07-30
要做一个分类模型。首先用了参数方法,脚本如下,最终执行结果错误率比较高。
DATA work.VW_YG_DATA;
PROC DISCRIM distance OUTSTAT=DISSTAT PCORR POOL=TEST ANOVA MANOVA CROSSLISTERR;
CLASS ISSALE;
VAR SEX AGE GZPHD TDPHD BXRKD ISHAVESB CAREER VILLAGE PPZXD;


由于以上的分析结果,错误率比较高,心想是不是有问题。对所有变量进行正态分析,有一个变量的正太分布不是很好.
就改用非参数方法进行分析,脚本如下:

DATA work.VW_YG_DATA;
PROC DISCRIM method = npar R = 0.2 distance;
CLASS ISSALE;
VAR SEX AGE GZPHD TDPHD BXRKD ISHAVESB CAREER VILLAGE PPZXD;
RUN;


这个执行完之后,错误率是9%,觉得效果还挺不错,再试着把R值改为0.1,错误率变成了2%.再把R值改成0.4时,错误率又变为了18%。真不知道这个R值到底该取多少,这个问题一直在困惑我。问了好多人都不太清楚,求大牛指点!!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2013-7-31 13:38:23
只能自己顶了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群