全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
5133 3
2011-05-15
本人乃BI白痴一名,在做作业的时候遇到了困难,希望大家可以解救一下。
    题目如下(利用SAS的EM做):把k均值算法运用到保险欺诈案例中,并且使用6个标准的输入变量。把K设定为2,代表有2类结果。把前1000个观测值作为训练数据集,运用到后1000个观测值。区别不同类型,并且解释结果。
    其中,对于“把前1000个观测值作为训练数据集,运用到后1000个观测值”这句话的意思不是很理解,在SAS中,我应该怎么做???
附件列表

Fraud.xls

大小:583 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-7-22 15:26:05
这个就是聚类模型的应用,利用前一千个观察值进行聚类,等得到有价值的聚类结果了(比如综合考虑后发现分为5组最有意义),然后就拿这个聚类模型去对后面的一千个观察值进行划分(哪些观察值可以归纳为甲类,哪些可以归纳为乙类,等等)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-9 09:54:59
不懂、、、
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-9-18 03:31:33
秋稔 发表于 2014-8-9 09:54
不懂、、、
属于英语直译的问题,你说的观测就是validation的意思
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群