全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SAS专版
15608 24
2009-04-26

本人属于数据挖掘初学者,想用决策树方法进行研究,但是用sas em 树是出来了,可是我不太懂怎么解释,所以希望有哪位大虾能够提供以下这方面的资料,万分感激,拜谢了!!!

我的邮箱:li_shujuan@yahoo.cn

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-4-27 08:34:00
决策树的方法比较常用的就那几种,c3.0,c4.5.c5.0,CART 等,解释的话就是一条条的分类规则,主要是原理,一般的数据挖掘教程上都有,可以在论坛上搜基本数据挖掘的书,呵呵
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-28 09:59:00
那请问如果用sas em 来改变决策树算法应该从哪进行设置呢?还有我不太懂运行tree节点后的那个树形结构的意思,能不能解释一下呢,万分感激啊!!!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-28 12:19:00

我没用过SAS EM决策树算法进行挖掘,以下是参考材料

树表示了通过使用简单的规则而形成的数据的分组。每个规则基于一个输入的值指定一个观测到某个组中,规则一个个的进行应用,形成了组中的层次。这种层级也叫做树,每个组都叫做节点。初始的分组包含了整个数据集,被叫做根节点。最后的节点叫做叶子节点。对于每个叶子节点,作出一个决策并被应用到所有在此叶子中的观测。决策的类型依赖于上下文。在本例所示的预测性建模中,决策只不过就是预测值。

判定树模型容易的容忍在输入变量和目标变量间的非线性关系。它提供了可解释性,并可以不经过单独的插补来处理缺失值。

1. Tree 节点添加到流程图工作区

2. 连接Transform Variables 节点和Tree节点

3. 打开Tree 节点。对于二元目标变量,节点使用卡方检验,默认对于二元目标变量分枝准则的显著性水平为0.200

简单说来,可以使用默认Basic项的设置来拟合模型

4. 选择Advanced 项。由于节点认识到一个启动的损失矩阵已经做过定义,它自动的是指模型评估度量为Average Loss。最佳树将在验证数据集中基于最小化期望损失被建立起来。

5. 使用应用工具箱中的保存图标保存模型。分别在条目中键入模型名称和描述并点击OK.默认,保存的模型名是"Untitled."

6. 使用应用工具箱中的RUN图示训练节点。

7. 当节点结束训练后,点击Message 窗口中的YES观察结果

结果浏览器中的所有项显示如下:

左上角的表总结了全部分类的过程。下面是另一个列出了随着树复杂性的增加在训练和验证集上的期望损失值表。右下角的图以图形化的方式表示了相同的信息。

只有2个叶子节点的树提供了验证数据集上最小的期望损失。验证数据集上的平均期望损失大约是-12(12分的收益)

环形树提供了一个对树复杂性,分枝平衡,判别能力的快速的浏览。环形的中心对应于树的根节点——离中心越远,树就越深。环上的一个分裂对应于树上的分枝。每个环上弧的长度对应于节点的样本大小。较深的颜色表示节点纯度高(这些节点有着最小期望损失值)。评估颜色窗口包含了对应于环形树上的期望损失值的组颜色。

8. 点击View 菜单选择Tree来观察更传统意义上的树图

树的流程图包含了以下的项:

o  根节点居于树中最高的节点,包含了所有的样本。

o  内部节点非末端节点(也包含了根节点),包含了分枝规则;

o  叶子节点 -- 末端节点,包含了对观测样本的最终分类。

可以使用下滑条显示额外的节点。期望损失值被用来递归的划分资料成相似的组。方法是递归的因为每个子组都是从先前分枝中对子分组分割而来的。

在每个节点上的数值标签表示出了树节点找到显著性分枝的点上。位于每个分枝中心的字符卷标是变量名。

当使用损失评估准则建立树时,当使用损失评估准则来建立树时,每行的节点包含了以下统计量:

o  第一行列出了在训练和验证数据集中的好客户的百分比。

o  第二行列出了在训练和验证数据集中的坏客户的百分比

o  第三行列出了在训练和验证数据集中的好客户的人数.

o  第四行列出了在训练和验证数据集中的坏客户的人数

o  第五行列出了在训练和验证数据集中的客户总数。

o  第六行列出了供选择的决策(接受或拒绝).

o  第七行列出了在训练和验证数据集中对于接收决策的期望损失。

o  第八行列出了在训练和验证数据集中对于拒绝决策的期望损失。

9. 关闭结果浏览器并关闭Tree 节点

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-4-28 12:46:00
真是太感谢了,我会好好研读的!!!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-7-18 01:35:17
版主解释的非常好 受益
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群