全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6415 4
2011-03-15
因做毕业论文要用,如果没有具体的算法话无法在论文中使用,求助各位,多谢!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-3-16 13:38:21
具体的算法可以到网上找材料啊,你要是想论文做应用的话,直接用clementine软件去实行不就可以了啊
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-12-25 00:45:03
【转自】基于clementine的数据挖掘
clementine上的特征选择:
1. 从变量自身考察:重要的变量应该是携带信息较多,也就是变量值差异较大的变量【这个用统计上来表示,就是标准差、变异系数之类】so ,clementine的参考标准是
(1)数值型变量变异系数小于某阀值,则该变量视为不重要变量
(2)数值型变量标差小于某阀值,则该变量不重要
(3)分类型变量若某类别值的个数大于某阀值,则该变量不重要
(4)分类型变量若类别值的数量大于某阀值,则该变量不重要
2. 从输入变量和输出变量相关性角度考虑
就是计算 pearson相关系数,方差分析,卡方检验,分别对应2变量类型 为数值×类别
而重要性 不是相关系数的大小,而是相关系数的t检验的1-p值的大小,1-p的值越大,那么相关系数表示的相关性值越可靠,这个输入变量越重要;同理,方差分析,卡方检验,也是通过比较1-F值得到的p的值,越大表示该变量越重要

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-3 13:47:03
夏夜风暖 发表于 2014-12-25 00:45
【转自】基于clementine的数据挖掘
clementine上的特征选择:
1. 从变量自身考察:重要的变量应该是携带信 ...
讲得好!
不过,其他模型中出现的变量重要性不都是只看1-p的大小的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-1-3 13:51:18
IBM SPSS Modeler 15(原Clementine)的算法链接:
https://bbs.pinggu.org/thread-3192274-1-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群