全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
6142 5
2015-06-17

聚类分析和判别分析都是研究事物分类的基本方法,通常我们所研究的指标或数据之间存在不同程度的相似性,聚类分析是采用定量数学方法,根据样品或指标的数值特征,对样本进行分类,从而辨别个样品之间的亲属关系,是一种使用简单但却粗糙的分析方法;判别分析则是在已有分类结果的基础上提取信息,构成判别函数,然后根据判别函数对为之分类样本进行分类的一种方法。

实例42 二阶段聚类分析

功能与意义

主要用于一般的数据挖掘和多元统计的交叉领域-模式分类,其算法适合于任何尺度的变量。

数据来源

QQ截图20150617213330.jpg
分析过程

分析-分类-两步聚类

QQ截图20150617213353.jpg
输出

QQ截图20150617213407.jpg
结果分析

(1)自动聚类分析表

QQ截图20150617213429.jpg

BIC=83.505为最小,此时聚类数为2,即所有给氛围两类比较合适。

(2)各数值变量的质心数

QQ截图20150617213443.jpg
第一类即使用核能的企业有10家,资产收益率较高且成本较低;

第二类即不使用核能的企业有12家,家产收益率较低且成本较高。


实例43 K中心聚类分析

功能与意义

事先指定类别数K,然后不断调整分类中心,直至收敛。适合处理大样本,使用时要考虑量纲差异,不同变量的数量级相差太大,应先对数据进行标准化。

数据来源

QQ截图20150617213500.jpg
分析过程

数据标准化处理

QQ截图20150617224827.jpg

分析-分类-K均值聚类

QQ截图20150617213553.jpg

选项

QQ截图20150617213609.jpg
结果分析

(1)初始聚类中心

QQ截图20150617214336.jpg
(2)聚类成员分析

QQ截图20150617214345.jpg

可以看出每个地区属于哪一类还可以知道每个地区最终聚类中心的距离。

(3)最终聚类中心表

QQ截图20150617214353.jpg
(4)每个聚类中的样本数

QQ截图20150617214405.jpg
聚类1包含样本数最多,3最少。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2015-6-19 09:07:21
楼主如果有兴趣请将你这一系列贴发到经管代码库SPSS版块去吧,让更多的人看到。经管代码库链接:https://bbs.pinggu.org/forum-2626-1.html
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-19 17:19:26
xddlovejiao1314 发表于 2015-6-19 09:07
楼主如果有兴趣请将你这一系列贴发到经管代码库SPSS版块去吧,让更多的人看到。经管代码库链接:http://bbs ...
可以重复发么?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2015-6-21 11:24:27
jpld 发表于 2015-6-19 17:19
可以重复发么?
先发到那边去吧,我们来处理。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-9 21:12:18
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-12 09:41:46
jpld 发表于 2015-6-17 23:22
聚类分析和判别分析都是研究事物分类的基本方法,通常我们所研究的指标或数据之间存在不同程度的相似性,聚 ...
请教一下,K中心聚类分析数据标准化处理的过程具体是怎么做呀?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群