全部版块 我的主页
论坛 提问 悬赏 求职 新闻 读书 功能一区 经管百科 爱问频道
12146 11
2014-02-19
各位高人,本人想求助一个问题,R程序中聚类分析是针对于距离的计算进行的分类,那么非数值型的应该怎么聚类啊?谢谢大家了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-2-19 20:33:39
Use the k-medoids
并不是所有的数据都能满足这样的要求,对于数值类型的特征,比如身高,可以很自然地用这样的方式来处理,但是类别 (categorical) 类型的特征就不行了。举一个简单的例子,如果我现在要对犬进行聚类,并且希望直接在所有犬组成的空间中进行,k-means 就无能为力了,因为欧氏距离 \|x_i-x_j\|^2 在这里不能用了:一只 Samoyed 减去一只 Rough Collie 然后在平方一下?天知道那是什么!再加上一只 German Shepherd Dog 然后求一下平均值?根本没法算,k-means 在这里寸步难行!

在 k-medoids 中,我们把原来的目标函数 J 中的欧氏距离改为一个任意的 dissimilarity measure 函数 \mathcal{V}:

\displaystyle\tilde{J} = \sum_{n=1}^N\sum_{k=1}^K r_{nk}\mathcal{V}(x_n,\mu_k)
cluster
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-20 17:27:26
恩,不太清楚你是用了什么非数值型变量。但是我们在处理数据的时候很多时候都需要将定性的指标量化处理。可以赋值处理吧。
附件是有关数据标准化的处理办法。希望能帮到楼主!
附件列表
数据标准化.JPG

原图尺寸 113.06 KB

数据标准化.JPG

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-2-23 17:08:40
燕儿ida 发表于 2014-2-20 17:27
恩,不太清楚你是用了什么非数值型变量。但是我们在处理数据的时候很多时候都需要将定性的指标量化处理。可 ...
谢谢您了,我会仔细想想的,再次感谢!!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-8 21:07:16
是无量纲化的过程吗,可以考虑用无量纲化的过程处理非数值数据,前提是有作为标准的数值数据
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-4-12 11:17:48
dash731 发表于 2014-4-8 21:07
是无量纲化的过程吗,可以考虑用无量纲化的过程处理非数值数据,前提是有作为标准的数值数据
那么可以自己设定一个标准吗?然后进行相关距离的计算可以吗?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群