[求助] 对于聚类方法的选择很是迷茫，使用的聚类方法与期望的效果相去甚远。。

2440

收藏 2017-02-19

这两天一直在处理一组数据，探索合适的聚类方法以达到期望的目标，发现基于R现有的常用数据挖掘包（参考帖子http://blog.sina.com.cn/s/blog_99dc1f0a0102vysy.html）的几乎所有算法均不能达到我想要的效果{:3_58:}。。

现在的很是迷茫啊。。{:3_55:}求助高手一探究竟。。ps：尝试了去除极端值依旧无法实现

数据的横纵坐标代表的是数据的两个价值维度，数据点越靠近右上角则越优。很明显有三处是集中比较密集的区域，所以我预想的聚类效果应该是这样的：

又或者是这样的分成两类：

然而实际上用kmeans聚出来的是这样的：kmeans(test,3)

一定是我的代码有问题所以我改了下，调整为kmeans(test,3,nstart=30)结果是这样的：

感觉kmeans不靠谱，又用基于密度的dbscan算法试了下：
dbscan(test, eps = 0.01, MinPts = 10)

dbscan(test, eps = 0.01, MinPts = 10).png

嗯效果很拙劣。。又试了下传说中的SVM算法，结果是这样的：

很迷茫，求论坛大神指点。。
这是数据

dataset.zip
大小:(10.85 KB)

马上下载

本附件包括：

datasetx.csv

复制代码

附件列表

databox.zip

大小:10.85 KB

马上下载

不要下这个

本附件包括：

databox.csv

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

全部回复

1993110

2017-2-19 19:58:23

你给上述矩形，画上2条对角线，作为辅助线，试试？

进而，再看看用什么、做什么？

不知能不能有什么用途，有什么启发。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

1993110

2017-2-19 20:00:54

或者，你在上述矩形内，添加上一个内接的椭圆，进而，看看能做什么？

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

1993110

2017-2-19 20:08:39

上面的图，象灌木丛，进而，可看成树，这个树，有树根部分，树干部分，树枝树叶树冠部分，三部分大体符合一定分布规律，
-------而这，能贴近有关的数学工具。描述大树之类的东西，肯定有数学工具。

-------而有关的数学工具，或许，万一，能够引入到上述图形当中来。

--------而右上方，可看成太阳、阳光。阳光对树枝树叶树冠的分布，是有吸引力的。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

lich.huang@qq.c

2017-2-19 21:21:41

1993110 发表于 2017-2-19 20:08
上面的图，象灌木丛，进而，可看成树，这个树，有树根部分，树干部分，树枝树叶树冠部分，三部分大体符合一 ...

大兄弟。。我也知道，肯定有，“合适的数学工具”能把这三部分，分割出来，但是啊，我也试过把星星、月亮、太阳挡住来做，还是没能成功，这个如何是好。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

lich.huang@qq.c

2017-2-19 21:23:27

1993110 发表于 2017-2-19 20:08
上面的图，象灌木丛，进而，可看成树，这个树，有树根部分，树干部分，树枝树叶树冠部分，三部分大体符合一 ...

大兄弟。。我也知道，肯定有，“合适的数学工具”能把这三部分，分割出来，但是啊，我也试过把右上角的星星、月亮、太阳挡住来做，还是没能成功，这个如何是好。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

点击查看更多内容…

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群

扫码加我拉你入群