全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
2440 6
2017-02-19
这两天一直在处理一组数据,探索合适的聚类方法以达到期望的目标,发现基于R现有的常用数据挖掘包(参考帖子http://blog.sina.com.cn/s/blog_99dc1f0a0102vysy.html)的几乎所有算法均不能达到我想要的效果{:3_58:}。。

现在的很是迷茫啊。。{:3_55:}求助高手一探究竟。。ps:尝试了去除极端值依旧无法实现
Rplot01.png
数据的横纵坐标代表的是数据的两个价值维度,数据点越靠近右上角则越优。很明显有三处是集中比较密集的区域,所以我预想的聚类效果应该是这样的:
期望的结果2.png
又或者是这样的分成两类:
期望的结果1.png
然而实际上用kmeans聚出来的是这样的:kmeans(test,3)
实际的结果1.png
一定是我的代码有问题所以我改了下,调整为kmeans(test,3,nstart=30)结果是这样的:
kmeans(test,3,nstart=30).png
感觉kmeans不靠谱,又用基于密度的dbscan算法试了下:
dbscan(test, eps = 0.01, MinPts = 10)
dbscan(test, eps = 0.01, MinPts = 10).png
嗯效果很拙劣。。又试了下传说中的SVM算法,结果是这样的:
SVMtest.png
很迷茫,求论坛大神指点。。
这是数据
dataset.zip
大小:(10.85 KB)

 马上下载

本附件包括:

  • datasetx.csv


复制代码


附件列表

databox.zip

大小:10.85 KB

 马上下载

不要下这个

本附件包括:

  • databox.csv

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2017-2-19 19:58:23
你给上述矩形,画上2条对角线,作为辅助线,试试?

进而,再看看用什么、做什么?


不知能不能有什么用途,有什么启发。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-2-19 20:00:54
或者,你在上述矩形内,添加上一个内接的椭圆,进而,看看能做什么?

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-2-19 20:08:39
上面的图,象灌木丛,进而,可看成树,这个树,有树根部分,树干部分,树枝树叶树冠部分,三部分大体符合一定分布规律,
-------而这,能贴近有关的数学工具。描述大树之类的东西,肯定有数学工具。

-------而有关的数学工具,或许,万一,能够引入到上述图形当中来。


--------而右上方,可看成太阳、阳光。阳光对树枝树叶树冠的分布,是有吸引力的。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-2-19 21:21:41
1993110 发表于 2017-2-19 20:08
上面的图,象灌木丛,进而,可看成树,这个树,有树根部分,树干部分,树枝树叶树冠部分,三部分大体符合一 ...
大兄弟。。我也知道,肯定有,“合适的数学工具”能把这三部分,分割出来,但是啊,我也试过把星星、月亮、太阳挡住来做,还是没能成功,这个如何是好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2017-2-19 21:23:27
1993110 发表于 2017-2-19 20:08
上面的图,象灌木丛,进而,可看成树,这个树,有树根部分,树干部分,树枝树叶树冠部分,三部分大体符合一 ...
大兄弟。。我也知道,肯定有,“合适的数学工具”能把这三部分,分割出来,但是啊,我也试过把右上角的星星、月亮、太阳挡住来做,还是没能成功,这个如何是好。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群