全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 R语言论坛
9728 11
2014-06-17
    数据中既有分类变量又有连续性数值变量,想用K-prototype方法聚类,但不知道用R如何实现,有没有这方面的包,哪位大神帮帮忙
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2014-6-18 21:46:42
我没有找到相应可以实现k-prototype的包。如果你有相应的数据的话,写一个类似的程序就可以了。
比如,你有training set与testing set.
1.计算testing set中的每一项与training中的每一项的距离。这个时候你要定义相应的距离。k-prototype比较麻烦的就是要确定distance=d1+weight*d2,d1代表连续变量之间的距离,d2代表名义变量的距离。weight代表权重。这个呢,得看实际情况;
2.根据距离大小确定testing set中的每一项的归属。根据投票数确定。
我感觉,除了计算距离上有自己的特别处,k-prototype与knn没有什么不同。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-26 16:37:04
lww1993 发表于 2014-6-18 21:46
我没有找到相应可以实现k-prototype的包。如果你有相应的数据的话,写一个类似的程序就可以了。
比如,你有 ...
谢谢,有没有这方面通用的程序,我不太会编。  我找到一个clus*****包来实现数值属性和分类属性聚类问题,但用自己数据总是出错,有兴趣你可以看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-26 16:38:20
lww1993 发表于 2014-6-18 21:46
我没有找到相应可以实现k-prototype的包。如果你有相应的数据的话,写一个类似的程序就可以了。
比如,你有 ...
谢谢,有没有这方面通用的程序,我不太会编。  我找到一个clus*****包来实现数值属性和分类属性聚类问题,但用自己数据总是出错,有兴趣你可以看看
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-6-26 16:39:24
lww1993 发表于 2014-6-18 21:46
我没有找到相应可以实现k-prototype的包。如果你有相应的数据的话,写一个类似的程序就可以了。
比如,你有 ...
c l u s t M D这个包
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2014-8-6 11:06:32
同问,好像clus*****包的算法不是基于k-means改进来的吧?
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群