全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
2050 0
2012-12-25
刚学DM~Weka里面有一个经典的例子Weather,请问对这样的数据集用K均值聚类,里面包括非数值型数值的属性、二元属性,怎么计算距离呢?又怎么表示每次迭代的质心呢?
编号                 天气              温度          湿度           刮风        是否出去玩
1        sunny        85.0        85.0        FALSE        no
2        sunny        80.0        90.0        TRUE        no
3        overcast        83.0        86.0        FALSE        yes
4        rainy        70.0        96.0        FALSE        yes
5        rainy        68.0        80.0        FALSE        yes
6        rainy        65.0        70.0        TRUE        no
7        overcast        64.0        65.0        TRUE        yes
8        sunny        72.0        95.0        FALSE        no
9        sunny        69.0        70.0        FALSE        yes
10        rainy        75.0        80.0        FALSE        yes
11        sunny        75.0        70.0        TRUE        yes
12        overcast        72.0        90.0        TRUE        yes
13        overcast        81.0        75.0        FALSE        yes
14        rainy        71.0        91.0        TRUE        no
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群