1.很多人都学过proc fastclus,知道这个过程主要是用来执行k-means算法的。k-means算法只能应用于interval变量,而对于nominal, ordinal, ratio variable,k-means算法是无能为力的;
2.所以后面有人提出了k-mode算法(针对nominal, ordinal, ratio variable)和k-protype算法(针对既有interval variable也有nominal, ordinal, ratio variable)。其实这两种算法的思想跟k-means本身没有什么不同,关键是针对两类问题定义不同的距离(具体可见附件