统计R浪人 发表于 2013-11-26 09:04 
示例数据time列是被分类对象,v1~v11是对象参数,聚类时要求同一类中时间是连续的,假如分类后第一类含有 ...
隐约似乎明白点您的意思。那我之前说的方法可能不行。那个是用在classification上的,不是clustering上的。但是你需要自己定义一个相关函数,是的时间不相邻的两个状态的距离足够大,这样聚类时就不会将间断的时间划为一类了。也就是说,比如你的时间点是t1,t2, ... tn,其他数据是x1,x2,....xn。那么你要定义一个距离函数,是的 d((ti,xi),(tj,xj)) > max_{x,y} d((ti,x),(ti,y)) for all i<j-1。 因为做clustering是对整体距离的优化,这样的设计可以保证当 ((t1,x1),(t3,x3))为一类是,(t2,x2)也一定为这一类。否则聚类的结果将不满足最优解。
具体怎么选取函数,就要看你需求了。