我正在做一项关于代际划分的研究,想要通过1977年后图书馆学的学生所在班级选择图书馆学专业的比例的变化进行代的划分。目前聚类结果如下:
聚类分析结果发现,数据在被逐步归为2类后趋于稳定,即1977年恢复高考后的图书馆学就读者可以被划分为2代。分别为1978-1989年、1987-2011年两代(以下分别简称为“第一代”与“第二代”)。
现在的问题在于:“由于2位1987级图书馆学学生同时提供数据,且经分析被归至2类,因而无法避免代际划分中两代具有重叠年份的问题。”导师认为代际的划分存在年份的重叠不妥,建议我再修正这个代际划分的结论。
不过我觉得数据就是显示的这个样子也没有办法了,所以请问大家是就原样呈现数据的样子还是能够根据步骤图冰柱图谁先并入哪一类能给个解释?
从步骤表和冰柱图来看,同样来自于1987年的两个case,30和31,31先被纳入第二代的类目,那么1987年应该是划分到第二代之中吗?(可是怎么证明31就能代表1987年呢?)
这是使用欧式距离计算结果
求大家帮忙解决,谢谢!