绘制散点图过程中,根据实际情况经常需要将不同群聚的散点归属于某个类别,这在SPSS软件中没有专门的过程,故实现起来多少有点麻烦,例如将图中标识出的观测值迅速的在数据视图下标注出来(左图)。实现的方法是在图形编辑状态下点击转至个案选项,数据视图下的显示如右图。
如何将右图中选中的观测值标识出来,这在观测值比较少的情况下,当然很容易实现,直接手动处理就可以。
假如需选中的观测值很多,这就不太处理了。这里介绍两种相对简便的方法。
1)big data:直接点击右键剪切,然后将这些观测值粘贴在数据的最后面,赋值1(可以直接复制),其他赋值0(使用重新编码为相同变量);或者结合选择个案过程中基于时间或个案全距来处理(确定观测值的对应的id号),当然也可以用计算变量过程。相信这些都并不难。
2)big big data:8千万条的界面数据装载量(实际装置无限),事实上会让我们很多的菜单操作过程相形见绌,而且整个界面的显示效果极差(这是所以统计软件的通病)。这时处理办法是通过程序提取这些观测(类似于剪切),将其复制在另一个数据集中,然后将两个数据集的变量名定义为相同,进行纵向追加的动作,这个过程中把选项将个案源表示为变量就可以了。
如果有更好的方法,欢迎讨论!