全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 SPSS论坛
2789 4
2021-01-10
       是这样的,我有一批数据是对一大批人进行了三次测试,其中有部分人是只做了一次(重复个案记为1),部分人只做了两次(重复个案记为01),有部分人是连续三次都做了的(重复个案记为001),我在横向匹配(也就是添加变量)的操作后,进行标识重复个案的操作。
       我的目的是筛选出那批连续做了三次测试的数据,但操作后的结果是类似这样的(如下图所示),也就是001和01以及1这三种标识是打乱的顺序,我不可能一次就把标识为“1”和“01”的数据删掉,我该如何操作才能更快的把标识为“001”的那部分数据给筛出来呀?谢谢各位!
微信图片_20210110103050.png
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2021-1-10 10:49:50
本人举得还是stata好用。。。。。。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-1-10 12:18:31
SPSS---数据---标识重复个案
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-1-10 14:20:10
kuangsir6 发表于 2021-1-10 12:18
SPSS---数据---标识重复个案
我就是进行了这个操作,但我想把重复出现了三次的个案筛选出来,结果中间混入了只出现了两次的,由于数据量庞大,也没办法一个一个的删除,不知道是不是我哪里出错了
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2021-1-14 00:32:28
既然是进行变量添加,而且你的目标是进行了三次测量的个案,那么转换一个思路就可以了——目标应该是选出三次测试中不存在缺失数据的那批人。这只需要在“转换→计算变量”中,计算所有变量的缺失值即可,存在缺失的即是没有做完整所有测验的人(也就是缺了一次或者两次的)。可通过“文件→新建→语法”,输入下方,MISSN这个变量数值为0的,即你的目标个案。蓝色部分的变量名自行更改。
COMPUTE MISSN=nmiss(第一个变量的名字 to 最后一个变量的名字).
EXECUTE.


当然,另一种可能是,有许多个案的测量都是只做了一半题目的,即存在缺失数据,而这部分个案你也想保留,那么就循环使用上述思路。保存好数据备份后,分别计算出个案在三次测量中缺失的变量数,并逐步删除在所有变量上都缺失的个案。

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群