我有一个数据集,也是用unique study ID表示每一个人,每一个人有一行自己的观测值,变量为这个人使用过的所有药物,共有300多个不同的表示药物的变量,使用过该药物的,变量赋值为“1”,没有使用过的赋值为“0”,有大约100万个observation, 想从其中找出这些人群中常用的药物的组合(药物任意两种,三种,四种,五种的组合),找出这些组合的频数。
数据集节选如下:
N02aa。。。。这些变量表示不同的药物名,左边的数字表示这些人的study ID
想找出比如n02aa和n02ab(两种)同时都为1的有多少个人,或者n02aa n02ab n02ae(三种)同时都为1的有多少个人
求大神们指点!万分感谢!