全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件 Stata专版
6067 10
2019-05-30
数据包含几十万的样本量,变量十几个,目前想要筛选出多个(3个以上)变量重复的样本,可能是全部变量都一样,也可能是其中几个变量重复,用duplicates似乎太过繁琐,求助各位大神是否有更便捷的方法。数据参考附件。


附件列表

1.xlsx

大小:18.38 KB

 马上下载

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2019-5-30 22:45:01
所以你是想找出所有变量的排列组合出来的重复情况吗?
把诉求说清晰哟
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-31 08:19:49
ritaing 发表于 2019-5-30 22:45
所以你是想找出所有变量的排列组合出来的重复情况吗?
把诉求说清晰哟
是的,因为不知道是哪几个变量会重复,所以应该是十几个变量做排列组合,多谢大神
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-31 17:06:02
顶一顶,新人求助,请大神们施以援手
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-5-31 23:04:54
天地异灵 发表于 2019-5-31 08:19
是的,因为不知道是哪几个变量会重复,所以应该是十几个变量做排列组合,多谢大神
建议再想想你的目的是什么。
根据目的再看看问题的表达^_^
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2019-6-1 07:03:38
ritaing 发表于 2019-5-31 23:04
建议再想想你的目的是什么。
根据目的再看看问题的表达^_^
原谅我表达能力有限。。。这样说吧,样本中几十万个样本,14个变量,其中有些样本的多个相同变量的值是一样的(比如样本1和样本2,它们的v1是相同的值,v2是相同的值,v3也是相同的值),\"多个\"是1-14的任意值,现在想筛选出3个变量以上相同的样本并把它们标识出来
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群