雾锁山城 发表于 2018-11-29 09:19 
对于实际应用,你应该确定什么是确定的重复,比如
商家ID 产品A 产品B 产品C
1 10 ...
这个对我的启发很大,那比如数据是与时间相关的,比如机器生产制造:
data:
time var1 var2 var3
2018-11-29 10:20:01 51 52 53
2018-11-29 10:20:02 51 52 53
2018-11-29 10:20:03 52 53 53
2018-11-29 10:20:04 51 52 53
这些数据是不同时间产生的,那这些数据有不同的时间标签,那是否可以认为是重复性数据?