悬赏 150 个论坛币 未解决
数据清理是数据分析阶段前必须要完成的,为了保证数据库中的数据干净、完整。数据库中的数据一般分为两种,第一种是为了试验的最终目的而收集的,包括primary variables 和 secondary variables的数据;第二种是对第一种数据分析产生影响的,但是不是我们主要要进行分析的变量的数据。
对于第一类数据一般是要进行100%的清理,而对于第二类数据是用来进行辅助分析的,只要进行部分的清理就可以进行有意义的统计分析。那我的问题是对于第二类数据,我要计算进行清理到多少才能进行有意义的统计分析,这应该怎么去做?