W160912184730Eo 发表于 2024-2-7 15:37 
你好,请问同一公司-年-月,一个高管有多条数据,但两条显示的数据并不一致是什么原因导致的,应该如何处理 ...
这样的情况确实有,不好说什么情况导致的,我的处理方式是在公司-年-月的分组中,各个变量要相互补充缺失值,这样可以确保最大化的利用数据,当然还有一定的可能性是有相互冲突的变量,按理说是不应该有的,这可能是不同来源的原始数据有错误,也可能是公司公布的时候有修订,这个也不用太纠结,样本量占比不高,相互填充缺失值以后duplicate drop, force也可以接受