悬赏 10 个论坛币 未解决
问题1:事实上的极大值处理例如有一个字段:最近一次转账距今天数
实际取数时,在365天内有过转账行为的客户,最近一次转账距今天数都是正确的,范围在[0,365];但是对于一年内没有转账的客户,因为系统底层抽数原因统一将值填充为了99999,而且这部分客户的占比很大,请问如何处理这部分的数据呢?
问题2:对于事实上的缺失值
A:例如有一个字段:现金管理类理财金额占总理财金额的比例
这个字段对于未持有理财产品的客户没有意义,因为这个客户本身连理财都没有(也就是说总理财金额为0)。那这个时候,该字段是应该直接空缺么?
B:例如有一个字段:本月发放工资金额
这个字段只对于代发工资客户标志=1的客户才有意义(这些客户才有可能发放工资),那么对于那些代发工资客户标志=0的客户,本月发放工资金额为缺失值,请问需要把这个值设为0还是保持缺失值状态呢?