在有些比率值(如研发密度)变量中,有些记录值往往高得离谱,在这种情况下,是直接将其删除,还是做Winsor处理。处理的比例一般为多少?1%,5%?
是不是需要对所有的变量进行统一的处理(winsor 及其比例),还是只需要针对一些敏感的变量进行处理?
请注明:姓名-公司-职位
以便审核进群资格,未注明则拒绝