关于响应模型中数值型自变量的处理
nkwilling 书里关于数值型自变量是进行过清理、缺失值填充后进行了一步分位数指示器转换,
除个别取sin cos函数外,其他皆按其最显著的一个分位数做为基准进行转换,皆被
转换中0和1两个值,以此降低预测变量方差波动。
这种方法是否凭空削减了自变量的信息,相比传统做法直接进行标准化有什么优点,
又或者把其也转换成各个水平(记作1,2,3,4。。。。),然后同书中字符型变量以
相同方法处理后回归是否比转换成0,1保留更多自变量信息??
望老师点评一二,抑或版主、高手们不吝赐教。