拿到了年内车险逐笔理赔数据,想按照几个n各风险分类对数据极性预处理,将每一风险单元内的各单笔赔款、索赔次数、风险暴露数等加总得到整理好的新数表,以方便进行冠以线性回归分析,请问用r如何完成预处理工作?(原数据前两行如下)
| veh_value | exposure | clm | numclaims | claimcst0 | veh_body | veh_age | gender | area | agecat | Pure Premium |
1.06 | 0.303901 | 0 | 0 | 0 | HBACK | 3 | F | C | 2 | 0 |
1.03 | 0.648871 | 0 | 0 | 0 | HBACK | 2 | F | A | 4 | 0 |