老师,您好,请教您一个关于数据处理的问题。具体数据结构见截图。完整的数据可见附件。
我的想法是,产生一个新变量,这个新变量计算的是,每年每个省内GDP排名前两位的地级市的GDP之和。举个例子,例如,就河北省而言,1990年,唐山市的GDP排名第一,石家庄市的GDP排名第二,秦皇岛市的GDP排名第三,因此,将唐山市和石家庄市1990年的GDP加总求和作为新变量的一个值。同理,同样是河北省,1991年,依然是唐山市的GDP排名第一,石家庄市的GDP排名第二,秦皇岛市的GDP排名第三,因此,将唐山市和石家庄市1991年的GDP加总求和作为新变量的另一个值。依次类推,其他省份也是如此。
不知道有没有把问题表述清楚,不过还是希望老师能理解!谢谢老师了!