黃河泉 发表于 2019-3-14 18:23 
我们就一步一步来!1. 根据你给的资料 (或者你要发一个更具代表性之资料),我们要删除哪些观察值?请说明 ...
好的,老师。我在帖子中上传了不同地区、不同产业的企业就业数据数据。
使用第一个命令,先分组求和,得到分产业就业量 emp_city,再用duplicates drop命令删除不同地区(shi_id)单个产业(class_xiao)就业量的重复值。例如删除“101”地区中“1312”产业的就业量重复值。删除重复值后计算总就业量 total emp_city , 得到的结果是4.51e+07;
使用第二个命令:重新导入数据,直接计算所有地区、所有产业的总就业量 total emply ,得到的结果是4.56e+07。
您看我这样是否表达清楚问题了