墨堂北北 发表于 2020-3-31 14:41 
请问贴主,请问你是怎么将产品数量清理到2000多的呀?我将工业企业数据和海关数据匹配合并后,产品层面不不 ...
不能先合并工企和海关,直接先合并会损失很多hsid产品。因为一般是用企业名称merge的嘛,那如果一个企业有5种产品,直接合并的话一个企业可能只默认保留一种产品了。
就先算出产品层面的海关质量,再加总到每个企业层面,最后再去跟工企合并
我先清理的海关数据,是按照施斌展2013的文章里写的那七步,删除单笔贸易额在50美元以下的样本之类的