自己找到啦 顺便【stata里红色的字表示你的错误在哪】
stata线性插值法处理缺失值命令:
ipolate y year,gen(y1)
如果有分类变量,假设分类变量为不同的city,则为:
by city:ipolate y year,gen(y1)
这种只能处理“内插值”,如果存在顶点缺失值(即首尾年份数据有缺失) ,则为:
by city: ipolate y year,gen(y1) epolate
eg:论文里需要对不同city的h2指标缺失值进行线性处理,由于存在顶点缺失值,则在stata中输入命令如下:
by city :ipolate h2 year,gen(h2_0) epolate
新生成的h2_0变量,就是填补了缺失值之后数据列。
注意:
1、第一次使用by city: ipolate y year,gen(y1) 命令,可能会出现“not sorted r(5)”错误,这时需要对city进行排序,使用命令:sort city,之后再执行命令即可。
2、gen(h2_0) 中,h2的前后不能有任何空格,不然stata会识别为h2,这时候会显示错误“variable h2 already defined"。
3、stata中输入help ipolate ,可以获取以上内容详细解释。
或参考博文
https://blog.csdn.net/weixin_42161450/article/details/112560193 作者:小窝喵拿offer
https://www.bilibili.com/read/cv12626530/ 出处:bilibili