forever+ 发表于 2019-3-21 19:50 
我没有搞懂他这个权重的意思是啥?到底有啥作用,我把权重直接扔了可以吗?求那个大神解释一下,感激不尽
实际操作可以参考Mostly Harmless Econometrics(2008)3.4.1 Weighting Regression,关于使用权重的利与弊可以参考书中提到的两个文献(1)Pfefferman, Daniel (1993): “The Role of Sampling Weights When Modeling Survey Data,” International
Statistical Review, 61, 317–37.(2)Deaton, Angus (1997): The Analysis of Household Surveys: A Microeconometric Approach to Development Policy. Johns Hopkins University Press for the World Bank, Baltimore, MD。不过我看到这节的时候我的研究还没有到使用权重的步骤,还没有看,所以我就对本书这节的内容说一下。在实际操作中,一般
使用权重的情况有:(1)你需要将统计分析的结果推及至总体。尤其是在使用非随机抽样样本时,你用这个样本分析的结果不一定能反映总体的状况,所以要使用权重。比如一般数据库会对80岁以上老人采用过度抽样的方式,如果你想根据现有的数据分析全体80岁以上老人的情况,就应该使用抽样权重;(2)当你使用的是分组数据时。比如你的数据库是CHARLS(这是一个随机抽样的数据库),它的抽样框是45岁以上的居民,但是如果你想了解基本养老保险政策对男性的影响,这时最好使用权重。(3)异质性。经典的情况是当因变量是虚拟变量时使用线性概率模型,这时会导致误差项异质性,一般情况下默认标准误是同方差假设,异质性的话方差就不是一个常数。不仅如此,在概率模型中yi是是yi=1的概率,介于(0,1)之间,如果使用线性概率模型的话,会导致概率超过1。但是不知道为什么,还是很多人使用这种方式。同时,书中
不建议使用权重的情况是(1)方差估计结果不佳。(2)条件期望方程非线性。
不知道理解的是否正确,原文如下,如果有误,我们再交流。