taoqq 发表于 2012-8-17 22:27 
你说的排查,是用怎样的方法呢,我觉得就只能是试啊。你怎么做的呢?
先看描述统计量,然后使用histogram看主要变量的分布,使用scatter,lpoly,lowess以及tabulate(这个主要要针对离散型变量)逐对查看变量之间的关系。
如果数据没有明显的异常值的时候,首先使用文献上同样的模型做一个估计,看看能否replicate别人的结果。如果这个结果基本一致,就说明数据是没有问题的;否则要么就是他们的数据有问题,要么你的有问题,要么研究对象就有很大的差异。至于是哪一种,你得一样一样具体分析。
如果这些都没有问题,下一步才开始是你的工作。一般来说要么就是对模型加以扩展,要么就是采用不同的方法已解决原来文献中没有解决的问题,要么就是利用新数据中的新变量或者新信息得到一些新的发现。一般来说实证研究大都在这个框架之内。如果整个过程没有错误,到最后一步,你得到不同与以往的结果,这就是你的贡献所在了。虽然绝大多数情况下,这种贡献都是边际意义上的一点点贡献。