客观地看待这个问题。
第一,在使用数据的过程中,是可以采用技术手段对数据进行调整的。这就技术手段,既有善意的,也有恶意的。就善意而言,在一些研究中,需要对异常数据进行技术处理;就恶意而言,就是为了求得一个自己已经设定的可以接受的结果,采用技术手段调整数据。
第二,在模型中,经常需要选取合适的变量表达方式来表达研究对象。但在选取变量表达方式的时候,可能会遇到数据部理想——“真”的不理想和“假”的不理想,这时候还会遇到调整变量表达方式的问题。对于那种不断地调整指标的表达方式,既可能是善意的,也可能是恶意的。
第三,在现实中,还存在一类纯粹的恶意,就是篡改数据。有时候为了获得一个自身“满意”的结果,背离学术规范,恶意更改——也叫“技术处理”——数据,使数据满足自身需要。一般来说,只有很严格的期刊才会要求提供原始数据,即使提供了原始数据,也只有严格的期刊才会对数据进行检验,也就是用你的数据重复一次检验。因此,很多人就钻了这个空子,篡改数据不被发现。
第四,最恶劣的,是直接更改了结果,而不是数据。这个离题了哈,楼主问的是数据。这种情况,并不少见。
如此种种,不尽而言。楼主在做研究的时候,要客观地看待数据,看待别人做的数据。自己做给自己,对得起自己,不要过分拘泥于别人做出来的样子。国内很多期刊的计量检验一类,你只能参考,不要去“学习”,否则很容易误导自己。做不好检验没什么大不了的。
我们的实证研究,有一些很不好的现象。特别是,我们经常都是先设定结果,再来不断试错,找到那条能达到自己预先设定的结果的路径,而不能接受自己在一条道路上行走3而不能达到预期,更不用说从一个起点开始探索一条道路走向某个不确定的重点。我们什么时候都想要一个“结果”,非要证明一定有个“结果”,而难以接受“没有结果也是一个结果”。其实,我们做实证,能够证明“不是这样”也是一个贡献,而不用非得证明“是这样”。即使我们预先设定了一个终点、结果,但在行走的过程中,发现此路不通,也是有非常重要的意义的。只可惜,现实中这样经常被期刊鄙视。我们经常遇到的是,如果真的发现了此路不通,也不能就此打住,而非要再找一条通的路来——如果结论是此路不通,好像就是半截子研究。
最后回到现实中来,我其实很庸俗,再给楼主一个庸俗的建议:如果你是需要发文章,真的需要那种,不要太拘泥于你的数据,前面讲的第一和第二种数据处理,你都可以考虑。如果逼疯了,第三种也可以小心试试——前提是以后不再走学术这条路。当然,一般不会逼疯的,不做实证检验,不用数据也可以发文章。但如果你是真的要走学术路线,请认真对待数据。学术,是一生的荣誉和负债,年轻时欠下的,说不定某一天就得还——即使现实不还,你自己都得给自己的学术良心还。如果写篇文章是你的业余爱好或者是学术作业,别过度折磨自己。另外,看期刊文章,不要太相信别人。尽量看相对好点的期刊。我们不知道期刊作者是否真正认真对待了他的数据。但在信息不对称条件下,我们不得不找一个参考标准。或许,”好一点“的期刊能够更好地排除坏蛋。如果我们不知道哪个蛋是好的,我们就选哪个壳还没破的蛋吧。
都是我乱说的,我其实看不懂绝大部分模型,不懂计量经济学。我看计量文章,我更多看的结论,不是不想看过程,是因为我看不懂过程。期待和相信我们的实证检验过程,都是经得起检验的。
千万别骂我,打字很累的。我只是一个边缘学习者。谢谢。