shi465456609 发表于 2015-4-10 21:05 
初学者的理解:第二种方法较第一种更好。第一种的方法的数据处理方法可能失去了数据原始特性,并且当各组都 ...
两种方法都是科学合理的吗?
我问这个问题的原因之一是,如果每个组内的200个样本之间有相关性,比如是时间序列数据,那么整个样本就是panel了,不适合做整体层面的regression。但是我还是想粗粗的看一下regression的结果。。。
这种情况下是不是第一种更可取些?至少不会犯原则性的错误,虽然会丢失一些信息?
谢谢!