helau 发表于 2012-11-29 14:49 
谢谢,其他领域呢
自然科学中情况一般就要好的多,因为自然科学中数据往往来自实验,许多因素得到了控制。
举个简单的例子:体重的影响因素虽然很多,但身高一个变量就可以解释大部分变异。虽然只有一个自变量,但R^2可能高达80%以上。
在统计或计量教科书中,经常举这类例子,R^2都是很高的,给我们造成R^2好像不高于90%以上,模型的效果就不好的映象。但这种观点是片面的。模型效果好不好还要结合问题的具体背景。
还是想象上面那个例子:在几千个影响因素中,我们能找到3-5个因素能解释30%的变异(而其他70%的变异可能由剩余的影响因素共同解释,假设剩余还有1000个影响因素,那每个影响因素平均解释(0.7/1000)变异,这时我们无法也没有必要列出这剩余的1000个影响因素。
这时我们能找到3-5个因素能解释30%的变异当然是有意义的。