我来回答一下你的问题。
R-square是用来衡量一个模型好坏的重要工具。英文的解释是这样的:R-square can be used to measure how much of you model be explained by the combination of the independent variables used in your model. 换句话来说,它可以告诉你,你的模型的因变量DV的变化有多少可以被自变量IV的组合来解释。 R-square 为0.02说明DV只有2%可以由IV组合来解释,其余的98%都无法由它们来解释。原因很简单,你漏掉了一些重要自变量。下面我给个例子说明。
在一个用来分析哪些因素会影响销售额的模型当中,因变量DV是 sales revenues, 自变量IV的组合为 promotion, in-store features, store location... 即
sales revenues=a0+a1promotion+a2in_store features+a3store location.
你很可能会发现每一个自变量都是significant, 但是R-square 却小得可怜 - 因为你没有将最重要的一个因素加进去 - price. 如果你将价格加进入后,你会发现R-square会得到很大的改善。
我建议你重新考虑你的IV组合。祝顺利。
的确,你说的是Least squared 下面的R平方。R平方在generalized linear model里没有被广泛的应用也是事实。比如说SAS在proc logistic 升级版的proc genmod里至今并没有给出R平方。我想原因或许是没有一个好的统一的R平方算法(在generalized linear model上)。至少是,R平方迄今为止还没有一个令人信服的好的算法。我的感觉,好的东西自然会被大家很快地接受,如果是不成熟的,要么改进要么消失。