GraphPad官方微信公众号的
[GraphPad Prism 统计教程]系列的上一篇文章介绍了简单逻辑回归的目标、简单逻辑回归与简单线性回归的不同、基于逻辑回归的分类。回顾:https://bbs.pinggu.org/thread-10481589-1-1.html本篇文章主要帮助大家理解对数优势和解读系数估计。逻辑回归可为给定数据拟合模型,其假设预测变量与结果变量的对数优势呈线性关系。GraphPad用户指南对这一部分主要讨论什么是对数优势,以及如何在逻辑回归中使用这一概念。1. 
[size=1.2em]什么是对数优势以及为什么逻辑回归使用对数优势?简单逻辑回归的模型可写为logit[P(Y=1)]=β0+β1 * X+error。01在右手侧,这与简单线性回归模型相匹配(记住简单线性回归模型为Y=intercept+slope *X)。左手侧包括一个“logit”函数(long o,soft g),其根据Y是变量(只能取0和1)的事实进行调整。简言之,logit是优势(Y=1)的对数,“P(Y=1)”是Y等于1的概率。请注意,在此情况下,“P”是概率的缩写,与P值无关。如需理解什么是“对数优势”,了解对数的含义是很重要。优势等于Y=1的概率除以Y=0的概率。例如,如果Y=1的概率是0.8(或Y=1的概率是80%),则Y=0的概率是1-0.8或0.2(记住,Y只能是0或1,因此Y=0的概率是1-[Y=1的概率])。使用这些数据,我可计算这两个数据的优势:优势=P(Y=1)/P(Y=0)=0.8/0.2=4在此情况下,优势为4。你会经常听到人们把这称为4:1的优势,可将其读作“4比1的优势”现在我们知道了优势与概率的关系,我们就可进行最后一步来计算对数优势了。这只需要使用计算出的优势值,然后对该值取自然对数(Ln):对数优势=Ln(Odds)=Ln(P(Y=1)/P(Y=0))=Ln(P(Y=1)/[1-P(Y=1)])上文列出的所有对数优势形式均是等价的,尽管这种数学方法听起来很混乱,但我们完成所有这些工作的原因是,我们想建立Y=1(或Y=0)的概率模型。更重要的是,我们想用线性模型(简单逻辑回归方程的右手侧)来模拟这种概率。回想一下,概率介于0和1之间。简单逻辑回归模型的右手侧,与简单线性回归模型一样,可生成(理论上)从负无穷大到正无穷大的任何值。logit函数可用于这两个范围的连接。从概率开始:这些值只能从0到1:

首先,我们取优势,将该从0到1的标度转换成从0到+无穷大的标度(计算0到1之间任何概率的优势,自己看吧!):

接下来,我们取优势的自然对数,得到对数优势,它将标度再次转换为从负无穷大到正无穷大的标度:

因此,可将logit函数视为使用数学运算将模型右手侧生成的值(可以是任何值)连接至概率的界限值(必须在0和1之间)。2. 
[size=1.2em]“Log”或“Ln”?逻辑回归使用自然对数
记住,在用逻辑回归讨论对数几率时,我们始终是指几率的自然对数(Ln[Ods])。自然对数通常缩写为“log”或“ln”,这可能会引起一些混淆。在某些情况下(不在逻辑回归中),“log”可用作以10为底的对数的缩写。但如果在逻辑回归的上下文中使用,“对数”指自然对数!为什么用自然对数代替以10为底的对数?或者以2为底的对数?简言之,这是惯例;这就是我们的做法,因此每个人都这样做。但自然对数(及其倒数-指数函数)有一些有趣的性质,这有助于其在潜在备选方案上的应用。例如,以指数函数为例:exp(x)=ex该函数的导数是...本身!此外,Ln(x)的导数=1/x。在处理增长率、利率、衰退率等时,这些特性是其他一些方便的特性。将自然对数作为选择对数。