GraphPad Prism 统计教程 | 简单逻辑回归（二）

1747

收藏 2021-03-30

GraphPad官方微信公众号的[GraphPad Prism 统计教程]系列的上一篇文章介绍了简单逻辑回归的目标、简单逻辑回归与简单线性回归的不同、基于逻辑回归的分类。回顾：https://bbs.pinggu.org/thread-10481589-1-1.html本篇文章主要帮助大家理解对数优势和解读系数估计。逻辑回归可为给定数据拟合模型，其假设预测变量与结果变量的对数优势呈线性关系。GraphPad用户指南对这一部分主要讨论什么是对数优势，以及如何在逻辑回归中使用这一概念。1. [size=1.2em]什么是对数优势以及为什么逻辑回归使用对数优势？简单逻辑回归的模型可写为logit[P（Y=1）]=β0+β1 * X+error。01在右手侧，这与简单线性回归模型相匹配（记住简单线性回归模型为Y=intercept+slope *X）。左手侧包括一个“logit”函数（long o，soft g），其根据Y是变量（只能取0和1）的事实进行调整。简言之，logit是优势（Y=1）的对数，“P（Y=1）”是Y等于1的概率。请注意，在此情况下，“P”是概率的缩写，与P值无关。如需理解什么是“对数优势”，了解对数的含义是很重要。优势等于Y=1的概率除以Y=0的概率。例如，如果Y=1的概率是0.8（或Y=1的概率是80%），则Y=0的概率是1-0.8或0.2（记住，Y只能是0或1，因此Y=0的概率是1-[Y=1的概率]）。使用这些数据，我可计算这两个数据的优势：优势=P（Y=1）/P（Y=0）=0.8/0.2=4在此情况下，优势为4。你会经常听到人们把这称为4:1的优势，可将其读作“4比1的优势”现在我们知道了优势与概率的关系，我们就可进行最后一步来计算对数优势了。这只需要使用计算出的优势值，然后对该值取自然对数（Ln）：对数优势=Ln（Odds）=Ln（P（Y=1）/P（Y=0））=Ln（P（Y=1）/[1-P（Y=1）]）上文列出的所有对数优势形式均是等价的，尽管这种数学方法听起来很混乱，但我们完成所有这些工作的原因是，我们想建立Y=1（或Y=0）的概率模型。更重要的是，我们想用线性模型（简单逻辑回归方程的右手侧）来模拟这种概率。回想一下，概率介于0和1之间。简单逻辑回归模型的右手侧，与简单线性回归模型一样，可生成（理论上）从负无穷大到正无穷大的任何值。logit函数可用于这两个范围的连接。从概率开始：这些值只能从0到1：

首先，我们取优势，将该从0到1的标度转换成从0到+无穷大的标度（计算0到1之间任何概率的优势，自己看吧！）：

接下来，我们取优势的自然对数，得到对数优势，它将标度再次转换为从负无穷大到正无穷大的标度：

因此，可将logit函数视为使用数学运算将模型右手侧生成的值（可以是任何值）连接至概率的界限值（必须在0和1之间）。2. [size=1.2em]“Log”或“Ln”？

逻辑回归使用自然对数

记住，在用逻辑回归讨论对数几率时，我们始终是指几率的自然对数（Ln[Ods]）。自然对数通常缩写为“log”或“ln”，这可能会引起一些混淆。在某些情况下（不在逻辑回归中），“log”可用作以10为底的对数的缩写。但如果在逻辑回归的上下文中使用，“对数”指自然对数！为什么用自然对数代替以10为底的对数？或者以2为底的对数？简言之，这是惯例；这就是我们的做法，因此每个人都这样做。但自然对数（及其倒数-指数函数）有一些有趣的性质，这有助于其在潜在备选方案上的应用。例如，以指数函数为例：exp（x）=ex该函数的导数是...本身！此外，Ln（x）的导数=1/x。在处理增长率、利率、衰退率等时，这些特性是其他一些方便的特性。将自然对数作为选择对数。

扫码加我拉你入群

请注明：姓名-公司-职位

以便审核进群资格，未注明则拒绝

扫码加我 拉你入群

分享

扫码加好友，拉您进群

扫码加我拉你入群