全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1931 0
2020-12-01
p值的意义
P –值
在此博客中,我们将讨论统计实验中p值的重要功能。为什么p –值是接受或拒绝我们在任何实验之前提出的假设的决定因素。
问题陈述:
您已经在市场上推出了一种产品(例如电话)。并且您会收到客户的反馈,指出手机存在过热问题。由于该电话已经投放市场,因此您无法召回所有电话来测试大多数电话是否由于制造问题而出现过热问题。
因此,为了解决该问题,您决定对手机进行调查,并进行统计测试以推翻您对制造问题的担忧。您要求公司的所有员工分享有关电话过热问题的反馈。您还从客户那里进行了在线调查。现在,您已随机获得了500个反馈的样本,相对于您已售出的250000部电话的总数。
人口规模= 25000,样本规模= 500
但是,在将产品投放市场之前,您已经进行了测试,发现最多3%的手机可能由于某些随机事件而出现过热问题,并且与任何制造问题均不相关。它可能是由于过度充电或过度使用而发生的。您的公司可以接受。否则,您必须召回市场上的所有电话以进行重新评估。
现在,您必须决定是否要从市场上召回电话。
假设:
统计实验过程中的重要步骤是首先建立无效假设和替代假设。
零假设(H0):=手机过热符合预期,并且由于在生产过程中观察到一些随机事件。
替代假设(H1):=电话过热并非由于某些随机事件引起。过热背后一定有很强的理由。
如果p值大,则您接受零假设。
如果p值很小,您将无法接受原假设。您认为替代假设在某种程度上可以接受。您的测试具有统计意义。
数据:
我们将通过两个数据场景演示该测试。
方案1:
方案2:
样本量n = 500。
m =2。(分类值的数量(此处为过热和非过热或是和否))
实验与结果:
在进行实验之前,让我们先设置置信区间,并了解错误的类型。
H1错误:-即使原假设成立,我们也拒绝原假设。(在我们的示例中,即使在观察到电话过热是由于随机事件而发生之后,我们仍然拒绝零假设,并假设过热是由于某些制造问题而发生的。)
H2错误:-我们保留原假设,即使它是错误的。(在我们的示例中,即使在观察到电话过热是由于某些制造问题而发生后,我们仍然接受无效假设,并假设过热是由于随机事件而发生的。)
CI:我们测试的置信区间为95%。这意味着我们有95%的信心,我们样本的测试结果将下降95%接近总体。
α(显着性水平)是H1错误的概率。这里α = 0.05。
我们将使用卡方(X 2)测试对以下两种情况进行实验。
场景1:-
从实验中我们看到卡方(X 2)值为0.3436,p –值为0.56(计算得出)。
p值大于α(= 0.05)。
我们还可以从下表中搜索X 2的临界值,发现X 2 = 0.3436之后的下一个临界值为2.706,其对应的p值为0.1。而我们的X 2值介于X 2 0 .10和X 2 0 .90之间。这意味着我们上面计算出的p值(尽管我们已经计算过)在0.1到0.9之间,并且不小于0.05。
(图代表卡方的临界值(X 2)。)
我们无法证明任何反对零假设的证据。我们不能拒绝零假设。这意味着我们从调查中发现的过热手机数量与生产过程中观察到的数量没有显着差异。
方案2:
从实验中,我们看到卡方(X 2)值为16.8384,p –值为4.10E-05(计算得出)。P值小于α。
我们还可以从下面提供的表中搜索X 2的临界值,发现X 2 = 16.83之后的下一个临界值超过(右) X 2 .01 且其对应的p值小于0.01。这意味着我们的p值(尽管我们已经计算过)应该小于0.01,并且显然小于0.05 s。
(图代表卡方的临界值(X 2)。)
我们必须拒绝零假设。这意味着我们从调查中发现的过热手机数量与生产过程中观察到的数量明显不同。这并不是由于一些随机事件。
问题陈述的结果:
对于第一种情况,我们将接受零假设,并且我们的手机没有任何制造问题。
对于第二种情况,我们必须检查手机的制造问题,因为我们有充分的证据反对原假设。
结论:
替代假设不成立。您只能接受无效假设。这意味着您没有强有力的证据证明零假设是正确的。因此,您的实验(方案2)表明,您的手机可能出于某些原因而需要过热,因此需要对其进行处理,并且由于某些随机事件,它们并未过热。除了检验的临界值外,P值和置信度在假设检验中也起着重要作用。
题库
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群