全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1445 0
2020-09-04
为什么包括效果大小并了解您的统计能力很重要
我不确定这是否是一个常见的误解,但我知道我曾经相信,要提供统计分析结果的唯一条件就是P值小于所选的alpha。如果有证据拒绝原假设,则可以得出结论,即已经做出了有意义的发现。我在Mod 3项目中了解到的是,统计显着性并不表示所测量或比较的实质性显着性。为了确定测试药物对治疗的真正影响或新的网页设计对销量等的影响,计算效果大小也很重要。
效应大小是测试组强度的定量度量,是两个比较样本之间差异或关系的大小的描述。图片两条正常的钟形曲线,代表两个样本,一个正在比较。想象一下,样本具有相同的均值,因此曲线彼此重叠。现在,假设备用样本的平均值(假设与对照组相比有统计学差异)增加了。交替的钟形曲线开始沿x轴滑离控制曲线,并且每条曲线中间的垂直线之间的距离(表示其平均值)开始加宽。他们的手段之间的差距就是效果的大小。
能够表现出影响非常重要,因为这将为统计结果提供切实的价值。一个例子是餐馆老板想知道她是否应该翻新其在纽约市的位置。翻新工程将花费100
计算效果大小的一种常用方法是找到科恩的d项。d是通过将两个样本的差除以样本的标准偏差计算得出的。科恩确定d值为0.2、0.5和0.8,分别表示小,中和大效果大小。在比较不同组的样本时(例如,加利福尼亚州学校学生的考试分数与密歇根州学生的分数),样本可能具有不同的方差,因此将分母的标准差合并在一起。
当两个样本的效果大小为0时,备用组的平均值为对照组的第50 个百分点,钟形曲线将完全重叠。当效应大小为0.8时,替代组的平均值落在对照组的第 79 个百分点,因此替代组的平均情况将高于对照组的79%。
当我们要比较的均值的单位众所周知(例如距离或成本)时,绝对效应大小会很有用。当呈现数据信息以与普通受众比较意义不大的事物时,我们可以通过计算效果的标准化度量来最好地理解效果大小,该度量将效果转换为可消化的尺度。如果您要比较世界各个地区的地震烈度,并想确定其震级在里氏尺度上有多大,这可能会很有用。
在比较两组时描述统计分析结果时可以使用的另一个度量标准是Power。力量是许多事物的产物,但它告诉我们的是,当虚假假设为假时,我们有多大可能会拒绝原假设,从而使Beta可能犯II型错误。幂考虑效应大小,选择的alpha和样本大小,并确定我们能够多久找到一个统计上有意义的结果,该结果将提供足够的证据来拒绝错误的虚假假设(这是任何一个好的统计学家想要的!)。通常可接受的功率水平是80%-如果您不能产生至少80%的功率水平,许多统计学家会建议您不要继续进行分析。
以下是有关统计检验的潜在结果以及α和β如何发挥作用的快速回顾:
空假设是:
真正

零审判
(统计结果)
拒绝Ho(p <.05)
类型I错误
假阳性
α
正确推断
真正的积极
(1 –β)
拒绝失败(p> .05)
正确推断
真否定
(1-α)
II型错误
假阴性
β
其中 α是alpha(类型I错误的概率),β是beta(类型II错误的概率)
数据科学家无法控制效果的大小,因为这取决于两组的能力。但是,更大的效应量将导致显着性检验的功效更高,并降低发生II型错误(β)的可能性。因为功效=(1-β),所以如果功效从.8到.9,那将是β的减小,P(II型误差)从.2变为1.。
以较低的功效进行操作可能会在进行研究复制时出现问题,因为我们会将复制视为独立的事件,并且必须乘以不同的功效以找到发现实际效果的组合可能性。例如,如果原始研究和复制研究均具有80%的功效,那么我们只有64%的可能性在这两项研究中都检测出真实的效果。
APRONS是记住提高测试能力的方法的一个有用的缩写。APRONS代表:
放松一个 lpha水平
使用p arametric统计
增加[R措施的eliability
使用? NE尾测试
增加样本量(n)
提高设计和/或分析的敏感性
以下是一些视觉示例,说明了如何放宽Alpha级别并增加样本大小会增加功效:
给定20个样本,alpha值为0.05,计算出的效应大小为0.63(相对中等的效应大小),您可以看到我们确信给定的样本大小将有助于避免抛出II型错误80%时间(功率显示为浅蓝色阴影区域):

关注 CDA人工智能学院 ,回复“录播”获取更多人工智能精选直播视频!


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群