全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
4392 0
2020-08-21
这篇我们从一个基本的‘P值’开始了解一下统计学的一些常识性知识,帮助大家减少疑惑,避免一些误解。


注意:GraphPad Prism官方中文用户指南已经上线了,大家可以去中国官网看看,一般的常识性问题都可以在里面快速找到答案。


概念:什么是P值?
   假设你从两个用不同药物治疗的动物样本中收集了数据。你已经测量了每种动物血浆中的一种酶,而且测量方法是不同的。想知道出现的差异是否是因为药物的作用 - 这两种群体是否有不同的方法。
观察不同样本方法并不足以得出这种群体有不同方法的结论。有可能群体具有相同的平均值(即药物对正在测量的酶无影响),并且你观察到的样本平均值之间的差异只会偶然发生。很难确认你所观察到的差异是否反映了真正的差异,或只是在随机抽样过程中出现。现在所能做的就是计算概率。


   第一步是注明零假设。事实上,治疗并不影响你测量的结果(因此,所有差异均因随机抽样所致)。
P值是一个概率值,范围为0 - 1,可以尝试回答下面这个问题:
在这种规模的试验中,如果群体真的具有相同的平均值,则观察到样本平均值之间的差异至少与实际观察到的差异一样大的概率是多少?


解读:打破对P值的误解
   大家很容易对P值产生误解。在假设检验中,我们先假设比较了两个平均值,得到P值等于0.03。
那么对于这个P值的正确理解↓
“观察到的差异与你所观察到的差异一样大的几率为3%,即使两个群体平均值相同(零假设为真)”
“从相同群体中随机抽样会导致比你在97%的实验中观察到的差异更小,比你在3%的实验中观察到的差异更大”


   错误理解×:“你所观察到的差异反映出群体之间的真实差异的几率为97%,差异偶然发生的几率为3%”



更多:对P值的错误解读
×谬论:p值是由于抽样误差而造成结果的概率?
   错误。假设零假设为真,则计算P值。换言之,P值的计算是基于由于抽样误差而造成差异的假设。因此,P值无法表示由于抽样误差而造成结果的概率。


×谬论:P值是零假设为真的概率?
   错误。假设零假设为真,则计算P值,因此P值不可能是真的值。


×谬论:1 - P是替代假设为真的概率?
   错误。如果P值为0.03,则很容易想到:如果差异只有3%的概率由随机因素造成,则差异肯定有97%的概率由真实因素造成。但这是一种错误的想法!你可以说,如果零假设为真,则97%的实验会导致比你观察到的差异更小的差异,3%的实验会导致与你观察到的差异一样大的差异或比你观察到的差异更大的差异。
P值的计算基于零假设正确的假设。P值无法表明该假设是否正确。P值表明,如果零假设为真,则很少能观察到与您观察到的差异一样大的差异或比您观察到的差异更大的差异。


   搞科研的你必须要考虑的是,结果是否不太可能导致放弃零假设?


×谬论:1 - P是重复实验后结果保持不变的概率?
   错误。如果P值为0.03,则很容易认为这意味着有97%的几率能在重复实验中得到“相似”的结果。并非如此。


×谬论:高P值证明零假设为真?
   错误。高P值意味着,如果零假设为真,则在本实验中观察到的治疗效果便不足为奇了。但这并不能证明零假设为真。


×谬论:P值是拒绝零假设的概率?
  错误。在一个特定实验的P值小于显著性水平α(你(应该)将α作为实验设计的一部分)时,你会拒绝零假设(并认为结果具有统计学显著性)。所以如果零假设为真,则α是拒绝零假设的概率。需要注意的是,P值和α不一样。P值是从每次比较中计算得出,并且是对证据强度的一种度量。将显著性水平α设置为实验设计的一部分




   上面提到的一些对P值的误读,是不是你之前也有过类似的理解呢?赶紧纠正一下,不要让这种误读扰乱你的研究思路。






二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群