全部版块 我的主页
论坛 计量经济学与统计论坛 五区 计量经济学与统计软件
5031 24
2011-04-30
看了一个非常好的bootstrap和permutation test的入门读物,是大牛写的,http://bcs.whfreeman.com/ips5e/content/cat_080/pdf/moore14.pdf。非常受启发,但其中有个问题困扰了我。

这个材料介绍permutation test特点时,谈到confidence intervals和significance tests有一个微妙的不同就是针对总体也可以做假设检验。这个让人有些不好理解,因为既然你知道了总体,参数也就是知道了,怎么还需要假设检验去下结论呢?比如材料中举的例子,要比较一个公司男员工和女员工的平均收入的差异,直接把全体公司的男女员工都调查完了,这个时候直接用总体的参数去比较就行了,就不会犯传统假设检验的一类错误或二类错误了

请问大家对此有什么理解?或者reference参考,麻烦告知
谢谢


谢谢大家对此的热情讨论,把我这几天的思考也呈现给大家

其实假设检验是神马,概率计算和点估计才是王道

统计学包含统计描述和统计推断,统计推断又包含估计和假设检验。回想经典的假设检验过程:
准备过程:对感兴趣的总体参数选择一个统计量→推导出此统计量的抽样分布
操作过程:对感兴趣的参数设定一个值→计算该参数下统计量的抽样分布→将观察到的统计量放入统计量的抽样分布,求P值

再仔细想,其实这个过程就是概率计算和点估计的衍生过程。
为了逻辑解释的方便,我们以t检验来举例,并预先定义几个符号:mu1(总体均数值,描述所有对象集中程度),mu2(对应的抽样分布参数值,我们抽样分布集中程度),
我们是设定的mu2,有了mu2,我们就可以计算观察到的T值是不是小概率事件,如果是,则mu2这个假设不成立,并且mu2又是我们对mu1唯一能获得的点估计值,所以我们因此来推断mu1

所以总体和样本都可以做假设一个参数再去做他的概率计算,只不过前者的参数是总体参数,后者参数是抽样分布的参数。(因为这两个分布有对应关系,并且我们一般情况两个参数都是相等的,所以我们我们就没有强调这两个的区分??)概率算出来了,再看发生的事件是不是小概率事件

请大家批评指正
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2011-4-30 10:53:04
楼主有理,有了总体,就没有必要做假设检验了。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-4-30 11:26:40
耕耘使者 发表于 2011-4-30 10:53 楼主有理,有了总体,就没有必要做假设检验了。
比较两个总体的分布是否“有显著差异”,假设检验是否有意义?

(当然,了解了两个总体以后,只要两者有稍许差异,我们就可以说它们“不服从相同的分布”。但我们有无必要讨论两者的差异足够“显著”?)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-4-30 11:30:59
zhaoxing731 发表于 2011-4-30 09:38 这个材料介绍permutation test特点时,谈到confidence intervals和significance tests有一个微妙的不同就是针对总体也可以做假设检验。这个让人有些不好理解,因为既然你知道了总体,参数也就是知道了,怎么还需要假设检验去下结论呢?比如材料中举的例子,要比较一个公司男员工和女员工的平均收入的差异,直接把全体公司的男女员工都调查完了,这个时候直接用总体的参数去比较就行了,就不会犯传统假设检验的一类错误或二类错误了
请问大家对此有什么理解?
个人理解,这里先要讨论的是,在了解了这两个总体(该公司各男员工的工资及各女员工的工资)以后,若他们的平均工资确有差异(无论绝对值有多大或有多小),我们有无必要讨论这种差异是“显著的”。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-4-30 19:58:15
sungmoo 发表于 2011-4-30 11:26
耕耘使者 发表于 2011-4-30 10:53 楼主有理,有了总体,就没有必要做假设检验了。
比较两个总体的分布是否“有显著差异”,假设检验是否有意义?

(当然,了解了两个总体以后,只要两者有稍许差异,我们就可以说它们“不服从相同的分布”。但我们有无必要讨论两者的差异足够“显著”?)
     统计包括统计描述和统计推断,而假设检验隶属于后者。
    什么是统计推断?由样本信息推断总体信息。显然,基本的统计学逻辑是,既然知道了总体参数,那么还推断什么?我又专门查阅了有关书籍,如卢淑华的【社会统计学】250页提到:
    “在统计推论中,我们研究通过样本对总体进行参数估计或假设检验。”
    可见,我们探讨问题的共同背景或者说平台,是在“统计学”这个平台上的,所说的“显著”性检验,是指统计学意义上的假设检验。至于您提到的“我们有无必要讨论两者的差异足够“显著””,由于不是由样本推断总体,而取决于研究者主观判断,故已经不是统计学意义上的显著性检验。
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2011-4-30 20:14:56
sungmoo 发表于 2011-4-30 11:30

个人理解,这里先要讨论的是,在了解了这两个总体(该公司各男员工的工资及各女员工的工资)以后,若他们的平均工资确有差异(无论绝对值有多大或有多小),我们有无必要讨论这种差异是“显著的”。
      如果有必要讨论这种差异是否“显著”时,这也不是统计学意义上显著,否则,就必须知道二者之差的分布,如果总体确定,两个参数(即平均工资)是确定的常数,二者差亦是一个常数,那又如何得来这个差的分布?分布只是适用于随机变量,而不适用于常数。
      如果要进行显著性检验,必须推翻楼主的一个陈述,就是“已经知道了总体”。我认为确实楼主的这个提法不妥,仅仅知道了两个公司某一年的男女员工平均工资,从时间序列角度看,这只是一个样本观测值而已,因为平均工资是变动的,从动态上看,是一个随机变量。因此,我们得到的仍然可以看作是样本值。
    所以,关键点是我们研究的意图。是只看某一年男女员工平均工资的差异,还是想通过这个样本,了解总体上的性别差异。如果是前者,无需假设检验。而后者,必须假设检验。而从常识看,没有理由认为研究只是想了解某一年信息,一切研究都是为了获得总体上规律性的信息,因此,我赞同sungmoo版主的看法,必须进行显著性检验。
    楼主则误解了“总体”的含义。总体不仅仅是指静态意义上的空间含义,更包括动态上的时间含义,而后者更为关键
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

点击查看更多内容…
相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群