耕耘使者 发表于 2011-4-30 20:14 
如果有必要讨论这种差异是否“显著”时,这也不是统计学意义上显著,否则,就必须知道二者之差的分布,如果总体确定,两个参数(即平均工资)是确定的常数,二者差亦是一个常数,那又如何得来这个差的分布?分布只是适用于随机变量,而不适用于常数。
如果要进行显著性检验,必须推翻楼主的一个陈述,就是“已经知道了总体”。我认为确实楼主的这个提法不妥,仅仅知道了两个公司某一年的男女员工平均工资,从时间序列角度看,这只是一个样本观测值而已,因为平均工资是变动的,从动态上看,是一个随机变量。因此,我们得到的仍然可以看作是样本值。
所以,关键点是我们研究的意图。是只看某一年男女员工平均工资的差异,还是想通过这个样本,了解总体上的性别差异。如果是前者,无需假设检验。而后者,必须假设检验。而从常识看,没有理由认为研究只是想了解某一年信息,一切研究都是为了获得总体上规律性的信息,因此,我赞同sungmoo版主的看法,必须进行显著性检验。
楼主则误解了“总体”的含义。总体不仅仅是指静态意义上的空间含义,更包括动态上的时间含义,而后者更为关键。
我前面的想法是,如果谈“已知总体时关于总体的(某些性质)的显著性检验”,必须首先讨论并明确其意义是什么(比如,它对应了怎样的规则与操作),即我们须了解这是哪种意义上的检验。而由此自然引出更先导的问题:引入这种意义或操作的目的是什么(必要性讨论)。
如果将“总体”作上述理解(“动态上的时间含义”),在某一时点所获得的某公司所有男女员工的(某特定时段的)工资的数据,其实只是一组样本观测值。这也就回到普通意义上的检验了。
由此,如果认为“总体”的意义总是
相对的,就某一具体的“总体”而言,若“进一步”只把它理解成某一“更基础”总体的样本观测值,也就可以进行普通意义的统计操作了。
综上,对于楼主的问题,也许涉及三条路径:一条是调整“总体”的意义(总体总是相对的),从而相关检验仍是原有意义上的;一条是调整“检验”的意义,从而保持总体的原有意义;一条是“总体”与“检验”的意义都不调整,从而认为“已知总体时关于总体的检验”是无意义的。
对于第一条路径,我们必须时刻小心“总体”的意义具体是什么;对于第二条路径,我们也许可以设计“已知总体情况下抽样”的操作方案,利用抽样的信息定义并进行“已知总体时的显著性检验”。
以上只是一些杂想。