全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 Excel
2124 3
2009-02-17

问题一:随机抽样10个样本后,测算出产品评分95%置信区间81~94,用countif函数,发现样本中100个数字,有40个小于81,因此,我怀疑抽样中的10个数字导致结论不能代表总体。接下来,如何操作,才能进一步修正呢?

问题二:用confidence函数,返回一个置信区间值为5.289592,用字母C代表。
置信区间=样本均值+/-C,
用此结论得出的样本上限和下限,分别为92.712和82.1331,与表中的上限、下限值不符,
请问,原因何在?

294513.xls
大小:(16 KB)

 马上下载


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

全部回复
2009-2-21 22:15:00

30个或以上才是统计上能构成比较可信结论的样本量。10

各种抽样方法都是有针对性的,你的数据特点是什么(如数据均匀分布、泊松分布等),你对数据的风险评估/可信度是什么(可信度95%、90%……),你对抽样要达到什么目的(随机抽查验证、抽查到反例即停……)等等,需要都参考下决定你的抽样方式。

如果仅仅是简单随机抽样的话,可以应用RAND(),VLOOKUP()等函数。具体见文档。我提供了两种抽样方式的结果,用公式输入法和用菜单操作的方法。

295823.xls
大小:(77 KB)

 马上下载


[此贴子已经被作者于2009-2-21 22:16:04编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-21 22:32:00

还有,对置信区间的理解好像有点问题。以下提供准确的信息:

置信区间(confidence interval)

  1、对于具有特定的发生概率的随机变量,其特定的价值区间------一个确定的数值范围(“一个区间”)。

  2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。

  3、该区间包含了参数θ真值的可信程度。

  4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。

更多信息请参阅:

http://en.wikipedia.org/wiki/Confidence_interval

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

2009-2-21 22:34:00

顺便摘录关于抽样的信息:http://zh.wikipedia.org/wiki/%E6%8A%BD%E6%A8%A3

在统计学中,抽样(Sampling)是一种推论统计方法,它是指从目标总体(population,或称为母体)中抽取一部分个体作为样本(sample),通过观察样本的某一或某些属性,依据所获得的数据对总体的数量特征得出具有一定可靠性的估计判断,从而达到对总体的认识。

抽样过程主要包括以下几个阶段:

定义总体
    

确定抽样框
    

确定抽样方法
    

决定样本量
    

实施抽样计划
    

抽样与数据收集
    

回顾抽样过程
    

总体

目标是所要研究的对象的全体。例如,制造商检查某个批次的产品质量是否合格,目标总体就是这一批次的产品。

抽样总体是用于从中抽取样本的总体。按理,抽样总体应该与目标总体一致,但实践中时常发生不一致的情况。例如,科学家通过小白鼠试验来检测药物用于人类总体的效果。

抽样框

在抽样之前,总体应划分成抽样单位,抽样单位互不重叠且能合成总体,总体中的每个个体只属于一个单位。抽样框是一份包含所有抽样单元的名单。

概率抽样与非概率抽样

抽样方法

简单随机抽样

系统抽样

分层抽样

整群抽样

正比于规模的不等概抽样

 放回抽样与不放回抽样

样本量

数据类型

抽样与数据收集

抽样过程回顾

无回答

外部链接

[此贴子已经被作者于2009-2-21 22:34:54编辑过]

二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

相关推荐
栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群