全部版块 我的主页
论坛 数据科学与人工智能 数据分析与数据科学 数据分析与数据挖掘
1357 0
2022-06-07
本文讨论了称为采样的分析技术,并简要说明了两种类型的采样分析以及如何应用这些方法。

什么是抽样分析?

抽样是为了确定整个人口的特征而选择人口中具有代表性的部分的技术。抽样分析有两种类型:简单随机抽样和分层随机抽样。

让我们更详细地看一下这两种技术。

简单随机抽样
使用这种抽样方法,选择是基于机会,并且每个项目都有相同的选择机会。一个简单随机抽样的例子是彩票系统。

示例: 如果我们想得出美国所有汽车的平均值,找到每辆汽车,分配一个值,然后制定一个平均值是不切实际的。相反,我们可能会随机选择 200 辆汽车,获取这些汽车的值,然后找到平均值。这 200 辆汽车的随机选择将是“整个美国的样本数据”汽车的价值(人口数据)。

简单随机抽样的优缺点
优点: 经济实惠,耗时少

缺点: 偏差的机会,获得代表性样本的难度

分层随机抽样
在这里,人口数据分为称为分层的子组。每个子组中的成员在人口统计、收入、位置等方面具有相似的属性和特征。从这些子组中的每一个中抽取随机样本,与子组规模相对于人口规模成比例。然后将这些子组的子集添加到最终的分层随机样本中。改进统计精度由于每个子组内的低变异性以及与简单随机抽样相比,此方法需要更小的样本量这一事实,因此通过该方法实现。当研究人员想要检查人群中的子组时,使用此方法。

示例: 可以将成年人样本按年龄组划分为子组,例如 18-29、30-39、40-49、50-59 和 60 岁及以上。为了对这个样本进行分层,研究人员会从每个年龄组中随机选择一定数量的人。这是一种有效的抽样技术,用于研究趋势或问题在不同子组之间的差异。分层随机抽样中使用的一些最常见的阶层包括年龄、性别、宗教、种族、教育程度、社会经济地位和国籍。通过分层抽样,研究人员可以确保每个子组的受试者都包含在最终样本中,而简单的随机抽样不能确保子组在样本中的代表相同或成比例。

分层随机抽样的优缺点
优点: 与简单随机抽样相比,本质上经济、耗时更少、偏差的机会更少,并且比简单随机抽样的准确性更高

缺点: 需要定义应该创建子组的分类变量——例如,年龄组、性别、职业、收入、教育、宗教、地区等。

抽样是为了确定整个人口的特征而选择人口中具有代表性的部分的技术。抽样在赋值和赋值时很有用预测结果基于较小的总体子集或样本的整个总体。组织将根据数据类型、对某些子集和组的准确性和代表性的需求以及组织的其他分析要求,选择简单随机抽样或分层随机抽样方法。

      相关帖子DA内容精选
  • 大厂数据分析面试指南!来自亚马逊、谷歌、微软、头条、美团的面试问题!
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

栏目导航
热门文章
推荐文章

说点什么

分享

扫码加好友,拉您进群
各岗位、行业、专业交流群