分层抽样|定义,指南和示例

在一个分层抽样,研究人员将人口分成同质亚群地层(复数)层)基于特定的特征(如种族、性别认同、地点等)。被研究人口中的每一个成员都应该恰好属于一个阶层。

然后用另一层对每一层进行采样概率抽样方法,例如整群抽样简单随机抽样,使研究人员能够估计每个亚群体的统计措施。

当一个群体的特征是多样化的,并且他们希望确保每个特征都能在样本中得到恰当的表示时,研究人员就会依赖分层抽样。这有助于普遍性而且有效性学习,以及逃避研究偏见就像总量差额的偏见

分层抽样的程序。

何时采用分层抽样

要使用分层抽样,您需要能够将总体划分为相互排斥和详尽的子组。这意味着人口中的每一个成员都可以被清楚地分为一个子群。

分层抽样是其中的最佳选择概率抽样方法时相信子组会有不同平均值对于你正在研究的变量。它有几个潜在的优势:

  • 确保样本的多样性

分层样本包括来自每个亚组的受试者,以确保它反映了人口的多样性。这在理论上是可能的(尽管不太可能),当使用其他抽样方法,如简单随机抽样

  • 确保相似的方差

如果您希望从每个子组收集的数据具有相似的级别方差,每个子组需要相似的样本量。

使用其他抽样方法,你可能最终会得到一个低样本量的特定子群体,因为它们在整个人群中不太常见。

  • 降低总体方差

尽管您的总体人口可能相当异质,但在某些子组中可能更加同质。

例如,如果你正在研究一项新的教育计划如何影响孩子们的考试成绩,他们的原始成绩和分数的任何变化都很可能与家庭收入高度相关。分数可能会按家庭收入类别分组。

在这种情况下,分层抽样可以更精确地测量您希望研究的变量,每个子组内的方差更低,因此对于整个种群而言也是如此。

  • 允许多种数据收集方法

有时您可能需要使用不同的方法从不同的子组收集数据。

例如,为了降低研究的成本和难度,你可能想通过挨家挨户的方式对城市受试者进行抽样调查,而通过邮件对农村受试者进行抽样调查。

研究的例子
你感兴趣的是拥有博士学位如何影响某所大学毕业生性别身份之间的工资差距。

因为这所大学的毕业生中只有一小部分获得了博士学位,使用简单的随机样本可能会给你一个太小的样本量,无法正确地比较男性、女性之间的差异,以及那些没有博士学位的男性或女性与那些没有博士学位的人之间的差异。

因此,你决定使用分层样本,依赖于该大学提供的近十年所有毕业生的名单。

步骤1:定义总体和子组

和其他方法一样概率抽样,你应该首先清楚地定义你的样本将被采取的总体。

选择分层的特征

您还必须选择用于划分组的特征。这个选择是非常重要的:由于人口中的每个成员只能被放在一个子组中,每个子组中的每个主体的分类应该是清晰和明显的。

按多重特征分层

您可以选择一次按多个不同的特征进行分层,只要您可以清楚地将每个主题精确地匹配到一个子组。在这种情况下,为了得到子组的总数,您将每个特征的层数相乘。

例如,如果你根据种族和性别身份进行分层,前者使用4组,后者使用3组,那么你总共会有4 x 3 = 12组。

例如:根据多个特征进行分层
你们的人口都是这所大学过去十年的毕业生。你将根据性别认同和获得的学位进行分层。

接收关于语言、结构和格式的反馈

专业编辑校对和编辑您的论文,重点:

  • 学术风格
  • 模糊的句子
  • 语法
  • 风格的一致性

请看例子

第二步:将人口分层

接下来,收集人口中每个成员的列表,并将每个成员分配到一个阶层。

您必须确保每个阶层是相互排斥的(它们之间没有重叠),但它们一起包含了整个人口。

例:把人口分成不同阶层
你列出了每个毕业生的名字、性别认同和他们获得的学位。使用这个列表,你可以根据两个特征进行分层:性别认同,分为三个层次(男性、女性和其他),学位,分为三个层次(学士、硕士和博士)。

结合这些特征,总共有9组。每个毕业生必须被分配到一个小组。

特征 地层
性别认同
  • 男性
  • 其他
  1. 男本科毕业生,
  2. 女本科毕业生,
  3. 其他本科毕业生
  4. 男硕士毕业生,
  5. 女硕士毕业生,
  6. 其他硕士毕业生
  7. 男性博士毕业生,
  8. 女博士毕业生,
  9. 其他博士毕业生
学位
  • 学士
  • 硕士
  • 博士学位

第三步:确定每个地层的样本量

首先,你需要决定你的样本是成比例的还是不成比例的。

比例抽样与非比例抽样

成比例的抽样,每个阶层的样本量等于子群体在整个人口中的比例。

在较大人口中代表性较低的子群体(例如,农村人口,在大多数国家中占人口的比例较低)在样本中的代表性也较低。

不成比例的抽样,每个阶层的样本量与他们在整个人口中的代表性不成比例。

如果您希望研究一个代表性特别不足的子组,则可以选择这种方法,否则该子组的样本量将太低,无法让您得出任何统计结论。

样本大小

接下来,你可以决定你的总样本量。这应该足够大,以确保您可以得出关于每个子组的统计结论。

如果你知道你想要的误差范围和置信水平以及估计的大小和标准偏差对于你正在工作的人群,你可以使用样本容量计算器来估计必要的数字。

示例:样本量
因为你需要确保博士毕业生的样本量足够大,所以你决定使用不成比例抽样。

尽管博士生只占学生总数的一小部分,但你的样本中大约有三分之一的本科毕业生、三分之一的硕士毕业生和三分之一的博士毕业生。

第四步:每个地层随机取样

最后,你应该使用另一个概率抽样法,如简单随机或系统抽样,从每个地层中取样。

如果操作得当,这种方法中固有的随机化将允许您获得代表特定子组的样本。

示例:随机抽样
你使用简单的随机抽样从9个组中选择受试者,从每个组中选择大致相等的样本量。

然后,您可以从样本中的每个成员收集关于工资和工作历史的数据来调查您的问题。

分层抽样的常见问题

什么是概率抽样?

概率抽样意味着目标群体的每个成员都有一个已知的机会被包括在样本中。

概率抽样方法包括简单随机抽样系统抽样分层抽样,整群抽样

什么是分层抽样?

分层抽样在美国,研究人员根据受试者的共同特征(如种族、性别、受教育程度)将他们分为亚组,称为阶层。

一旦划分,每个子组将使用另一个随机抽样概率抽样方法。

什么时候应该使用分层抽样?

你应该使用分层抽样当你的样本可以被划分为相互排斥和详尽的子组时,你认为它们将采取不同的平均值对于你正在研究的变量。

使用分层抽样将使您获得更精确的(与较低方差)对你试图测量的任何东西的统计估计。

例如,假设你想调查受教育程度对收入的影响,但你知道这种关系会因种族而异。使用分层抽样,可以确保从每个种族群体中获得足够大的样本,从而得出更精确的结论。

我可以同时按多个特征进行分层吗?

是的,您可以创建一个分层抽样使用多个特征,但必须确保研究中的每个参与者都属于且仅属于一个子组。在本例中,您将每个特征的子组数量相乘,以得到组的总数。

例如,如果按地理位置划分为三个子组(城市、农村或郊区),按婚姻状况划分为五个子组(单身、离异、丧偶、已婚或有伴侣),那么就有3 x 5 = 15个子组。

引用这篇Scribbr文章

如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。

托马斯,L.(2022, 12月05日)。分层抽样|定义,指南和示例。Scribbr。检索于2022年12月29日,来自//www.dandarfirm.com/methodology/stratified-sampling/

这篇文章有用吗?
劳伦·托马斯。

劳伦拥有经济学和政治学学士学位,目前正在攻读经济学硕士学位。她一直在四处奔波,曾在美国和法国的五个城市生活过,她很高兴有一份随她而去的工作。
Baidu