分层抽样|定义,指南和示例
在一个分层抽样,研究人员将人口分成同质亚群地层(复数)层)基于特定的特征(如种族、性别认同、地点等)。被研究人口中的每一个成员都应该恰好属于一个阶层。
然后用另一层对每一层进行采样概率抽样方法,例如整群抽样或简单随机抽样,使研究人员能够估计每个亚群体的统计措施。
当一个群体的特征是多样化的,并且他们希望确保每个特征都能在样本中得到恰当的表示时,研究人员就会依赖分层抽样。这有助于普遍性而且有效性学习,以及逃避研究偏见就像总量差额的偏见.
何时采用分层抽样
要使用分层抽样,您需要能够将总体划分为相互排斥和详尽的子组。这意味着人口中的每一个成员都可以被清楚地分为一个子群。
分层抽样是其中的最佳选择概率抽样方法时相信子组会有不同平均值对于你正在研究的变量。它有几个潜在的优势:
确保样本的多样性
分层样本包括来自每个亚组的受试者,以确保它反映了人口的多样性。这在理论上是可能的(尽管不太可能),当使用其他抽样方法,如简单随机抽样.
确保相似的方差
如果您希望从每个子组收集的数据具有相似的级别方差,每个子组需要相似的样本量。
使用其他抽样方法,你可能最终会得到一个低样本量的特定子群体,因为它们在整个人群中不太常见。
降低总体方差
尽管您的总体人口可能相当异质,但在某些子组中可能更加同质。
例如,如果你正在研究一项新的教育计划如何影响孩子们的考试成绩,他们的原始成绩和分数的任何变化都很可能与家庭收入高度相关。分数可能会按家庭收入类别分组。
在这种情况下,分层抽样可以更精确地测量您希望研究的变量,每个子组内的方差更低,因此对于整个种群而言也是如此。
允许多种数据收集方法
有时您可能需要使用不同的方法从不同的子组收集数据。
例如,为了降低研究的成本和难度,你可能想通过挨家挨户的方式对城市受试者进行抽样调查,而通过邮件对农村受试者进行抽样调查。
步骤1:定义总体和子组
和其他方法一样概率抽样,你应该首先清楚地定义你的样本将被采取的总体。
选择分层的特征
您还必须选择用于划分组的特征。这个选择是非常重要的:由于人口中的每个成员只能被放在一个子组中,每个子组中的每个主体的分类应该是清晰和明显的。
按多重特征分层
您可以选择一次按多个不同的特征进行分层,只要您可以清楚地将每个主题精确地匹配到一个子组。在这种情况下,为了得到子组的总数,您将每个特征的层数相乘。
例如,如果你根据种族和性别身份进行分层,前者使用4组,后者使用3组,那么你总共会有4 x 3 = 12组。
第二步:将人口分层
接下来,收集人口中每个成员的列表,并将每个成员分配到一个阶层。
您必须确保每个阶层是相互排斥的(它们之间没有重叠),但它们一起包含了整个人口。
结合这些特征,总共有9组。每个毕业生必须被分配到一个小组。
特征 | 地层 | 组 |
---|---|---|
性别认同 |
|
|
学位 |
|
第三步:确定每个地层的样本量
首先,你需要决定你的样本是成比例的还是不成比例的。
比例抽样与非比例抽样
在成比例的抽样,每个阶层的样本量等于子群体在整个人口中的比例。
在较大人口中代表性较低的子群体(例如,农村人口,在大多数国家中占人口的比例较低)在样本中的代表性也较低。
在不成比例的抽样,每个阶层的样本量与他们在整个人口中的代表性不成比例。
如果您希望研究一个代表性特别不足的子组,则可以选择这种方法,否则该子组的样本量将太低,无法让您得出任何统计结论。
样本大小
接下来,你可以决定你的总样本量。这应该足够大,以确保您可以得出关于每个子组的统计结论。
如果你知道你想要的误差范围和置信水平以及估计的大小和标准偏差对于你正在工作的人群,你可以使用样本容量计算器来估计必要的数字。
第四步:每个地层随机取样
最后,你应该使用另一个概率抽样法,如简单随机或系统抽样,从每个地层中取样。
如果操作得当,这种方法中固有的随机化将允许您获得代表特定子组的样本。
分层抽样的常见问题
- 我可以同时按多个特征进行分层吗?
-
是的,您可以创建一个分层抽样使用多个特征,但必须确保研究中的每个参与者都属于且仅属于一个子组。在本例中,您将每个特征的子组数量相乘,以得到组的总数。
例如,如果按地理位置划分为三个子组(城市、农村或郊区),按婚姻状况划分为五个子组(单身、离异、丧偶、已婚或有伴侣),那么就有3 x 5 = 15个子组。
引用这篇Scribbr文章
如果你想引用这个来源,你可以复制和粘贴引用或点击“引用这篇Scribbr文章”按钮,自动添加到我们的免费引用生成器引用。